114.高斯消去: 数据映射
|
|
- 主元选择需要一个一维简约(reduction)
- 分配行 => 并行, 要通讯
- 分配列 => 串性, 但是不需通讯
- 元素更新需要旧值和来自主元行和列的元素
- 分配行 => 并行, 但要广播主元行
- 分配列 => 并行, 但要广播主元列
- 每个阶段工作在一个更小的连续数组区间
- BLOCK => 有的处理器退出计算
- CYCLIC => 直到结束, 处理器保持相对平均的分配
- CYCLIC(K) => 间隔至少 K 个元素
- 最后一行
- (*,CYCLIC) 如果广播 > 寻找一个主元列
- (CYCLIC,*) 如果广播 < 一列, 同步通讯
- (CYCLIC, CYCLIC) 如果广播 < 一列, 叠加通讯
Copyright: NPACT |
|