44 并行执行时间-I |
|
- 考虑函数Grav用Runge Kutta方法改进的算法的时间
- 移位粒子和一个粒子信息集通信-所有的处理器同时通信给出估计:
- 9 * tcomm (因子应是7,与我们在早期简单实现中使用的一样,只需要1不是3的大量数据(factor
should be 7 as need only 1 not 3 masses as we used in simple implementation
earlier)
- 我们忽略延迟,这意味着在实践中,最好的实现同时转换多个(就象在无经验的数据并行算法中,不是N-1)粒子
- 浮点计算: roughly 3(x,y,z) of -, *, sum, sqrt, exp, /, *, +, *,
+估计为: > 30 tfloat
- 每个通信的粒子和处理器本地部分的N/Nproc个粒子交互作用,并且每步有一次移位,总时间为(N-1)/2
Copyright: NPACT |
|