胶片32:库与工具问题
在解决延迟容忍(latency tolerance)方面需要线索和并行编译器的支持
需要延迟容忍的BLAS(Latency Tolerant BLAS)及更高层次的支持
FFT、线性代数、自适应网格、集合数据移动等
性能可以用硬件来监控(没有软件开销)
需要将"层次化小语言"合并进来
类似于Pablo的软件收集和可视化
复杂存储层次中的资源管理
Copyright: NPACT