沉宝 发表于 2022-10-3 01:16:57

雷达 发表于 2022-10-2 03:04
多谢关注。
规模还比较大,一个至少3万*3万的二维浮点复数矩阵,用一个4000点复数矢量对矩阵的每一个3万 ...

你在 Octave 跑出来的速度是多少?没有具体数据的话能不能说一下数量级上大致在哪里?

另外,你在 Octave 上的测试是按实际数据量跑的吗?我大概估计了一下,如果我没有算错,你那个二维浮点复数矩阵的数据量大约240TB(1 billion elements, each element has 30000x8 bytes)。这么大的数据量不可能全都放进内存中准备好,(事实上,它们已经不是一块硬盘可以装得下的了,放在磁盘阵列上吗?)有可能计算机的I/O吞吐性能也成为影响真正计算速度的一个重要因素。

雷达 发表于 2022-10-3 09:13:33

本帖最后由 雷达 于 2022-10-3 09:16 编辑

沉宝 发表于 2022-10-3 01:16
你在 Octave 跑出来的速度是多少?没有具体数据的话能不能说一下数量级上大致在哪里?

另外,你在 Octav ...

应该没有那么大。
我算的:
3万*3万的二维浮点复数矩阵, 30k*30k = 900M个点, 复数 *2, 浮点数 *4,总共 7.2G。
做算法的时候,一行一行从文件读取,有个16G内存应该足够了
页: 1 [2]
查看完整版本: C++ 比 Octave 慢好多,怎么破?