数值分析 发表于 2022-9-24 23:04- R. V* A# P$ u; d
拉下来?拉多少?$ n+ Q- F2 a+ _
把代码贴上来看看?
风雨无阻 发表于 2022-9-24 23:33' Z v6 r- [7 E) ~# E, N, G
Maybe Debug mode?
雷达 发表于 2022-9-24 23:541 f% G% Z7 V. G. l+ j# P$ p
void xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)
{( S9 X2 P- L, a5 [
comp temp, xtimesy;
数值分析 发表于 2022-9-25 00:20
这个不是这么比的吧。。。
您这个函数,不带内循环的话,汇编完总共操作也没几个(不到100个)。
雷达 发表于 2022-9-25 00:46
有道理。
所以存在内循环速度就上不去,把内循环取消,改成两个向量直接点乘再求和应该就会好得多,这大 ...
数值分析 发表于 2022-9-25 00:200 }! \: E- ^( X/ ]& @0 \7 u
这个不是这么比的吧。。。
您这个函数,不带内循环的话,汇编完总共操作也没几个(不到100个)。
而加上内循环,光jmp和dec指令就至少多执行了6000个
沉宝 发表于 2022-9-25 01:48
现在的CPU,可以把判断、jmp和dec指令全部融合进一个µOp(微操作,CPU内部流水线上的执行单位)。如果 ...
沉宝 发表于 2022-9-25 01:27
你两个试验之间就差了一个空循环, call 1000次按理不会有秒级差异,可能还是编译器优化的问题。举个例子 ...
雷达 发表于 2022-9-25 04:47
又写了个小实验,没有调用子函数,双层循环,外层6千次,内循环30万次空转,有或没有空转内循环,时间差 ...
雷达 发表于 2022-9-25 04:471 e T* `# }1 K; h5 C$ O8 M
又写了个小实验,没有调用子函数,双层循环,外层6千次,内循环30万次空转,有或没有空转内循环,时间差 ...
数值分析 发表于 2022-9-25 14:58
能不能把这个也贴上来,看看和上一个有什么不同?
std::vector < float > vec1(N);% U4 P, U+ ?3 i$ W2 [/ B
std::vector < float > vec2(N);
float* b1 = new float[N];' {5 g, Z, e$ J( e# a
float* b2 = new float[N];4 |4 ?* G1 v1 J
/ C8 X# w, l/ P \- z; e
for (int j = 0; j < 6000; j++)4 M& N5 P% i$ r( y) b/ v) [0 U
{9 U$ H, }8 x; t0 C, K& E4 A
std::generate(vec1.begin(), vec1.end(), []() {0 y3 X5 k" Z M) H
return static_cast <float> (rand()) / (static_cast <float> (RAND_MAX / 23.23));;- G; B7 J& Q9 R, W7 M
});9 c1 y( @ v7 j# G
7 O8 E, `8 a8 u9 z/ h2 E
std::generate(vec2.begin(), vec2.end(), []() {
return static_cast <float> (rand()) / (static_cast <float> (RAND_MAX / 24.31));;9 s. x1 E" b F0 q" b& L& A
});9 g! [2 D6 F. {4 Y4 o/ h
$ L9 h1 B* R, t7 ^2 G
for (size_t jj = 0; jj < vec1.size(); jj++)
{( S: ~) O! b6 s8 V1 V
b1[jj] = vec1[jj];
}
8 @" @+ f {% k2 _- j
for (size_t jj = 0; jj < vec2.size(); jj++)
{7 R( w# u; p1 x0 \; D
b2[jj] = vec2[jj];/ }$ n+ V* [8 e! i) @
}7 p1 q. h9 D$ o! Y8 A6 y5 {
( o: G' k M, l+ |7 z: a
//Method - 1 N=100000 247s ! ]- M: G' T2 K7 g) F0 Z
//fresult = inner_product(vec1.begin(), vec1.end(), vec2.begin(), 0);
//Method - 2 N=100000 237s
/*
for (int jj = 0; jj < N ; jj++)
{( V% L0 h. x4 x/ @1 } K
fresult += vec1[jj] * vec2[jj];
}4 ^1 G$ U* q) K, b4 e( z' E
*/; _- R; ] j: g7 N# M9 v8 E5 t
//Method - 3 N=100000 204s
/*
for (int jj = 0; jj < N; jj++)- u" u8 ~; z1 N* ^# P( e
{; B/ Y4 l4 }! X, ]0 ^
fresult += b1[jj] * b2[jj];
}
*/
, Q0 _' ?! o! U' D1 U+ Y) t1 O
//Method - 4 202s- C2 W3 F4 q7 |: O! x0 {: z% K; |
/*! a) G' ~( |8 R2 t2 B2 U6 ~5 f
for (int jj = 0; jj < N; jj++)
{ v' @. \+ m6 ]/ L
7 S1 q8 F! ~# Z
}6 c" `4 g0 D' `5 f
*/
//comment out all methods, N=100000 202s
}+ O6 e2 g7 X' n6 h& e& {8 Y
delete []b1;$ V" k7 b; l: o7 V P0 `
delete []b2;
机器猫 发表于 2022-9-27 00:15
瞎猜一下啊。把第一个的那个j定义成register变量会不会有不同?* c( @& s: g& Y/ s" U
: C: ?- D8 i, V" j7 q. N
你第二个试验里面的j在循环里面又重新定义 ...
雷达 发表于 2022-9-27 01:16/ \8 }, m# c' D4 l( [
内循环里面的 j 实际是 i, 为了规避爱坛显示的冲突帖子里临时改成了j, 现在是 jj 了。好累 、LOL' u; P1 q& X* A* y% {! H
不和它 ...
; K" M7 V7 ?( ~9 i, R雷达 发表于 2022-9-24 23:54
void xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)9 v7 C$ G. o- g+ D
{5 H7 v( C ]2 h2 `6 ]
comp temp, xtimesy;
雷达 发表于 2022-9-26 01:30
理了理思路,重新做了一个测试。
做了两个 vector 和 两个 float *, 都长 100000) {0 n* }) l* z' D6 x, D
外循环 6000,里面先做随 ...
雷声 发表于 2022-9-27 20:393 @4 ]! u" Z. C, A- j8 A
这个时间是从哪里开始算的?/ S4 V; K' F9 `9 B0 v* T+ @$ k
我怀疑这个200多秒里面有200秒花在产生随机数上了,真正计算大概只用了2秒, ...
雷达 发表于 2022-9-24 23:54
void xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)
{" U) c5 i/ m) d4 {: R0 W0 c
comp temp, xtimesy;
opensrc 发表于 2022-9-28 00:29
我有些迷糊,这样的code,难道不就应该时间差很多吗?也做了个简单的实验,你看看我做的有错吗5 U1 a2 } Y2 H9 q7 }2 \
...
。& c/ q4 n/ B$ j( H6 @! s4 N

6 q8 A& x6 u0 n9 B% T( l" H| 欢迎光临 爱吱声 (http://129.226.69.186/bbs/) | Powered by Discuz! X3.2 |