设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
12
返回列表 发新帖
楼主: 雷达
打印 上一主题 下一主题

[信息技术] C++ 提速的新发现

[复制链接]

该用户从未签到

21#
发表于 2022-9-27 20:39:22 | 只看该作者
雷达 发表于 2022-9-26 01:30! j" V- j* T" ^# z) B4 u( `
理了理思路,重新做了一个测试。
% P: _& W+ a0 O4 t做了两个 vector 和 两个 float *, 都长 100000
# B) \" y  \( z' I/ W! [& j外循环 6000,里面先做随 ...
  ?& K2 n# Y8 _* Z. E' @2 j( S- k, S+ P
这个时间是从哪里开始算的?$ A$ p- P  c+ C- ^6 y0 D/ \; K" v. B4 H
我怀疑这个200多秒里面有200秒花在产生随机数上了,真正计算大概只用了2秒, 用了vector那个因为有vector的额外开销,多了几十秒。2 @5 P5 W3 a0 ]$ y
按照两个10万个数字的相关计算的规模来估计的话,两秒都算很长很长了。这个结果真的很奇怪。
回复 支持 反对

使用道具 举报

  • TA的每日心情
    擦汗
    2024-12-25 23:22
  • 签到天数: 1182 天

    [LV.10]大乘

    22#
     楼主| 发表于 2022-9-27 22:41:56 | 只看该作者
    雷声 发表于 2022-9-27 20:394 F. V9 w$ T% ]6 v  j7 c. b
    这个时间是从哪里开始算的?
    1 r/ q9 {/ J& I- h3 C" }我怀疑这个200多秒里面有200秒花在产生随机数上了,真正计算大概只用了2秒, ...

    , p& }9 Q  r& Y' W: P# Q我不管它了,回头 linux 下换g++重新编译,顺便加上你们建议的向量化。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    昨天 13:05
  • 签到天数: 1642 天

    [LV.Master]无

    23#
    发表于 2022-9-28 00:12:35 | 只看该作者
    你这个循环主要的计算时间是那个rand,这个循环本身占用时间微乎其微。
    ; _! |; C1 Q$ \' s8 ?% F% `* E% v/ q你的空循环,如果是现在的代码,编译器很可能完全不生成对应代码,因为没有任何输出或者修改变量,所以可以看到时间都是202S。你可以认为啥都不干的时间就是那么多。
    0 P1 D# _2 e( X9 {0 M0 K% Z与此对应用数组(指针)花了2S
    - h8 \0 _, k' n6 i6 W你用vec1[jj]*vec2[jj]理论上不应该差30多秒,这里很可能是你对vector的操作带来了内存操作,你可以试试把初始化挪出循环然后再比较,理论上vector的随机访问和数组应该几乎没什么区别。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    24#
    发表于 2022-9-28 00:29:10 | 只看该作者
    雷达 发表于 2022-9-24 23:54
    , \+ x7 X" F  X" V/ b# ovoid xcorr(comp* outcomp, comp* A, int lenA, comp* B, int lenB)# c3 S$ a  b; u% E( y: B2 k
    {. R3 x% b" u! a' t: d3 W/ x
            comp temp, xtimesy;

    2 u: z1 T  c# l1 h8 t; Q我有些迷糊,这样的code,难道不就应该时间差很多吗?也做了个简单的实验,你看看我做的有错吗; n; i( S0 H! _5 ~. Y
    8 C4 A3 L  \* t) {3 \7 c/ e7 q( L6 R9 t
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-12-25 23:22
  • 签到天数: 1182 天

    [LV.10]大乘

    25#
     楼主| 发表于 2022-9-28 00:49:59 | 只看该作者
    opensrc 发表于 2022-9-28 00:291 b+ |4 d3 _3 C5 T' g8 o; x& d
    我有些迷糊,这样的code,难道不就应该时间差很多吗?也做了个简单的实验,你看看我做的有错吗0 `# t1 K( ^* V
    ! `6 o- V0 }- U2 O
    ...
    9 \% T9 U2 {2 G6 E- X
    你是对的,是我搞错了。确实没有优化的情况下,空循环如果次数够长本来就应该耗时较大。我搞错的原因是在不自觉得与 octave 比较,而实际上 octave 是优化过的,和是不是空循环没关系,这种不同条件的比较是没意义的。
    ( p+ C8 V& M# i5 n3 k. Z6 `) a, Q8 I
    ; Z, o* V" s+ P- ]/ m4 r* d9 ^雷声网友说的也对,空循环应该被编译器优化掉,我的编译器设置有问题。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-12-25 23:22
  • 签到天数: 1182 天

    [LV.10]大乘

    26#
     楼主| 发表于 2022-9-28 00:56:28 | 只看该作者
    本帖最后由 雷达 于 2022-9-28 01:09 编辑 9 z  Z+ J7 l9 |4 o. b6 ^1 W5 l0 H
    1 r/ Q5 K* e, x. C( R4 y. _
    是我自己的理解有误,没有优化的情况下,空循环如果次数够长本来就应该耗时较大。- T1 f8 W9 t: s  V
    有空时我会试试 SIMD和并行,看看能提高多少。
    + Q( ]2 o3 N# s( x: d' h过去7、8 年没有正经用C++ 写过东西,没有 sense 了 # _7 G$ ^6 v  e6 ?
    谢谢大家的讨论,I learded a lot.  红包已发  
    , K5 B% }& f7 d7 ^. s
    " H/ \4 T' F+ j6 H2 e1 N( n( o+ i0 Y) q- s+ u

    + }0 w4 M. O4 n6 }9 X: a/ E) w3 ]& V
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-7-19 09:06 , Processed in 0.035771 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表