设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 3040|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 . R2 h& U1 l1 P- ^) U0 c& G/ d
    1 i: {, j' y2 t3 ~
    为预防老年痴呆,时不时学点新东东玩一玩。% R0 a' b. O1 q7 v6 n% Y/ B, e
    Pytorch 下面的代码做最简单的一元线性回归:3 b  z/ ?! T8 t( K+ P/ c9 p
    ----------------------------------------------
      D! ]: u4 G( @& M  h. zimport torch# `0 N* y4 C+ g  T- q
    import numpy as np
    . P) B! ]3 C* D7 }import matplotlib.pyplot as plt4 ^3 [, ^7 U% f1 }
    import random
    . h' `# {6 \) G9 s7 X& ]1 E" F" N: M+ R9 P! U/ u
    x = torch.tensor(np.arange(1,100,1))2 f: y2 L& G2 n/ e4 g% V' t7 o
    y = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=15% |2 ?0 \/ n2 P/ s' L: _* q
    1 w" Q+ ^1 i5 w0 r/ j5 v/ i
    w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    # x4 H4 |; h* x2 {' ~6 lb = torch.tensor(0.,requires_grad=True)
    * r8 E: z1 n4 @3 }( Z  U+ l' m+ M: h" s: Q, w. u2 \0 U
    epochs = 100
    . C7 `9 V1 x, f) e. l' y/ A! Z, ]+ j: H7 T7 @- e; l
    losses = []
    1 A% j8 b1 M/ M  s( u7 x7 \for i in range(epochs):+ b# H6 Q# ~7 X5 I$ ]& C2 M
      y_pred = (x*w+b)    # 预测' g  |( D8 o5 T1 n
      y_pred.reshape(-1)2 ^6 s9 P" n8 k5 C5 `" j
    $ O' L9 f5 j7 Z' O7 s8 _" \% _
      loss = torch.square(y_pred - y).mean()   #计算 loss
    ' X( E7 r% F+ }  losses.append(loss)0 D% \# F3 O- `1 L/ \: p/ s9 q
      
    , w. K& d. M1 ^( e  loss.backward() # autograd
      I: o0 J( P/ U; O; R  with torch.no_grad():
    2 a- \8 M% x/ L! {    w  -= w.grad*0.0001   # 回归 w
    # ~& w: O% D1 \$ S. m/ @    b  -= b.grad*0.0001    # 回归 b
    & s2 S3 C8 B! v  q8 r. M$ X0 C  w.grad.zero_()  
    0 p8 x5 O3 b' o- N! f- _. \5 D  b.grad.zero_()! R; i+ b5 a3 E; W
    4 \1 {( L4 Z$ y# q3 A' k
    print(w.item(),b.item()) #结果( T3 ^6 H& m! {4 r
    " G; T* t1 z9 v0 X/ `6 o
    Output: 27.26387596130371  0.4974517822265625
    ) y; s" Z1 F! H; B$ p1 B2 g9 N----------------------------------------------1 ?* ?* c' U% Y0 R
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。, R- @6 o" j3 t! }$ b+ ^
    高手们帮看看是神马原因?* @2 r& w* O. B7 t/ X5 |8 i

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑 - C7 L4 h6 D, \7 \4 `# B

    + d; p5 h7 X' c) Q! y7 b: r没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?: L5 W; P, x; R# E3 S
    -------
    1 L! M$ [& |' Y* t9 U不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。
    4 K' t3 s; f& a& v/ V! m-------
    6 i) R( m! H7 J: P算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23
    $ y$ l# `! Q; q( A4 M没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?0 v( ]/ b! e0 _2 f* U8 s! a
    -------. L3 i2 L( [& G7 a7 ]
    不好意思, ...
    7 Q$ h# L/ [/ M! H" W
    谢谢,算法应该没问题,就是最简单的线性回归。
    5 y9 ]* M! o- V5 y. [4 F. s我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑
    ' z# x# J8 [- d5 o& G0 }* s
    雷达 发表于 2023-2-14 21:52# j( M; H9 }9 q. `6 k. ^4 y0 G
    谢谢,算法应该没问题,就是最简单的线性回归。
    ( X8 c$ S0 x& ]0 Y' |我特意没有用现成的工具,就是想从最基本的地方深入理解 ...
      X3 g9 E) @, Z

    7 z5 D5 [2 ^+ x4 o$ O刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    , M' I0 `' P# \' M& F
    7 k; m6 W4 `  o0 P' L* n  J或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑 2 s4 s. \7 |: U: e7 w  s  R  B
    老福 发表于 2023-2-14 22:006 H; I+ A# f- p9 B) H' x5 u
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    9 v, g. T2 W) y; B$ b5 r: e3 G5 ^+ l  S' O5 [# v8 m
    或者把b但的起点改为1试试。 ...
    : J8 y  e+ f- S/ a( g+ _: X

    1 R2 Y. p0 X, u. C5 ?* x8 ^3 f你是对的。' p, ]. X) m7 W, p
    去掉了随机部分
    / _0 g, p2 N! D. b#y = (x*27+15+random.randint(-2,3)).reshape(-1)
    - l) m. d  I, l+ V* J; W: E5 ?y = (x*27+15).reshape(-1)
    / u; r/ ~2 K6 k9 c( E9 A2 J3 T( p7 ]
    0 O6 A" H* e- G: w循环次数加成10倍,就看到 b 收敛了. H& x2 u/ D5 b9 e  o
    w , b- y- a, P+ ^* {- `+ r
    27.002620697021484 14.826167106628418, ^; v. u) F7 G0 z, q- V" M

    1 F. B0 S$ V7 W$ J2 p' J和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-6-5 05:35 , Processed in 0.064565 second(s), 22 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表