设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2933|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 % n$ c7 k3 V+ K9 ^* M$ a8 o/ o

    3 j/ n+ h7 @* v9 x$ m* \4 H为预防老年痴呆,时不时学点新东东玩一玩。
    0 ^  I2 ]/ C' N3 rPytorch 下面的代码做最简单的一元线性回归:$ h8 O0 B$ [; |& e
    ----------------------------------------------8 s! s% [  v4 a6 v& j# e! }  a
    import torch
    ! n! r8 L" t, k6 J; yimport numpy as np* X7 C$ \/ M5 A+ ]$ Z' a( u! `
    import matplotlib.pyplot as plt! x) D7 U" b7 t8 q2 R. @" u
    import random" i. b" O" w! y, l! R

    % A) n9 l# y8 Wx = torch.tensor(np.arange(1,100,1))
    ( d/ t7 p4 d  {' P) by = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=15
    $ R7 h3 m/ x9 \
    ; Y& ?7 ^" E, ^* [: ]( aw = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    1 `+ O; ^) [2 M8 Zb = torch.tensor(0.,requires_grad=True)
    ' B# L7 `6 D$ X7 P: |: C! g
    6 [4 E3 [& r3 y" r8 Gepochs = 100
    " u- V( @5 e0 |8 G3 d: @8 X
    ( P* ^6 ^0 R8 d/ Z3 j2 |' @0 v$ A, nlosses = []
    7 h! o: z  Q$ j% V4 p9 x% }for i in range(epochs):% Y. a9 ]; {2 W; Q/ Z
      y_pred = (x*w+b)    # 预测
    3 L0 Y5 G8 h% w! a6 P2 ]5 i$ J" o  y_pred.reshape(-1); ]' N& H5 D! z3 v5 `8 y9 {( F

    ; n0 [* u, B5 n, F8 Q  loss = torch.square(y_pred - y).mean()   #计算 loss
    ( j, t+ F. Y/ I% C: ]8 w( f% J9 M  losses.append(loss)
    8 f& O* ]" N+ s9 h  
    3 I; s; D+ D5 j9 \  i' D  loss.backward() # autograd
    1 t1 n9 H- h! y3 {' Z  with torch.no_grad():& Z9 l) `/ Z4 T5 f5 L
        w  -= w.grad*0.0001   # 回归 w
    - d6 Q. |. @6 R    b  -= b.grad*0.0001    # 回归 b
    . {8 z3 G6 i- ^" P! U. C  w.grad.zero_()  
    8 D, ^% L! m& R- H0 p  b.grad.zero_(): K0 M& L' B3 Y$ E! C' E( J

    ' X0 o8 ?9 L! H5 eprint(w.item(),b.item()) #结果
    6 L* d- [! V9 E+ u5 d0 k) W- o/ E
    . j2 ]6 q. e- T& C  O/ I2 ^Output: 27.26387596130371  0.4974517822265625
    - o* O  }: ~1 x1 a0 m----------------------------------------------9 |- R* X! g* h+ P' k) O
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。
    " x) x$ J! h* p# J: e0 Q4 ]# m高手们帮看看是神马原因?2 W5 c7 y8 J% ?/ b- z

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑
    6 L6 A" g, |9 F, T, n* z, g; X, s3 ?! w$ z5 D
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?/ V/ @% R; a$ C
    -------
    ( Q6 m+ P& I3 [6 B不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。- J. c; m% z' P, d5 j/ Y
    -------
      }# V7 T8 t4 p" ]; N算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23
    ; j' K/ f% q1 n5 I没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
      U5 g. V- N9 `-------
    3 P8 a* m2 w2 H0 r4 c0 j+ \不好意思, ...
    % @& @& u/ D& D! K7 U* `. C# |
    谢谢,算法应该没问题,就是最简单的线性回归。& \& h9 [2 Z- z# p
    我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 , j& D& T0 h# W! f/ I, ?5 u7 d
    雷达 发表于 2023-2-14 21:52
    : u: j" U( v$ B9 y4 i谢谢,算法应该没问题,就是最简单的线性回归。
    , B, ^. }6 n; {4 G4 `5 y我特意没有用现成的工具,就是想从最基本的地方深入理解 ...
    ) T' n. e( c2 s  d6 B' Z
    % Y& \. N& s  N; N/ P, L! ^
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    / R: u- m! k* V. |8 A* K3 d4 J( g; {( ]: e' P: Y$ I  p) o3 ?* m3 D
    或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑 1 k# O4 m3 ]) ?* {
    老福 发表于 2023-2-14 22:00+ y/ [: h' C3 Z3 |0 u( x. z5 a
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    ' Z! E8 o: ?+ w  i; [: s
    / ]  }% N3 B# |- X, S; \3 `% b或者把b但的起点改为1试试。 ...

    . ?; E: g$ V% M! W- [( V( t: z1 o" k* w2 Z# j% u
    你是对的。/ q/ D' j5 c- [5 _; ]5 \: K& H; b
    去掉了随机部分9 }4 Z# D( X5 c0 y7 }$ d! Q; e
    #y = (x*27+15+random.randint(-2,3)).reshape(-1). R/ o# F7 @( \5 u* K* B
    y = (x*27+15).reshape(-1)
    / u3 m+ V! V0 H1 u
    ( K$ y* |' k) Z  L& @! ]0 A2 M循环次数加成10倍,就看到 b 收敛了/ q) z5 L: X: J/ A, |; H( J
    w , b
    4 g3 {0 h5 x( P0 c# |0 z8 x27.002620697021484 14.826167106628418
    2 _8 c. \9 {4 F& m( L2 Y- y: C% U
    和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-5-22 08:24 , Processed in 0.067133 second(s), 22 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表