设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2164|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 , C, O6 O; z( _, e+ t

    ! ?  ^0 p0 f. D! N为预防老年痴呆,时不时学点新东东玩一玩。
    . I4 O) T  O+ r' @) c. p' VPytorch 下面的代码做最简单的一元线性回归:
    3 l" R4 K$ B2 D7 V0 v% k, `----------------------------------------------
    1 X' B7 ^8 P6 _: R3 X# N: Z' simport torch. r/ m3 c8 a" v7 B. O# t$ l& O; X
    import numpy as np( O  W. m, l7 i1 `5 @* d
    import matplotlib.pyplot as plt- f7 e5 R. M9 E! X0 Z% n( [
    import random0 a* l- z) ?  r4 U& u' I6 w, X
    ! k: ?+ i  ^; v1 P
    x = torch.tensor(np.arange(1,100,1))
    4 P. `1 z& ^, E6 K" [, E' sy = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=15( r* S: M4 x% B5 D

    # T# _5 J6 A) z6 V6 ]w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    ) ?  b9 m. R8 f5 Ob = torch.tensor(0.,requires_grad=True)
    3 A' I# L! o9 \  m+ f; ^! A" e  ]" @) ?2 i8 ~
    epochs = 100
    % a/ P2 x; d9 u4 D% B. B, I( _6 z7 l* O/ A5 G7 ~. z0 T
    losses = []
    , r8 {) ~7 R; |# N3 {for i in range(epochs):$ X  H  u  y% l, o
      y_pred = (x*w+b)    # 预测; B' P% W/ l+ z
      y_pred.reshape(-1)( v9 M( G" }2 h. ], m' Q( O

    . G, v3 j0 t9 ]- u  loss = torch.square(y_pred - y).mean()   #计算 loss) m+ O& H- ]9 f
      losses.append(loss)" c: X: S* v( l: [0 e  e2 X' b0 l
      5 @) q( b) H$ F" z1 r4 @. Q
      loss.backward() # autograd
    9 ^% R3 ?4 [2 E2 g& U  with torch.no_grad():
    2 R5 h4 V5 r, ^4 q2 b' [5 K( Y    w  -= w.grad*0.0001   # 回归 w2 X7 w4 [3 e7 J3 _! q! c8 R$ e
        b  -= b.grad*0.0001    # 回归 b
      x9 [; h2 C" g: o  w.grad.zero_()  
    6 ^7 M: h4 x3 M7 Z+ Y& n  b.grad.zero_()
    9 z7 D1 T, d6 Z$ s3 q: D; M; [: z  ~4 ?8 [- Q6 @) R
    print(w.item(),b.item()) #结果6 W* Q5 u7 b6 u, u5 a! ~0 v, i( u
    ! r+ E7 f) S3 \" k/ j
    Output: 27.26387596130371  0.4974517822265625
    , Q7 p! {$ U2 P1 F, N----------------------------------------------9 c) G# C  U! v3 N
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。6 \1 [9 X9 B$ A; t3 Y) `5 I
    高手们帮看看是神马原因?  R& g" P% `( M  ^; z

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑
    ! y5 v0 \& |& S0 u+ [* e
    " ?7 _0 S! h% _' _没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?% R3 b) x, A) {% n; Q; X0 W: w
    -------
    5 S! j0 S7 ~/ X; w) Q: v7 x/ I# K不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。+ Y- A, h, _0 i
    -------
    ; y. I" I6 M5 D0 q9 M& d算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23
    # ]1 i1 y" C) ?没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    4 x, h  M) N$ `) |* z2 W-------1 U8 W9 H7 J9 R
    不好意思, ...

    3 s( ^. ]& v5 v谢谢,算法应该没问题,就是最简单的线性回归。+ `' \) y, x/ [6 e! [
    我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 * [4 }& l' F# T) b3 A0 S" Z* p
    雷达 发表于 2023-2-14 21:52
      C, d. [( I( ^9 [+ e, D谢谢,算法应该没问题,就是最简单的线性回归。$ \/ x4 z, @9 e" g3 E9 f/ n9 L9 J8 c
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...

    ) W" R1 _0 Z2 r# I, ]4 ]9 j9 V! \: _2 F* d! a, r) F$ _, k! |. @
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    % P0 r" G; M4 z# _% q3 [) n
    9 R+ Y! v0 @# h) n" n或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑 5 m( ]- x/ N' }. z" f! U
    老福 发表于 2023-2-14 22:00( N) o2 S7 K5 n. S$ z, K
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    . |0 k* ]! ]) `! Y& }
    # d. {9 \& U) J或者把b但的起点改为1试试。 ...

    . `5 T5 }0 s& M- F* p7 q# y, s5 V- }
    你是对的。  E2 D$ T4 U- F$ D  r3 x4 Q
    去掉了随机部分
    8 X2 W4 U$ T- _) _" T#y = (x*27+15+random.randint(-2,3)).reshape(-1)
    4 `; [4 J! |- ^y = (x*27+15).reshape(-1)8 p" B- `6 i( U" {: l4 J) ?
    7 F2 \9 w. F" G' Y
    循环次数加成10倍,就看到 b 收敛了" M" ^) x% S$ @6 W: H
    w , b. g6 c! i. J9 K1 m% U! M
    27.002620697021484 14.826167106628418
    2 Z1 g! C! |+ B! H+ S( K1 n( |! j6 h4 U0 R
    和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-12-1 11:14 , Processed in 0.032469 second(s), 22 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表