设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2320|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 - F: ^% Q' ~  j2 K5 f* {
    1 g+ B; l; o1 u
    为预防老年痴呆,时不时学点新东东玩一玩。
    7 ]5 e- S4 Q. z# F4 fPytorch 下面的代码做最简单的一元线性回归:: O2 W/ g: ^  R" X4 x+ m
    ----------------------------------------------
    " `6 X/ y7 ^3 r5 M8 ]" jimport torch
    ( m; ~- c' ]) T, H' a& Simport numpy as np4 G& v8 H! B+ P& d2 h- @  N: H
    import matplotlib.pyplot as plt' ?8 F8 r/ w4 V2 q9 O) `9 w; V
    import random
    , E3 M& P/ N4 y) F6 q, Y
    ! W8 x/ U' |1 u. N# jx = torch.tensor(np.arange(1,100,1))5 N. a1 b6 U- q; I+ L  n  q
    y = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=15
    + E  n$ P0 ~( x  S  q& M# \
    : `6 |6 [  k8 Y: H! ew = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    6 C! \$ e/ H7 `/ Ib = torch.tensor(0.,requires_grad=True)
    0 c" e( G5 J6 i/ C. l4 _3 H) w+ d# Q4 P; j) T
    epochs = 1002 y6 M  x$ N. s0 ?& j
    # q' `/ m( C$ W0 a& p, L
    losses = []1 _3 B! C6 f$ A8 [! s0 ^( \
    for i in range(epochs):
    : S' X) R: a6 x. P/ M) I  y_pred = (x*w+b)    # 预测
    , @! f% k& h% m, c4 O1 K  @  y_pred.reshape(-1)
    1 ~3 z; H5 t6 |. H
    / {2 K% C) ^0 `3 g' B- H% r5 V9 K( q6 o  loss = torch.square(y_pred - y).mean()   #计算 loss
    $ ?) T3 Q5 E$ W$ h, ^: B  B  losses.append(loss): V8 l" }. K: f+ M8 K& T
      2 A  ^8 b' n. o2 R7 O7 D3 |
      loss.backward() # autograd
    ' }+ Y0 z: N' D3 W+ |  with torch.no_grad():
    - {1 f; ~3 l( k, a, w5 A4 N7 b& ~    w  -= w.grad*0.0001   # 回归 w) i/ D6 g, d' f9 F
        b  -= b.grad*0.0001    # 回归 b
    % C9 s! I9 S* H( s' A  w.grad.zero_()  
    % b% d. v' }; S9 j  b.grad.zero_()
    & H- [4 [5 N1 e( r; X
    # C7 z6 f4 p. \print(w.item(),b.item()) #结果
    $ H3 h7 R; s7 P% F5 x/ V6 k  ?: D
    . W; J. t$ b7 o6 @Output: 27.26387596130371  0.4974517822265625$ m, L2 \8 f9 h$ e. N7 `
    ----------------------------------------------
    ; e$ s2 R/ q9 A$ R最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。6 t: k$ S2 Y$ V6 h
    高手们帮看看是神马原因?
    + q6 c1 V$ g1 Q) C8 a

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑
    ( H8 J8 }% t' j1 i3 @1 s
    0 d6 K& j0 \: d& b6 T没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?3 R% |% C: w4 ^. S5 X' S
    -------
    3 P9 x1 v! b$ A) j不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。
      m& X: g- S. S3 b-------1 s$ [/ D6 _5 ^
    算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23: }/ V! f7 l6 i7 h: X: b0 P
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    % _/ O8 Y  [0 Y$ a& H4 k-------
    0 ]* K  E/ {: n" W7 L不好意思, ...
    & {0 l8 b5 `4 p" E
    谢谢,算法应该没问题,就是最简单的线性回归。2 B/ B0 Q, ^# {( I' N: E  `
    我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 9 |  {6 l  T- \- m2 V1 W# ]7 Q
    雷达 发表于 2023-2-14 21:523 c3 r9 z3 E( ?% X1 }6 }
    谢谢,算法应该没问题,就是最简单的线性回归。/ L  O7 }# M3 m  ?  u) W
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...
    1 @- h- B' |5 K0 ^" \

    - H- h& ~# M* r% L刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    : D. ]% ?( O5 }3 f1 t: X9 L% f5 b+ m# i2 U: Q' o: c. [: }+ G. `
    或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑 * |; i9 U9 {, K3 i# I/ V3 d# F
    老福 发表于 2023-2-14 22:00
    2 A; Q; O$ S5 b+ i3 v' ?" K刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。+ x' b$ s2 [+ R; w

    # i: T- I- F. @' z/ ]& K' f" f或者把b但的起点改为1试试。 ...

    ! [, D( x4 P( B+ b& `/ i5 J
    - z- H( U' C' U; D你是对的。) h; Z; u+ ~" m  B9 ~+ \+ [3 _5 b* A
    去掉了随机部分( M6 I# B0 q  G$ }
    #y = (x*27+15+random.randint(-2,3)).reshape(-1)
    7 G" w. g  b$ p% H( p& f+ ey = (x*27+15).reshape(-1)  J$ ^( Y: I9 W  t- A) _6 V
    . Y0 p- |% M; a) Z/ J; X% q9 S4 H
    循环次数加成10倍,就看到 b 收敛了
    4 b5 ?# S" C  I- ~w , b
      z% Z1 m% H3 S0 J27.002620697021484 14.826167106628418
    5 X5 U0 p% u5 e& \7 U; p, }5 Y5 V! x3 v$ M. F( c
    和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-1-12 14:44 , Processed in 0.030306 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表