设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 3050|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 / }$ K% g1 a9 A( S8 }
    4 l4 G, R, _/ ~" C
    为预防老年痴呆,时不时学点新东东玩一玩。' Y1 R  J( I' \4 F: t" \2 u1 A, ^! f0 k
    Pytorch 下面的代码做最简单的一元线性回归:
    1 g& L; C& E& g1 O% l# U* h7 P" k----------------------------------------------
    7 Y3 X* f/ j2 \import torch& ]8 C# M" j( f6 z  m2 m. @% B
    import numpy as np; K7 l) h+ `4 E6 V$ C1 |8 q
    import matplotlib.pyplot as plt
    9 D! |* b' n  simport random
    . w% l" |7 x0 S8 ?- M0 F# P+ y0 {  j% N8 s, W  P7 n! s" Y+ T
    x = torch.tensor(np.arange(1,100,1))
    7 `# h( T; A; Z: V; w. I# Sy = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=15
    9 [+ `! p7 w4 x2 F
    ( F0 ]0 \3 x$ Yw = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b, z; A/ q( u5 W
    b = torch.tensor(0.,requires_grad=True)" e& J/ R$ m9 |7 y

    : V0 P! E4 b$ B8 [; H9 g; depochs = 100+ J2 J' i% a5 q% R+ @0 Q
    + ^# D* X9 T, }5 s5 z$ n
    losses = []8 H' m" Y' U1 L3 H! v
    for i in range(epochs):
    ; O$ F# i: O  J& }  y_pred = (x*w+b)    # 预测) w  x" O7 h. S- T# F
      y_pred.reshape(-1)
    7 z' i. h. n  m; o7 b. f % i- R9 B$ \2 O! o
      loss = torch.square(y_pred - y).mean()   #计算 loss
    / X0 h) r  M" Z1 q/ c  losses.append(loss)
    1 T/ R: P, F! {8 @& I  
    ; M) E  q" c6 v, K0 \, z$ \9 `  loss.backward() # autograd6 G2 g7 i  g# q9 {- G7 f
      with torch.no_grad():
    $ ^8 J" ~0 [" V  Z5 l  c6 a( _    w  -= w.grad*0.0001   # 回归 w
    % v& j- J0 H$ I, w6 E+ W% b1 F7 {    b  -= b.grad*0.0001    # 回归 b
    , ]) a5 V1 E2 X: }- s0 X8 c& c  w.grad.zero_()  # Z* u+ ]1 R7 X' o  h/ g" U
      b.grad.zero_()9 \7 P& R* T9 J8 c9 Z0 e& [0 \

    3 \4 a, @1 ]4 `1 L8 K( tprint(w.item(),b.item()) #结果
    / M$ z' j% a. Q5 Z& i, N$ k4 C0 M/ w( i  ~
    Output: 27.26387596130371  0.4974517822265625+ `5 E' T* R' J6 ~+ a& A+ z1 D$ _
    ----------------------------------------------2 y- b  \* E0 l3 @! t9 Q. u5 _
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。1 j( J/ v: z( N8 g( I1 N
    高手们帮看看是神马原因?# t( f7 d$ R$ E( W

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑 + k# q# G( l& K' C% U" H
    . N% ]; A$ Z* f, J7 G: I
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?" U1 d" Q/ s8 B  D9 y* [2 \
    -------: \: U$ M, L5 U& l
    不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。- H0 ~: z$ n7 {, `" I# U6 D3 X
    -------
    * p7 j6 L0 c. k) r3 d+ B算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23
    7 j3 E/ R/ w$ E4 b没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?, i" Q) d% J* V9 S, K
    -------2 m5 M, D4 g( Y3 c7 x
    不好意思, ...

    " a5 _0 f6 r9 H8 W7 B2 n' B谢谢,算法应该没问题,就是最简单的线性回归。: ?7 n1 i. n  Q& H9 w' K
    我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 , K; W5 h$ `; N$ Z# S
    雷达 发表于 2023-2-14 21:525 M3 E: f  A8 D: W$ ^
    谢谢,算法应该没问题,就是最简单的线性回归。% S8 _2 \9 ^2 z- Y
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...
    7 h" U* \/ q" Q  @, ~0 e! Y/ A
    , q! |5 \! D+ W0 u8 {2 `/ x7 P3 I
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。/ a5 K' |' h! U

    ; x& e1 \$ H) I! M: O8 T9 V或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑 9 Z5 n* H. c+ i$ `" n. K( Q& \
    老福 发表于 2023-2-14 22:00
    ) g  c" A5 v" r1 ~4 z刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。8 y# ^" p2 V6 P$ {- z

    / R# s0 Z0 G6 j  }, y或者把b但的起点改为1试试。 ...

    6 F5 @" h9 r  D) w$ C2 U, i6 e; s+ A* L8 _0 ^- g; O
    你是对的。0 e6 A, O7 A' w* V7 i; h6 g
    去掉了随机部分; B) O8 M) Z: }; \5 H
    #y = (x*27+15+random.randint(-2,3)).reshape(-1)9 @$ `5 ?7 w7 ^7 z6 U2 `
    y = (x*27+15).reshape(-1)0 o) a& G( q7 e9 q. f) A2 j
    / z: y: X& u# m, A1 B2 l0 Z) U
    循环次数加成10倍,就看到 b 收敛了. u6 c% n& M  P  P* X$ ~
    w , b' Y& ?7 Y2 i8 w& k
    27.002620697021484 14.826167106628418- H" F- `0 \( a, G% |
    3 ^, G- Y2 G1 _1 l  _
    和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-6-7 05:56 , Processed in 0.064715 second(s), 22 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表