设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2944|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 & |, Y7 C) A# j) \) `* H
    6 x3 G! A# o$ }- ~! l2 p3 S% K
    为预防老年痴呆,时不时学点新东东玩一玩。
    + N' U& c% o. c9 ]  qPytorch 下面的代码做最简单的一元线性回归:
    1 Q$ e8 a3 ?; N: z2 X----------------------------------------------) L3 @! O$ E1 e4 _9 L3 I4 B
    import torch% O6 i6 U! e) J6 p$ P. I3 t% |$ i
    import numpy as np: e  F3 M+ i. a9 R; w- f% B3 k
    import matplotlib.pyplot as plt
    ( H/ a) p5 A2 _* G% R2 bimport random
    & U, e8 T$ ?. o4 n- Z; i
    # H! J2 b, J( V+ S6 d2 Ix = torch.tensor(np.arange(1,100,1))+ ^& Y3 @% T# P. H
    y = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=154 n" x! P) r+ i# D: O

    3 s. I; [1 A) S# S2 `9 ?* ]w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b0 y7 h3 T/ B2 |* o1 A) `
    b = torch.tensor(0.,requires_grad=True): m0 \! o) V& j
    3 c4 Q" E( b% S! Z7 q
    epochs = 100
    , w9 M! I" S5 j6 R- f3 W' s
    ! {/ D$ a" |1 E! A" Jlosses = []
    8 |& d; x( d+ v* b0 @9 N0 Bfor i in range(epochs):
    . i+ @" Y) C+ h9 c6 g+ ]  y_pred = (x*w+b)    # 预测  D: e0 f$ A& N) B* W" Z
      y_pred.reshape(-1)
    2 s, w0 Q1 [, ^( R' d
    5 ~8 I) U, g: z9 b6 p/ P( E  loss = torch.square(y_pred - y).mean()   #计算 loss
    4 J$ \, D  R) X6 f  losses.append(loss); s1 P$ W0 S) `% T' ?1 e" D; R
      
    3 M# Q, F0 s8 K  loss.backward() # autograd
    ' U: o$ z; O" p  with torch.no_grad():. @0 H8 ^2 r0 \# ]6 n7 I2 {
        w  -= w.grad*0.0001   # 回归 w; v/ S0 h( j; W4 c1 M0 I& h
        b  -= b.grad*0.0001    # 回归 b
    0 P+ d0 J; g3 t5 f  w.grad.zero_()  ' h9 e$ j# A: B5 H! F4 O. r
      b.grad.zero_()
    ( f; s) n" J# {7 ~  X: U# M1 O$ R& l5 R0 E
    print(w.item(),b.item()) #结果# s* X  @7 s( n5 \5 |* _
    1 z$ w. y) a% E& D
    Output: 27.26387596130371  0.4974517822265625
    ! ?# z3 W% f4 w$ H! m; g) d----------------------------------------------
    % L& P5 X8 ^1 E2 s最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。) z7 G* N5 [3 R: }: K6 ?
    高手们帮看看是神马原因?
    1 s. B) e3 x- B1 C4 {

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑 4 e) r2 u! B6 }# n" f3 C
    ' N; x0 \6 g; x2 v
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?: p  E! {) g5 y8 d, X
    -------  v& `) V5 M1 q3 h, S
    不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。, }3 Z6 N( z9 N2 j
    -------
    % ]0 |: Y+ k) Y% W' ^. j算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23/ s" T0 ~: x0 l( |4 p! g7 R
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?8 x/ d0 f8 L" f4 j$ _
    -------
    ; M# {# r1 G+ V不好意思, ...

      p7 c- c: _5 S8 f( l$ Q谢谢,算法应该没问题,就是最简单的线性回归。3 A- {2 p# ]0 Z# |; G
    我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑
    3 r( K- Y+ W; `) n( x0 S1 S% a
    雷达 发表于 2023-2-14 21:52
    ' a* ?- f" o: J3 c0 r9 Q  q谢谢,算法应该没问题,就是最简单的线性回归。
    ; z, H' B2 h5 h! Y我特意没有用现成的工具,就是想从最基本的地方深入理解 ...

    ' Y2 L* U# A$ e1 P; R, m2 p! t$ w! p! A
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。( G% C$ ]9 z. d* g8 ~$ h' k

    9 }6 V9 V$ A5 ~3 H或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑
    ) C7 f% V! I9 j& W! p( V) c
    老福 发表于 2023-2-14 22:00! D" h; a1 E& Q# K6 V( w% s( w6 }6 G. i
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。4 B( R; O! r5 j5 V* X1 {6 C0 A
    , P3 p* O, w3 [. B8 |& a3 ^% r1 ~
    或者把b但的起点改为1试试。 ...
    2 ^4 O! g. p$ g1 C

    ( q: j$ E% [3 s2 x6 _你是对的。# o% S, |% u5 G" a0 x  y5 K
    去掉了随机部分- N) i# f7 u, X& V
    #y = (x*27+15+random.randint(-2,3)).reshape(-1)$ L+ R& ]% e0 }+ V. W
    y = (x*27+15).reshape(-1)
    9 C$ _2 V4 P9 i5 B  x8 x+ u) i4 n# g# Y0 t' z# t3 m  s- d% s4 W" I
    循环次数加成10倍,就看到 b 收敛了
    & y  o. K4 U2 Uw , b
    ) v1 |& c! Z" x- y) `6 k$ x27.002620697021484 14.826167106628418- W8 c* A6 [' k3 g. l1 }" s. d

    ' e/ B$ i* R. a# t和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-5-24 03:22 , Processed in 0.058537 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表