设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 3011|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑 ' M6 o) V4 A7 E
    ' l# [$ z6 j" U& F8 P: W: W( K
    为预防老年痴呆,时不时学点新东东玩一玩。
    0 A# b! Y& c: MPytorch 下面的代码做最简单的一元线性回归:" v" l9 q5 x" c- i2 L* |) V
    ----------------------------------------------; _  z% Y( q" U! u3 i
    import torch
    6 u$ u! E' _# U' Simport numpy as np( O# s) P2 i9 ?/ D7 z+ k
    import matplotlib.pyplot as plt
    , Y/ C$ d) X: E4 B' Vimport random
    : D; P% I* M2 l, G
    5 e( @3 m# m5 |: ]9 ]5 lx = torch.tensor(np.arange(1,100,1))* Z6 D6 c. i* Q! g
    y = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=15
    + l# l* S& L: c5 o9 n- ~: d) @" |( p1 d2 B" u0 Q( l
    w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    : w2 a  F6 @! C6 xb = torch.tensor(0.,requires_grad=True), d% P1 ]' j* i
    0 b% Q% V" e- l# r
    epochs = 100
    2 L' V% `+ r5 T- ?% U# e1 f
    ) M. ]* Q: I7 Q: zlosses = []4 ^0 v2 c! t' V( N
    for i in range(epochs):5 J" ], u7 I. @+ g% a% l
      y_pred = (x*w+b)    # 预测0 }1 K& d9 O' O9 ]& X/ B$ h) {6 S8 Z' z
      y_pred.reshape(-1)
      J& C) D8 G( F: k! h ! s& W" C  r5 ]. ?2 |
      loss = torch.square(y_pred - y).mean()   #计算 loss
    # Z7 A  a8 t$ ^5 r: \6 n) [  losses.append(loss)- b3 `& V# Q- ]% v! c) ]
      $ u( q" x. k8 f7 D' E1 B6 w7 k
      loss.backward() # autograd' f0 n/ K- b& A% \% p+ {* V! F& T
      with torch.no_grad():
    ' |. K! p$ u/ q# d2 N: c2 Q9 ]! k% X    w  -= w.grad*0.0001   # 回归 w
    * n& G  k# d; {' J- g; ~' t, z3 ?- e    b  -= b.grad*0.0001    # 回归 b
    % D3 @7 b/ q# d, i- S/ K8 \  w.grad.zero_()  * n1 D7 f1 |9 O/ H( U
      b.grad.zero_()
    9 p  b1 ]- D0 K, w8 M% Z' I$ V
    / }% t: z+ O1 f; z( iprint(w.item(),b.item()) #结果4 H( S) W/ E7 ^! N$ P. o

    # c$ ?5 }5 m7 m. y1 S  s7 ^/ BOutput: 27.26387596130371  0.4974517822265625# K* E, v- _4 {6 y' M
    ----------------------------------------------1 P; j) s, n2 i& ^$ r+ i, K$ W
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。9 t* z  K' `- Q9 t* F
    高手们帮看看是神马原因?
    4 T+ X$ V) \: l& z* V. o

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑 : Y5 U9 o. F6 b9 t( a

    ! n  G; @7 F1 P' R/ a! g没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    ; `' g5 Z" e! E* M  m; v+ H-------4 X* f9 j/ p2 G
    不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。
    : i( I9 q/ ]/ b+ V9 l3 F" i-------
    7 N. m' X1 V5 a" y( ?1 D算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:231 W( f0 W8 Z/ v5 Y- t+ i% o
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?- f% V# D( E5 {( `
    -------* q2 j3 V6 Q0 \' D) q3 d/ s
    不好意思, ...
    3 g  E4 R" N# I1 q& m8 P/ ?
    谢谢,算法应该没问题,就是最简单的线性回归。
    . {3 H& j. U0 ^我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 ) O- v6 S6 N* t- M2 [
    雷达 发表于 2023-2-14 21:52
    3 g( p4 [# S* H% S  J谢谢,算法应该没问题,就是最简单的线性回归。  {+ a# O8 s) |8 X  ?! \
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...

      u; L, a5 c5 ]6 f# r$ |  Z  s, c. e! I4 t1 n& s. F( F/ t
    刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。4 U  k$ R1 S! H# M9 h
    $ V+ e# |0 y2 h  j
    或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑
    % ?4 M8 W  V2 m
    老福 发表于 2023-2-14 22:00
    - q! }( _4 a+ a+ e- _9 m6 D刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。* n# [( C  N; K/ \- N* F
    6 @/ P( ]1 `1 b+ \5 T, K
    或者把b但的起点改为1试试。 ...

    # O& O. N% S. G' s$ O9 T  n4 G3 O! T. f. y$ ]. Z5 d
    你是对的。
    ( E" [% \4 i% [7 Q( B" i9 d% E去掉了随机部分
    ! }- ]* p2 P* Y% P' k#y = (x*27+15+random.randint(-2,3)).reshape(-1)
    , l8 v/ H! U2 J3 m# v& b2 zy = (x*27+15).reshape(-1)
    % e; h8 ]; z0 I! s+ j6 w! a% o" d8 z, ~$ s) R
    循环次数加成10倍,就看到 b 收敛了1 m- ^) N) ]2 s2 u
    w , b
    " y( K( F* g9 v# }  T27.002620697021484 14.8261671066284182 p( J. }1 D( W$ X) d5 S# K0 r

    5 y( T' g1 B* l1 G和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-6-1 08:20 , Processed in 0.057012 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表