设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2127|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑
    3 t, S' q' `" d8 N0 }" }0 P* s6 ]
    为预防老年痴呆,时不时学点新东东玩一玩。
    3 x  F2 V! J4 }5 g9 w3 v- @! vPytorch 下面的代码做最简单的一元线性回归:8 i+ q( h8 l% Q" p9 R  m
    ----------------------------------------------; T) d2 \0 }( q- ?
    import torch
    ) ^1 H" }6 P$ b6 m# W+ D/ G6 \import numpy as np
    2 r2 n) |3 x* ximport matplotlib.pyplot as plt; x( L$ e$ f: O
    import random3 U( @$ P4 R5 ?
    8 o/ }. o" o$ x1 j5 O
    x = torch.tensor(np.arange(1,100,1)); S1 [' c! b: l1 C  O) t
    y = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=150 `2 }/ F! n6 J3 B9 f& U2 c
    9 e9 Y/ S0 \$ Y; J
    w = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b5 Y5 k$ [; l* e7 h
    b = torch.tensor(0.,requires_grad=True)
    ' ]% b5 i" X/ }, ~& R- ], }8 @* e" f. s! ~% y7 X6 C
    epochs = 1007 U9 w$ o; G+ |% Z2 f

    ) I; C- }3 s2 W! k# l; Hlosses = []5 ]6 _8 j: s' n7 v. D
    for i in range(epochs):( ^8 ^5 Q( V7 C6 A( m  u7 E4 K
      y_pred = (x*w+b)    # 预测
    ; H, m2 }& `5 F* B( Z$ N  y_pred.reshape(-1)) n9 p) @2 G; I1 z$ w; X% F$ D: y8 D
    # Q9 X0 E4 c2 n1 E. u
      loss = torch.square(y_pred - y).mean()   #计算 loss9 g  c8 d) `7 V% M& e3 B. t
      losses.append(loss)$ o1 x) [9 J. f8 v
      / c7 @6 ?1 n4 _
      loss.backward() # autograd% H6 ^0 h: D$ \3 b8 X
      with torch.no_grad():; n# ^, x/ p9 e( _' s
        w  -= w.grad*0.0001   # 回归 w
    ! ]6 b, Q. }, M3 I8 h    b  -= b.grad*0.0001    # 回归 b
    , ]8 n% I5 [) }% R  w.grad.zero_()  ' A+ h  h2 w9 X6 l' j8 A, {
      b.grad.zero_()6 R0 A* d# {' F0 ~- w. ?5 I
    $ p+ q8 ?) V+ {$ E+ x
    print(w.item(),b.item()) #结果
    " H* D, S( v6 l* k5 @5 w# R8 Y; o% ~
    Output: 27.26387596130371  0.4974517822265625
    $ m; h  z% t. w( i' x, m----------------------------------------------: S& _" o$ B3 _7 V
    最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。
    / V! i0 {: g4 g1 X高手们帮看看是神马原因?
    & W( S  f/ a% y( M8 M

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑
    0 _% n$ }* v9 y2 i* \( K+ B' D) [& h# T- u7 `# ~, p; g  d1 s
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?6 Z5 P. e+ H6 U
    -------
    % G1 J0 P8 R9 M4 P& ?/ K不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。
    ) _! V" [! A7 \+ a-------$ i% r& H9 y" G! P: k, Z
    算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:234 E( `0 [8 H" \+ n. n3 T/ m: n' X
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?7 ]  y+ v  y) {) l0 {
    -------3 K8 q- l: C" o
    不好意思, ...
    ( G3 F. S/ N5 }  \7 n; G; K
    谢谢,算法应该没问题,就是最简单的线性回归。* I/ N; T9 R+ L( j3 u# x0 G3 b6 R
    我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑
    8 h- e1 l8 q: O. M: [
    雷达 发表于 2023-2-14 21:52. |, n1 d/ ^3 y/ f6 Q& q( x$ b
    谢谢,算法应该没问题,就是最简单的线性回归。" n! e/ d9 f* C# @+ F+ ~  f8 [& @
    我特意没有用现成的工具,就是想从最基本的地方深入理解 ...

    1 _' t! N! w/ c, e8 m8 b' `3 @
    + ~2 ^5 \/ d/ \- @/ y刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    5 j1 X$ N0 P3 c' r6 l# U9 x5 h5 P$ }: |- f8 J$ @
    或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑
    ! s* k; ]  p/ U/ V" w- c6 t! I
    老福 发表于 2023-2-14 22:00
    + s& J* B& `7 H  r2 ~& q6 l刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。
    6 _0 r2 n+ N' f7 _6 d! m" @+ }# L7 z& c1 B
    或者把b但的起点改为1试试。 ...
    ' [4 p! e$ R# H/ ?, r) \$ ]6 \
    ! W* H7 F6 \: c& v, j$ F: q3 i
    你是对的。9 X$ f0 b6 V- ^4 S2 g; o0 Q
    去掉了随机部分. U. j* f' ]3 k+ T. F) @+ H6 i
    #y = (x*27+15+random.randint(-2,3)).reshape(-1)
    % r' d( A5 ~' P" a/ K" A* Py = (x*27+15).reshape(-1)6 I5 F) M) |* s: W  |7 f0 ]1 u. k+ A

    ; Z% M; |0 H) W循环次数加成10倍,就看到 b 收敛了
    0 X# }6 `- O2 n) y! I/ Nw , b
    , I# A! L8 J' [; O$ V: o27.002620697021484 14.8261671066284189 t. f3 t* U( C! \4 ]  m

      `6 E# u5 i* l' K* H. ?和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-11-21 09:25 , Processed in 0.042715 second(s), 22 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表