设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 644|回复: 5
打印 上一主题 下一主题

[科技前沿] 中外大模型数学能力比拼

[复制链接]
  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    跳转到指定楼层
    楼主
     楼主| 发表于 2025-1-26 17:34:23 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 可梦之 于 2025-1-26 17:57 编辑
    - f5 q6 }- G3 A# ]/ T2 s  T8 I' e" a( k* g; b
    遇到一个数学问题,懒得推导了。习惯性让GPT推一下。3 P% `0 T4 p$ J3 `- R2 @

    5 l! f: D* y5 O; j* v最开始问题给错了,然后纠正了一下,貌似GPT就鬼打墙出不来了。给的答案也不对。4 D; q7 A6 V, T# s0 ~; D; L
    2 N! F8 \! i/ }

    + V- w) [) D* l6 C# x可能受上下文影响。那重开一个对话,结果还是不对。要么说没有解
    ' O& ]6 {1 A( l6 g
    " D( o( j7 s, G) ], E0 B! Q0 u" V/ R& C$ y7 H* s

    / g( v6 l: w4 [( s/ w9 {4 q) P% A+ H5 Z1 Y8 l' Q0 a2 f, _# N. q

    : o$ F* A- U( _0 V要么继续胡说八道。0 P0 i' d( V8 _" |

    2 i* [3 D0 t7 ^) \: k1 _" F" H* r. p1 W( ~9 A4 M. k% U  X
    抱着试试看的态度,把同样的问题扔给了豆包和deepseek。
    4 j! u/ A  ?( K) A1 y# `6 Y2 n, j5 i8 F" u% ~
    deepseek速度快,结果也对,但是过程是不对的。9 a5 i6 `  U2 d% ]% x

    # M+ x6 p, c+ u
    0 O: x, ?1 r3 n( R' Q6 |# l# L3 ^豆包过程比较绕,但是基本正确,结果也是对的。/ ?/ T0 D9 t% Q! T- Z& }+ O7 Q

    9 T& y/ s) `9 f( o, G/ V9 ?! A8 f+ V% ]& E5 {+ l1 o+ S
    当然,都不如人推导的哈。, ]+ e5 u; q1 p' l& R% o
    ) h( t' g" _4 g; ^+ |( T

    & q6 A2 P1 V2 D! H/ E过去一年多,算是ChatGPT的深度用户,感觉也不错,一直花钱买VIP。但是对国产大模型用的不多。一方面最开始用户体验不好,一方面自己内心还是有点看不起国内的大模型。内心是不希望ChatGPT输的,所以反复尝试了多次,还是不行。/ C, w8 R) P3 F( V! @0 R- P

    , `, d& f, |; q) _2 P1 Y( r7 s虽然GPT可能被我误导了,换个账号也许就没问题了?虽然这只个例,ChatGPT比国内大模型表现好的多了去了。但却破除了我心中的执念,以后有问题,也会在国内大模型试试了。
    9 }7 I/ K8 V0 I4 F; }, R! u- _# Z3 H* D3 d- a5 S

    , r: A1 I0 P2 w/ z7 w, I+ P! G* H3 y

    ) G3 ~8 {& q  Y3 |6 e. `) Y/ W: U# F& z, F' e! l" B$ G

    评分

    参与人数 4爱元 +36 收起 理由
    helloworld + 10
    方恨少 + 12
    pcb + 4
    johnsonjian + 10

    查看全部评分

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    沙发
     楼主| 发表于 2025-1-26 18:52:01 | 只看该作者
    个人推导错了 落了一个系数2.
    2 F9 z2 @  |, {! h& [& a, |$ K
    这也是我们需要AI的原因啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    10 小时前
  • 签到天数: 3448 天

    [LV.Master]无

    板凳
    发表于 2025-1-26 22:43:24 | 只看该作者
    我没用过花钱的AI, 但是我觉得各有优缺点吧。
    9 R$ |* Z5 k) j$ D6 i4 ?5 X9 j7 \( S; U+ m. U
    要是用中文问问题, 我喜欢国内开发的, 要是用英语问国产AI我会特意指名用英语搜国外的资源。
    6 k  R. {( _$ Q5 V% G. J
    . X0 a# X. q( x6 N4 v即使美国的几个AI, 答案也不一致, 我都是一个问题问2,3个AI
    $ g6 {! p6 X  T
    9 l1 \( ~- b8 k' `8 J: n! k. }现在搜索喜欢上了AI搜, 平时看我在用哪个笔记本, 工作上有一个笔记本上有vs code,所以顺手用了copilot;
    ) m. `: j$ X9 E7 E, K) C另外的一个笔记本我基本上只常规使用搜。/ s( u9 Z9 M2 |/ t  `

    * R/ Y, C! P3 E8 I5 {5 U6 V* A1 t我个人的本上装了好几个AI, 经常每个问一下。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    7 小时前
  • 签到天数: 2601 天

    [LV.Master]无

    地板
    发表于 2025-1-27 01:55:48 | 只看该作者
    马鹿 发表于 2025-1-26 22:43" x9 v( M9 j) y' Y
    我没用过花钱的AI, 但是我觉得各有优缺点吧。6 V3 a5 o. U1 A: p

      T' G( F& O6 N. g要是用中文问问题, 我喜欢国内开发的, 要是用英语问国产A ...
    我个人的本上装了好几个AI, 经常每个问一下。
    3 w1 K1 K- q( H5 o! e+ X
    / L6 a, x" S$ a1 f
    所以到底哪个更好?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    昨天 03:45
  • 签到天数: 2263 天

    [LV.Master]无

    5#
    发表于 2025-1-27 03:30:40 | 只看该作者
    Chatgpt数学非常不行。以下是个典型例子:% j/ U. o3 T: u/ S+ b) U

    7 H$ O# w) L+ m9.11和9.9哪个大1 p# z8 g5 b* @4 k: p
    ChatGPT said:
    & m  Q5 m+ Q2 H: B" J0 bChatGPT
    / k: h) K  ]( ?6 y0 z% R9.11 比 9.9 大。
    ( j' }3 ]- T( n6 [1 {% ~
    % H* y7 g! d& v2 O. I原因是比较小数时,先看整数部分:两者都是 9。然后看小数部分,从左到右逐位比较:( I1 z0 E9 a" w- h+ }1 _
    5 h2 a1 v$ h2 ^2 U/ H7 ]
    9.11 的小数第一位是 1,9.9 的小数第一位是 9。
    4 t/ I* m" T0 {' a$ i由于 1 < 9,因此需要继续看下一位。
    " y% Y" D; e( t6 G9.11 的小数第二位是 1,而 9.9 的小数第二位可以看作是隐含的 0(即 9.90)。$ @9 i; t0 m2 I
    因为 1 > 0,所以 9.11 > 9.9。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    10 小时前
  • 签到天数: 3448 天

    [LV.Master]无

    6#
    发表于 2025-1-27 03:44:05 | 只看该作者
    方恨少 发表于 2025-1-26 12:551 o  {8 @: C- |5 j# B, y6 |8 s. q
    所以到底哪个更好?

    1 ^- G# h( ]! h0 U8 r* a说不上哪个好,真有要问的问题 都跟个遍, 看看哪个答案适合自己。 就连平时的搜索我都是bing 和google互相验证。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-5-13 11:34 , Processed in 0.046741 second(s), 21 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表