设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 880|回复: 20
打印 上一主题 下一主题

[信息技术] 附议xiejin77兄:大模型加海量数据只是超级刷题大师

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 2024-10-17 12:15:03 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
多谢xiejin77兄好文(http://www.aswetalk.net/bbs/foru ... read&tid=160739)。想了一下,有点感想,请不吝赐教。- p" ]/ t( g# w+ w+ P1 f* ]- L

8 h# M7 [' b0 ~0 J个人认为,大模型没有奥秘,还是靠模型参数之多来更好地“捕捉”现有知识的量变,而不是产生智慧的质变。知识依然来自海量的数据,也就是人类世界的现有认知。
8 O& o8 ^! k! E
2 R# T" Q/ c- A$ Y& C大模型加海量数据依然在本质上是超级刷题大师。比“查表”式的直接找答案要高级,能填补现有数据之间的空隙,但不能跳出现有数据所代表的知识的框架。在本质上,刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终也解决不了。刷题也不是直接照搬解题,还是要判别题型不是嘛。6 o- s" E3 z4 A. u: W6 i1 N
$ @; A9 c8 w  y5 q
世界上的“题”已经够多,所以海量刷题是能刷到很恐怖的“智能水平”的。但依然只是超级刷题大师。沿着这条路走下去,不可能走出创造智慧、具有独立判断的“强人工智能”的。大模型“有创造力”的印象来自吟诗作画,但不是还有“熟读唐诗三百首,不会写诗也会诌”吗?画画也是一个意思,只是从文字介质换成图像介质。( {2 R$ i7 f, C7 R3 C# A$ e9 h
! H. r& E) o5 \( a' R0 O# s
用围棋规则自我训练是另一个问题。那是有限空间里确定解的问题,是极大规模的最优化问题。在本质上,这与“深蓝”早年打败卡斯帕罗夫相似,只是算力极大提高了,算法极大改进了。
6 Q9 @. |  A! T" a' `' [- C
, ~- ^' j+ B8 @# p& t这对中美的AI大赛意味着什么呢?  ^5 g4 h% }  |1 Y6 \. h: E7 c
7 |% A/ w  a* ?
AI的最终用武之地是在应用,应用型的AI的厉害来自数据,实践才出数据。8 s4 _* B; y& @3 R0 e

: H2 [- \6 ]" {/ u2 }在军事、艺术这些方面,美国有足够的实践,美国AI会很厉害,可能超过中国。必须说,中国军队打仗没有美国多,中国影视没有好莱坞能折腾,音乐、美术等也是一样。
( j: v% d  K6 _; R( y
; z6 r! W7 N2 O5 S& [4 o: T但中国人在制造、建设、物流这些实体方面的实践更多,数据丰富得多。社交媒体和广义通信方面,抖音、微信出现在中国也不是偶然的。个人认为,这些与经济和社会相关的AI应用可能中国会领先,如果不是已经领先的话。
2 S$ `: A" |+ C, j; }) J0 B1 c" N5 |
美国式AI训练凭借算力和算法优势,把天下所有圣贤书、垃圾书统统海灌进去,希望“良币最终压倒劣币”,也因为搞AI建模的人没有能力筛选圣贤书、垃圾书。他们需要的是“通用人工智能”,而没人是能在所有方面都成为专家的。
+ R& a  l+ ?+ y4 g) q  ~) u( @2 S( a/ Y
中国式AI训练在算力方面吃亏,算法再厉害也输在起跑线上。但中国人有有用的专业知识积累,中国AI也聚焦专业AI,专家参加训练,所以大模型训练时只灌圣贤书,不灌垃圾书,最后在形成有用但专业AI应用方面成绩斐然。
* h) ~# F0 c# c9 L1 n5 L5 J, g4 ?( j* x" K2 x: G! @4 U
最终,算法、芯片这些都不足以决定性地改变中美AI的走势。

评分

参与人数 6爱元 +48 学识 +2 收起 理由
方恨少 + 12
长叶林 + 8
pcb + 4
tanis + 4 给力
住在乡下 + 6 涨姿势

查看全部评分

本帖被以下淘专辑推荐:

该用户从未签到

沙发
发表于 2024-10-17 20:29:40 | 只看该作者
回晨大牛的话。
0 m. y9 c8 K. z2 F; \$ B: H: ~
9 k. [. ]1 ]( \: h  C我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。5 R% H1 g" o" D* F: g

( X/ v8 k6 Z. J) }: c我下面引用他们的话。我先声明我不同意他们的话。
5 W' Z- r1 E" B) `7 J- E: k1 i( a1 H2 Y0 ]/ {
他们的反向信息是中文网络材料。作为唯利是图的美国商人他们对政治不感兴趣。他们这么做的理由是中文网络充满逻辑错误和事实错误。5 f9 B. E! v1 h% [

) P) B/ Z! ~+ k1 w2 s3 G# _逻辑错误和事实错误是不可避免的。但是多了不好。咱从自己做起,用事实证明他们走了弯路。
回复 支持 反对

使用道具 举报

  • TA的每日心情
    擦汗
    16 小时前
  • 签到天数: 3079 天

    [LV.Master]无

    板凳
    发表于 2024-10-17 23:16:09 | 只看该作者
    宝特勤 发表于 2024-10-17 07:29
    ) o! r0 L8 X9 a; q1 Q" m& |回晨大牛的话。
    : ^% a5 ?& {2 ]% S+ n9 n
    + |* @% R/ w4 h' `+ @7 ?" b- ^我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。

    6 I; f* K$ S7 E. d) S咋感觉你的朋友在缘木求鱼呢。# Y8 [$ X8 x3 s  \$ J
    众所周知,中文网络的信息量相当小,宽度和深度都不行。这个在几年前就有广泛的讨论。过去几年某种程度上更加是倒退的。掌握中文信息最多是中国政府,第二是国内那些互联网大厂。所以,你的朋友在中文互联网上找内容,感觉完全是门外汉的做法。6 L: n' c0 z8 i7 t. ^
    5 W0 A  o7 f9 O6 ^/ g) g
    这种封闭带来了信息垄断。其好处显然被美国互联网大厂也看到了。于是,过去几年里信息越来越闭塞,爬虫能去的地方也越来越少了,大量信息开始从英文互联网上消失了。这个其实成为堵塞AI后发企业的秘籍。这点上,感觉美帝在向中国学习了。
    8 Z- A: U4 x) L

    点评

    油菜: 5.0 给力: 5.0
    涨姿势: 5.0 不能同意更多: 5.0
    油菜: 5 给力: 5 涨姿势: 5 不能同意更多: 5
      发表于 2024-10-18 16:18

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不能同意更多

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2024-10-17 23:29:27 | 只看该作者
    赫然 发表于 2024-10-17 23:16
    $ B4 G, a4 C6 z4 m咋感觉你的朋友在缘木求鱼呢。
    8 ], `2 e, t" c众所周知,中文网络的信息量相当小,宽度和深度都不行。这个在几年 ...
    9 }0 x+ q- o; `! V7 S+ d( T
    赫大说得对啊。我朋友不是在中文网上找学习的内容,而是找反面教材。和赫大的观察是一致的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    5#
    发表于 2024-10-17 23:30:32 | 只看该作者
    宝特勤 发表于 2024-10-17 20:294 u( E8 a2 Q4 o& h1 Q6 M
    回晨大牛的话。, w/ o1 G  G4 C
    5 `1 s: m, r; s3 E
    我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。

    ) Y: A% [9 m# c6 ?+ Z* c以我大美利坚为例,Truth Social , X, Reddit和TikTok 同主流媒体的区别,让我有了一种平行时空的感觉。3 {3 U8 A5 h( x  w# \* o) d
    5 C, O* |, h7 x/ r7 Z# o: W( p4 S7 T
    回到中国,小红书抖音快手,知乎网易豆瓣,同官媒,也肯定不在一个层面上。
    ) Z& a6 R1 O$ s, E3 N5 M( y" k. y
    + S) Z5 r# A- ^  m" m9 ~5 |0 U: V所以逻辑错误或者认知完全不一样都很正常,不宜轻易下结论。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    6#
    发表于 2024-10-17 23:32:08 | 只看该作者
    AI在总结现有数据上先天性强于人类,但将AI用于开拓新领域必须小心求证。, i, v* @: b+ t0 }: P6 E% e
    " f' ~. O( L1 V0 ^' Q$ Z! X
    我天天用ChatGPT改邮件和论文,但我不相信ChatGPT写的论文。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    7#
     楼主| 发表于 2024-10-17 23:39:30 | 只看该作者
    征久仁 发表于 2024-10-17 09:32/ u6 Z9 K7 i5 T) k+ }, b( c
    AI在总结现有数据上先天性强于人类,但将AI用于开拓新领域必须小心求证。
      K$ @' |  N0 K, r0 @: G. K9 z) G. Y+ V6 O+ F( \0 x
    我天天用ChatGPT改邮件和论文, ...

    ) [5 s' o( L, N0 T3 u- [AI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道比人类多太多了,运算速度也爆棚,要刷题,人类是不能拼得过AI的。谁要是无聊到开动AI狂写诗,乾隆都要羞愧。但事实还是一样的:乾隆不是真诗人,AI也不是真诗人。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    16 小时前
  • 签到天数: 3079 天

    [LV.Master]无

    8#
    发表于 2024-10-17 23:47:15 | 只看该作者
    晨枫 发表于 2024-10-17 10:39
    % @" H& @# h2 _0 c/ n* s+ KAI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道 ...
    3 p9 m* K- y+ i' j8 y# G4 K
    感觉AI遇到理论瓶颈了。。。辛顿老先生害怕的超过人类的AI看来暂时还没有影子呢。
    6 t9 K6 e2 i8 P! Q  U$ I. C: A% O- s6 @6 P! ^1 t5 ]
    好在AI现在还在进步,等几年看看最后能落地什么。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    9#
    发表于 2024-10-18 01:24:52 | 只看该作者
    宝特勤 发表于 2024-10-17 20:29& k& l' p' [9 n
    回晨大牛的话。- z3 S& L2 w3 N/ m; b7 c
    ) y: \# ~( t, H  n8 H
    我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。
    6 p$ e: F0 \8 z' O& X
    行啊,他们高兴就好。再说他们软件能读得懂多少有高中大学水平的中文?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-6-1 10:07
  • 签到天数: 1 天

    [LV.1]炼气

    10#
    发表于 2024-10-18 02:02:19 | 只看该作者
    宝特勤 发表于 2024-10-17 20:29
    ; r- X0 L5 l. u  W5 ?回晨大牛的话。
    % ]' }9 C; X9 v: \+ b
    3 X8 I; r' {; N$ J( C* t我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。

    : L2 [2 ~8 C8 w6 H不知道你出于什么动机不停的阴阳攻击楼主,也许楼主在别处的罪过你?2 i% f; n, b% [  H6 l9 P6 x" ~
    一个整天自诩大公司高管的ID,不停在每个楼里秀你的小肚鸡肠,说怪话,整得像个怨妇似的。) Y' ^% x2 i' ]9 w* m8 u& F5 y

    4 O% s9 U4 a; {8 v. D. Q* M劝你呀,还是集中精力cosplay忙总,深度创作傻白甜的职场小作文。那才是蓝海的网络赛道呢。( {* l1 p: I! m( V( r6 o: H+ g( g
    " l3 ?9 U) W8 h+ O0 \; H
    你在西西河cosplay忙总,用力过猛,已经被扒的裤衩都不剩了。又跑到爱坛碰瓷晨枫,好不容易积累了一点人设,这么快就要败光了,何苦呢!
    回复 支持 1 反对 0

    使用道具 举报

    该用户从未签到

    11#
    发表于 2024-10-18 02:04:39 | 只看该作者
    yanei 发表于 2024-10-18 01:24
    + t0 V& ~& t: }  t: R' X行啊,他们高兴就好。再说他们软件能读得懂多少有高中大学水平的中文? ...

    * t( Z8 ]* j* `9 Y& `回yanei 坛友的话。他们软件有中国大学内容啊。我随便问了一下 ChatGPT.
    . ?( s( G4 c6 P2 n# P) T+ D) k/ E; ]" B4 {; b
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    12#
    发表于 2024-10-18 02:38:27 | 只看该作者
    晨枫 发表于 2024-10-17 23:39
    . U+ e7 v  @# pAI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道 ...

    ! L' Q, P4 j) y1 E7 y+ C& `最后一句绝杀了,太牛了

    点评

    章总的残躯在破破烂烂的东陵里面想,为什么又是我躺枪。  发表于 2024-10-18 04:07
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    13#
    发表于 2024-10-18 04:13:52 | 只看该作者
    征久仁 发表于 2024-10-18 02:380 c9 ~! _2 [0 y' s7 g9 h
    最后一句绝杀了,太牛了

    ' A( B' c$ n8 p+ S+ ?# H乾隆也是真诗人,首先是真人,其次会作诗,做的水平如何不提,但起码都合格律,就是写得有点多。基本每天一首,总量相当于《全唐诗》共四万三千多首,强烈怀疑他是带着 AI 穿越的。) v& ]" u0 ?, V4 k
    - H" E0 c2 u4 _1 B0 @' o: q( z' j) o
    乾隆诗作虽然总体水平不高,但也不乏上品的,毕竟量变还是会带来一点质变的。例如:
    6 z+ c/ v- _/ n. t& L
    0 O( {% A0 J8 D谁氏园林择胜开,山环抱复水瀠洄。
    : n3 c1 T+ y- `7 k' K- N川横桥喜路不断,岸转船如峰自回。$ s- D1 b5 m( H  v4 ^% o/ F3 k
    意入敞亭趣有永,目游高阁望无埃。
    ( y! x. k$ O! j( x分明层叠浅深处,欲问丹青能是哉?
    5 |6 [# b0 I, z" l1 c5 {& v, t
    ( p0 L/ S/ I: s2 G还有这首:1 O4 n1 D  |4 F; B" F: V1 L5 p# F
    三秋别忽尔,一晌奠酸然。8 i) F0 t4 k4 v
    追忆居中阃,深宜称孝贤。
    ( y8 S6 }5 a2 S) v: A  @平生难尽述,百岁妄希延。7 `8 i% M* \( q' b" f  M
    夏日冬之夜,远期只廿年。
    % x& _; M% f  I8 h. s
    3 h, Z% P; b$ s/ d* A这是乾隆思念亡妻所作,平铺直叙,但情深意切。如果把赋也作为散文体的诗来看的化,乾隆的《述悲赋》也是很好的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    14#
    发表于 2024-10-18 11:01:51 | 只看该作者
    感谢晨大翻牌子。8 w& ]# v+ J) g, c. C8 r4 w  l) K

    2 M4 ^+ f. e) f8 Z/ S( ?我是金融科技从业者,大模型领域的进化不得不长时间的持续跟进,同时也不得不面对非技术背景的人的询问。甚至是有些德高望重的前辈。
    , o/ p7 V8 ~  V" P: N5 }* ?0 G, h, W! d3 ^3 M5 u
    AI这个领域的发展,虽然常有一些意外,但还是跳不出唯物辩证法认识世界的基本观点。' e5 o7 T/ x& p# z* @. N% B

    ; I7 M" w- \9 M7 l晨大的论断,很有一点战略的味道。其实教员同志当年的实践论,矛盾论都是可以拿来理解这些现象的利器。但是国内没有这样的舆论来讲这些话。领域内的只想搞大新闻或者闷声发大财,也米有一个权威来讲讲这些战略上的东西,而用官话套话说这些又显得格格不入。
    ; q' e5 C- [5 s- N2 N. l5 ]. p# S1 W  c) ~
    所以,舆论的阵地,如果我们不占领,就会被人占领。

    点评

    给力: 5.0 不能同意更多: 5.0
    给力: 5 不能同意更多: 5
      发表于 2024-10-18 11:59
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    15#
    发表于 2024-10-18 11:03:46 | 只看该作者
    孟词宗 发表于 2024-10-18 04:13
    & m3 k" o/ ?; T$ ]( |乾隆也是真诗人,首先是真人,其次会作诗,做的水平如何不提,但起码都合格律,就是写得有点多。基本每天 ...

    : Y( }6 r6 J, h孟老师可以移步诗梦小轩,看看俺的这篇解读http://www.aswetalk.net/bbs/foru ... read&tid=160605$ t! H9 `+ _! V! A4 E
    5 M! d8 I$ C5 X) A! f  C( _
    作为一个长期有写近体诗习惯的入门者,俺对于AI的近体诗还是有一些体会的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    16#
    发表于 2024-10-18 21:22:30 | 只看该作者
    孟词宗 发表于 2024-10-18 04:13* P* r$ e+ e/ A& m
    乾隆也是真诗人,首先是真人,其次会作诗,做的水平如何不提,但起码都合格律,就是写得有点多。基本每天 ...

      h# u6 f* [" |& |" s! F8 \很多字我不认识
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    难过
    14 小时前
  • 签到天数: 1320 天

    [LV.10]大乘

    17#
    发表于 2024-10-19 00:01:27 | 只看该作者
    做中文专家AI系统确实是个好主意。通用AI如果是基于中文互联网确实太难了,污染得太厉害,到处是海量重复和不加甄别的信息,无效甚至有害。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
    行家  发表于 2024-10-19 08:27
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-1-22 23:48 , Processed in 0.048374 second(s), 23 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表