晨枫 发表于 5 天前

从历史看中美的AI发展之路

工业4.0到底包括什么,曾经有挺清楚的定义,现在反而含混不清了,但AI肯定是其中的重要部分。

AI发展正在进入关键阶段,中美在无可争议的并驾齐驱之中,欧洲、日本都在吃灰。但中美的AI发展道路有明显的不同。美国集中精力猛攻AGI,试图毕其功于一役,要匹敌甚至超越人类智能。AGI的意义不言而喻,足以使得学神成为学霸,顺手把会计、客服到癌症药物、军事指挥都解决了。

中国则面向应用,注重提高生产效率,面向市场化和产品化。从考试阅卷、天气预报到警力调度、农田轮作,中国的AI应用正在遍地开花,创造价值。

美国不是不注重应用,而是希望全知全能的AGI自己训练自己,把应用问题一起解决了。说到底,人类不是“自训练”而无所不能的吗?

中国不是不注重理论和前沿,而是要理论和前沿在接地气中发展。一方面引导理论和前沿的发展方向,另一方面通过应用引导理论和前沿落地。

在某种意义上,两条路最终可能殊途同归,但在现在,还在殊途上,离同归还远。问题在于殊途走久了,还能同归吗?

历史上,战斗机飞行员的头盔显示/瞄准系统是个有意思的先例。

在60年代,平视显示器在英国发明,很快在西方流行。平显在透明玻璃上投射光标、数据和符号,飞行员不再需要不断在低头读数和抬头观察中转换视力,在明暗和距离高度不同的仪表板和外界空域离不断转换很伤眼睛,也需要适应时间,而这可能是瞬息万变的战斗中浪费不起的时间。平显极大改善了这一问题。

平显是固定在正前方的,飞行员需要观察的空域是半球的,还是需要不管把视线拉回平显。很自然的想法就是把平显直接装到飞行员头盔上,头盔显示器随着头部转动,显示的光标、符号、数据永远在视界之内。

在60年代,美国就试图为F-4“鬼怪”式战斗机的飞行员配备头显。但是理想很丰满,显示很骨感。

在60年代,显示技术还是显像管(CRT),又大又重,亮度低,反差不足,耗电大,响应速度慢,可靠性不足。数字技术也根本没有到位。经过一番挣扎后,美国空军的头显研制被迫搁置,回到平显。

但苏联空军对头显的概念很感兴趣。苏联的技术条件比美国还差,但彻底改变了思路,将头显变为头瞄。头盔瞄准具不需要取代平显,不用于现实飞行、发动机、武器数据,只需要显示最重要的威胁方向和紧迫度。在显示技术方面,头瞄在视力余光所及的范围内安置了一圈微型LED小灯,点亮表示这个方向有威胁存在,红灯表示高危目标方向。

测量头部运动的技术不复杂,与LED指示灯相配合,头瞄成为很有用的态势感知工具。这也是R73空空导弹投入使用的时代,双鸭翼提供了非凡的机动性,可靠的迎头攻击成为可能,甚至可用于越肩射击。头瞄与R73成为杀手组合,是米格-29的大杀技。苏-27的头瞄和R73与米格-29是同级的,但超视距空战能力更强,“冲淡”了头瞄-R73组合的冲击力。

在冷战刚结束的时候,东德空军新到的米格-29成为北约特别关注的对象,相应飞行员也在绝大部分东德军人都被遣散时留用的专家。在历次北约F-16与前东德米-29的对抗演习中,F-16被杀得丢盔弃甲,吃尽了头瞄-R73组合的亏。作为紧急应对,美国和欧洲极大加速具有越肩发射能力的近程空空导弹和头显/头瞄的研制,90-00年代集中推出一批产品,总算弥补了差距。这个时代的高机动近程空空导弹今天依然是主力,如美国AIM-9X、德国IRIS-T、英国ASRAAM等,这个时代的头显与其说是头显,不如说是头瞄,只是把LED改成投影屏,在鄙视链上爬高了一格。

这也正好是F-35计划启动的时候,全功能头显作为关键射击要求加了进去。时代不同了,LCD显示解决了CRT的重量、尺寸、亮度、对比、反应速度、可靠性问题,数字技术与60年代更是不能相比。F-35的要求不只是把头显作为空战显示工具,还要去作为飞行、发动机、系统等基本显示,仪表板上的大屏低头显示器主要用作战术态势管理。

作为空战显示工具,头显也要能叠加红外、光电图像,作为增强现实使用。

在电脑时代长大的人,个个是电脑游戏的专家,从游戏玩家角度来看,这些功能水到渠成,不加上才是没有天理了。但现实与游戏不同,F-35研发早期的“13大罪状”之一就是头显,问题还挺大。

头显需要与飞行员的视线高度匹配,否则瞳距、焦距不匹配,就像戴了别人的眼睛一样,根本没法使用。F-35的飞行员头盔都是对人定制的,不可能抓起别人的头盔带上就飞。这带来成本和管理的问题,但毕竟是钱能解决的问题。更多的问题就不是钱能解决的了。

LCD比CRT轻、可靠,但依然够大够重,使得样品头显重量超过安全极限。飞行员头盔的主要功能是保护头部。高机动飞行时,头部磕碰座舱盖并非罕见。弹射的时候头盔更是要承受穿透座舱盖时的冲击力。重要的是,太重的头盔对飞行员的颈部是巨大的负担,弹射的时候更是可能直接折断飞行员的脖子。超重是不可接受的。

电子显示有本质滞后,但战斗机飞行员的头一直在动,需要头显画面一直在刷新。从成像芯片感受场景,到计算机处理形成图像,到显示系统根据环境亮度实时调整后实际显示,这一切都需要时间。用过早期微单照相机的人都知道,扫视画面的时候,EVF或者背屏图像不连贯,模糊,需要时间才能跟上。现在这个问题越来越小,用惯了“几乎没感觉”。但对于战机或者生存机会转瞬即逝的战斗机飞行员来说,“几乎”是不够的,而头显的画面比EVF或者背屏要大不知道多少倍,各种处理时间相应延长。

简单的图标、数据还好说,红外、光电图像要叠加到透明背景,用作增强现实的话,画面的亮度和反差要求非常高,既不能被环境光线冲淡到看不清,又不能喧宾夺主把背景画面“压制”没了。精细的图像处理可以解决这个问题,但那又需要时间。

F-35最后是用降低规格的头显才完成了研发,“理想头显”依然在伸手可及和遥不可及之间晃悠。

即使是简化版,电子东西多了,可靠性取决于最短的一块板,这块板还随时可变,造成系统可靠性问题。由于F-35头显不仅是作战工具,也是飞行工具,头显坏了,飞行员几乎没法正常驾驶飞机。有一次,一架陆战队F-35B在恶劣天气训练返航时,头显故障,图标乱跳,弄得飞行员心慌意乱,下滑和接地速度过高,复飞又没有足够滑跑距离,结果弹射跳伞。好玩的是,飞机自己晃晃悠悠飞起来了,维持了一段飞行,然后坠毁。

在事故调查中,飞行员认为自己很冤枉,头显弄得自己没法飞了,只好跳伞,但军方认为飞行员还是有责任,you are fired!

整个美国头显历史就是贪大求全、目标不切实际导致研发走弯路的历史,而苏联就是从应用出发的接地气道路。

苏联的头瞄没有走多远,然后就没有然后了。这是苏联科技发展水平和冷战结束的双重打击的结果。

中国头瞄/头显的发展秘而不宣,但从引进苏-27开始,中国就对头瞄有第一手认识,到歼-20、歼-35是否还死抱LED头瞄不放,官方不说,就只有“你猜”了。

不用猜的则是中国AI从应用入手,一面攀登一面创造价值,在自我回血中继续攀登,这是可持续的发展道路。美国AI由于“AGI伸手可及”的思维还在大量吸引投资,当前达到年投资1000亿美元水平,趋势还在增高,坊间直称这是“私人投资的经济刺激”(privately funded stimulus)。这是泡沫破裂前的最后疯狂,还是踩对点的无比英明,只有时间才能证明。

但越来越多的人开始担心AI投资回报的问题,一旦资金断链,美国AI发展要崩盘不说,资金黑洞可能引爆经济危机。这是建立在期望而不是回报基础上的投资和发展的问题。AI现在的发展阶段还真像当年美国头显下马而苏联头瞄大杀四方的时候。

五月 发表于 5 天前


刚好看到一篇推文。写的很外行,不过算是提到一个好案例。收购库卡的美的,将中式AI跟德式机器人结合起来。

https://mp.weixin.qq.com/s/yh1Cnf7kGxtRQlNfgvblog

推文

2025年初,湖北荆州沙市区的美的洗衣机工厂,突然开始热闹起来。福利路上的宿舍,陆陆续续搬进了很多人,还有很多是博士。2024年7月,美的集团确定了将AIGC作为战略项目,批了十位数的预算,只为了做一件事:送AI下“基层”。
在制造端,他们最初的设想,是在生产线上搭建一个AI 智能体(agent)。美的选中了刚投产几年的荆州洗衣机工厂,这个规划每年能生产1500万台洗衣机的工厂,集合了美的最新的设备和管理系统,最好的业务经验和应用。

晨枫 发表于 5 天前

五月 发表于 2025-9-1 14:06
刚好看到一篇推文。写的很外行,不过算是提到一个好案例。收购库卡的美的,将中式AI跟德式机器人结合起来 ...

真是文科生写的。

史节 发表于 5 天前

看过沈逸说对中美两国AI发展路径的不同,我觉得很有道理。
他讲美国是金融驱动模式,可以迅速集中大量资金到某个热炒话题中,而中国是政府主导的产业模式,由国家引导持续对产业进行投入或者扶持并吸引社会资本跟进。
但金融资本是超额利润的,要高额回报的,如果不能拿到高额回报,炒作的话题性就完蛋了,资金就不会持续流入了。因此,美国搞AGI是没办法的事情,因为只有搞成AGI才能拿回高额回报,起码这个故事才能讲的圆。搞成了AGI,实现了代差领先,各国就不得不乖乖的拿钱来买,投资者期望的高额回报才能实现。但如果AGI迟迟无法实现,或者不能落地,泡沫就会有破裂的那一天。说白了就是要实现技术超越构成的垄断地位。
中国是产业模式,并不追求超额利润,主张能够落地实现回报,政府方面能够收回投资就是好的,哪怕赔了一些,只要有产业落地也是可以接受的,主张在产业发展过程中逐步攀升技术,不能实现AGI,实现对生产部门的生产力的提高也是不错的成就。由于政府主导,主张普惠和免费,尽快营造生态,尽快实现科研落地与产业链的反馈线路。
这两条路线看起来会殊途同归,但对于美国来说,有一点非常可怕,AI中美之间没有拉开代差,美国看起来毕其功于一役,即便成功,由于存在中国这个可选择项,事实上已经瓦解了美国的垄断,那么垄断带来的超额利润就不要指望。AI公共产品方面,中国一定会选择免费或者低价路线,对于美国来说,会眼睁睁看着中国侵蚀他的躯体。
几个研究美国的UP,普遍一致的观点是美国已经丧失了大规模产业落地的能力,在这种情况下,美国想走产业路线不可能。而AI算力大规模落地,必须辅以大规模的能源建设,在双方已经有能源代差的局面下,未来美国在成本上是无论如何也不可能竞争过中国的。
对于美国来说,趁着金融资本发达,可以投入海量资金,在中国还没有在芯片等方面实现追赶和超越的阶段,投入海量算力,尽快实现AGI,这是最后的侥幸。

晨枫 发表于 5 天前

史节 发表于 2025-9-1 21:47
看过沈逸说对中美两国AI发展路径的不同,我觉得很有道理。
他讲美国是金融驱动模式,可以迅速集中大量资金 ...

这个分析非常好。很赞同。

sleepyr 发表于 5 天前

史节 发表于 2025-9-2 11:47
看过沈逸说对中美两国AI发展路径的不同,我觉得很有道理。
他讲美国是金融驱动模式,可以迅速集中大量资金 ...

我感觉可能硅谷和华尔街都对实现AGI过于乐观了,当然也可能他们也只是为了忽悠投资人故意表现的那么乐观。现在的AI大语言模型,我感觉本质上还是只是复杂的模式匹配,不具备真正的推理能力。对于模型训练数据中没有包含的知识,即使把这些知识加入到对话的上下文中,AI模型的理解能力也非常差,还会产生大量的幻觉。
硅谷现在都在炒作所谓的AGI奇点,还有人预言这个所谓奇点可能在未来的几周,或者几个月实现。到时候先达成的国家就可以永久的实现AI霸权,甚至是世界霸权。我对这观点是相当怀疑的。倒是中国现在这种AI+的模式,我感觉还是比较现实的。

大黑蚊子 发表于 5 天前

sleepyr 发表于 2025-9-2 17:40
我感觉可能硅谷和华尔街都对实现AGI过于乐观了,当然也可能他们也只是为了忽悠投资人故意表现的那么乐观 ...

openAI的说法是,Scaling laws尚未失效,给我足够的钱和能源,我就能够搞出AGI来

问题是中国这边也有足够的钱和市场,而且能源更便宜,芯片本身也不会成为不可逾越的拦路虎,Google都可以用TPU搞出Gemini,没理由中国人自己卷不出来

sleepyr 发表于 4 天前

大黑蚊子 发表于 2025-9-2 20:58
openAI的说法是,Scaling laws尚未失效,给我足够的钱和能源,我就能够搞出AGI来

问题是中国这边也有足 ...

山姆奥特曼应该不敢承认scaling law已经失效了,毕竟open-ai还没上市。就像当年马斯克的火星计划,牛先吹着,兑现时间一直往后推就行了,重点是不能让投资人丧失信心。现在这些AI大厂不断给大家植入一个观念,AGI的实现需要巨量的资源,所以只可能在这些已经手握资源的大厂实现,其他人根本没有机会。但是我感觉实现AGI不是能源和钱的问题,主要瓶颈应该还是数据和算法。以人脑的能耗水平来看,实现AGI不应该需要消耗那么多的能源和算力。

大黑蚊子 发表于 4 天前

sleepyr 发表于 2025-9-3 11:00
山姆奥特曼应该不敢承认scaling law已经失效了,毕竟open-ai还没上市。就像当年马斯克的火星计划,牛先吹 ...

以人脑为例,训练出相对合格的智能水平,往往需要耗时10余年来进行信息处理和训练,而AGI在训练成功后可以立刻化出算力限制下的无数分身,且每个分身都能达到AGI的水平

这两种路径到底谁耗能更多还真不好说呢

如果再考虑到人脑做出的很多推断和决定,往往也不是最优解的话,那以结果论英雄的情况下,同等能量消耗下人脑还是AGI更强也未可知

我在用AI的时候,有时候明显能够感觉到它在有意识的复用模式或者说--偷懒,这点跟人脑还是有点儿像的

赫然 发表于 3 天前

大黑蚊子 发表于 2025-9-3 10:31
以人脑为例,训练出相对合格的智能水平,往往需要耗时10余年来进行信息处理和训练,而AGI在训练成功后可 ...

从能量角度而言,我觉得,以后发展出来AGI的话,应该比人类靠谱。人类蛮可能是个高效但是错误率很高的LLM。
页: [1]
查看完整版本: 从历史看中美的AI发展之路