爱吱声

标题: 玻璃之翼降临——Glasswing计划与Claude的Mythos Preview [打印本页]

作者: xiejin77    时间: 前天 07:45
标题: 玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
, T! L( l4 ^' |& P3 w! c8 s: k  f. j- z) [/ ^- q

! h1 L+ m/ }" _+ e5 E  [! x一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
; T+ a- n$ l' G2 ?( m2 `% P, X( ]$ \$ }& Z5 j
故事是这样的。
, u  K2 I, P) o. D2 u' b: y8 Z
! k7 `8 \0 _$ b9 {* p我今天看到这个新闻,看完之后愣了好几秒。8 A$ {; p) A( x) q
$ h/ k! x( `# J- A# a  e) \' ?
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
: o8 `2 X' ]5 ]4 {3 Z' y7 R+ r+ z7 Q- [0 H$ K; V9 t
结果被一个AI模型给挖出来了。
: B* w3 W1 m) }9 U1 l
' n! k! t' I, d; i- e这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
) v$ d5 b. `) x8 A; k  a# L' a$ E/ t
7 c- R* O6 J: ]2 H然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。4 j+ w6 s. K. \

& Z! o) ?) C/ Q( n5 T! }FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。& @5 C+ S$ b+ N$ T
8 @' Z2 l$ ^4 ]$ I: m
然后呢?# R! |5 \* W, `, q9 w

( X- n: R2 x+ b# U9 K然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。$ m7 L/ \: n7 `$ v9 |  \& N4 Y
" ]& \8 X5 V% M4 m1 j7 L
这个项目,叫Glasswing。

) M! o; X, Q% Q1 |. |5 P. e+ |
# I( a- l! s2 C" a
glasswing
, j! A6 }+ F2 P9 d: b6 z* u4 J. x6 R" A5 @8 \! y

. p1 o# ^( O, Q7 {( J先说清楚Glasswing是什么。3 N+ d) i! I/ Z% G/ V$ f( Y/ V& s# l

! t# z% L. |, R简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
$ F0 {# Q$ U$ ?: L) s: C
9 q8 x1 I/ J  G* O2 `有多强呢?1 n' H. c- t) M+ N, j$ |
0 s7 ?* j/ e- X0 A
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
7 x* F# U/ I1 ]/ F! D) F, l
) g3 E, e" ]3 nSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
% J2 J+ z; c- V. e& l
% m# E6 O$ b3 c) u+ ]: `+ }差了13个百分点。
; T$ b' E! q& [) K% c/ r, p
- M. s2 y; A' C2 k- ^你说这13个百分点意味着什么?' j1 a4 v- m. t. r3 ?: v" g* N
! h+ N* d. F/ x3 e2 }6 j& U
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
7 Y  }9 h  _. \' U" G* T9 D6 N' ~* A5 {3 z7 T/ h
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。) |* w' F( d* |

; v: Z5 V5 b& E0 L, @: K3 u5 C或者说,这种级别的漏洞发现速度,会比以前快几个数量级。! ~% K  W$ s2 Y/ b* X, i1 e
( M1 O; O# C4 i/ V. f
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。% F# h% m0 K& b% _  S& B* _
3 c  a8 t1 i1 Z# L4 F
OpenBSD是个什么存在?
  Y' k/ f/ D  |1 J+ b& s/ p1 K& d" C+ A7 K5 n
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
. d8 R  h$ h1 M1 M0 r- C1 p6 E7 _7 @; u7 O
这样的项目,代码审计了多少年了?二十多年。2 h1 I# S* h9 o. j: I

+ S* w, H5 F7 _. ~然后,一个漏洞,在里面躺了27年。" H) J7 W: C7 J

5 E  U6 x/ A9 r! ]这说明什么?
+ F5 \3 [- L: {0 m5 x+ I: B; N
& Q& }4 g; N6 |, @& q. \( t$ g不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。% L& q7 [2 @* b
' D- H  l4 ~9 q
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
! H' S, ]# G2 y9 O; u. a0 j5 r. F# G2 B7 k; [
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
: ~' |3 N+ Z. k/ D- _1 j. i
$ ]: [* _6 q5 S5 R' `, o- W这种漏洞可怕在哪?, ]! ]! F5 |$ z
3 U  `: ~4 Q' K3 a
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。" L- h/ L2 ^2 \$ G, l5 E: u" j, }+ |

2 l, n* ]* v( ?$ ]0 v/ Z3 w传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。( }* A; K/ T% L
# x* ~5 Y  t0 |. [
FFmpeg那个例子更让我震撼。& `! h1 a; }0 u+ a

" x8 w% L+ O" f; B8 j4 {16年。" ]7 ~1 c- m1 L. P, Q! Y
1 n# ~  r! N8 N" u- _! u
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
$ V0 q+ f3 _) i( ^( W2 \  o
2 @4 z; k$ y0 L, l" i/ j& ?4 Q# S16年都没有人发现。然后Mythos Preview扫了一下,找到了。( m( u0 G* L  x" ~/ l/ R/ [

' V2 h; R* o# d! y4 `$ G' ^7 C注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
1 N: c, M" [4 |0 m+ i) {, X0 ?8 D6 l7 }) A/ q
这是主动防御,不是被动响应。; K& b4 A) Z4 R; Z) H; @) z

/ A( X+ E8 Y) R) C1 A. ^; q3 ^传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
8 }# n8 h6 v) J& V( v- e- R
: \  I9 J1 P) f( I  j7 e! l% W) jAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
- e2 o( F, E0 f$ H  @% Q2 e
% F' ?" Q* C6 M; q) h这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。) s* X& R0 p" Z. C
' g9 Z9 A( {& k9 |- ^4 t5 R  f9 ^; P
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。6 v. O$ |& X4 M; V6 r5 w

' |' q7 _4 W. [6 w" `% _, dGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
8 P/ M" c0 P5 E$ D
: p' J) N9 g+ z/ L" s这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。* M$ z$ @* d) X0 r
: d% g. f8 k: Y# A5 R" N
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。2 S8 R5 n1 a: U
8 j# `& i' x' \9 O2 I$ g
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。" t. O) l) Q) Z$ D5 L2 G3 [* ?" p

4 G) @- r) P+ {1 O" @这个价格贵不贵?2 r- g2 S1 I& a, r5 e
6 |$ r. N9 W% Z
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。3 j# _9 ^' U* Y9 }- i  V
, X$ }  |- N+ V2 P  Z4 s
Mythos Preview能发现那些工具发现不了的漏洞。
! R  i7 [% ?" [0 B- V* t; k6 F3 U" b) a
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。9 q) R) i- T, i9 h+ W' A) w6 e5 F

1 {- ~+ w, E9 |( x; p- `! V另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。+ L' h! S5 U" W* J4 g1 ]1 P. K
# u/ i1 Z7 [3 ?$ i! Z
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。. m3 X, ]3 `4 S/ {, p

7 [1 w" B: E* E9 `' O7 Z- v+ v1 nFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
# B; p) G+ A* R2 G1 F9 [0 z
) B/ s) q, o- t- R' l还有一个细节,我觉得特别有意思。# E" M: _) v/ b- I6 E2 {

! g% ~% p3 \: S" u漏洞发现之后,公开披露的时间是90天。" Z7 K  X( o* h, J
3 H; `2 P% s/ w* F
90天是什么概念?" h2 H/ x, M) m6 }5 `
  d/ H3 P8 C5 B- l1 d$ M5 G1 R- Y: y
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。% H0 U0 w7 R; j# j

* u  E, s# `% `! _% w但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
0 `- Y; n2 t$ A2 U5 n  K. R( i' N# x
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。0 [/ {+ H3 }1 s, @! `2 {7 _& [" W/ G* u
/ k" W/ B5 S3 t
这意味着,漏洞披露的节奏,整个就变了。
; F+ |% V0 O0 g/ A* V9 |
! c) w: D: Y- w: u% w9 S% ]以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。  a. k) [8 r9 k' {5 E: g

; d- ~# d, m; [% b0 H: S厂商的补丁开发速度,能不能跟上AI的发现速度?
/ l( t" M2 E1 J/ B0 _! \5 u; c6 |3 S* o) o- P' ?
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
: O/ ^9 G/ d7 u# t' h7 z
, c( s  ~0 S- _0 q; ^% ^写到这儿,我突然想到了一个更大的问题。
6 M* ?7 r6 Y+ z; _. C8 N+ _" Z* n1 \( g) f& a
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
0 O2 j; \$ H0 ], e) `' `; K' z* q' ]
透明,意味着隐藏的东西变可见了。
7 M" ~9 @$ \& f  d) L9 V4 u% I9 Z
  O! G7 W! @- o7 Y# D) z: f一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
. g( }! d2 b# @. X' n" w) `0 H/ Q3 U% v/ Q& G6 u
这个意象,放在漏洞挖掘上,太精准了。& I& f! a: w2 H. ~

$ Y3 a& a8 |0 E* x; j1 F4 I# U代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。. @1 ]; q5 G. S" [5 `, n
6 {8 _2 `$ @; }( Y
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。( y; O& O/ ~( j7 C9 x

$ D7 [! B" }5 S4 z但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。' _5 i) f5 l& D* N* x% ]) b
/ u( b4 `; R0 n: m5 O
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。# V1 `3 S5 o! c0 ]! {
- Z. \1 e: S: v  u# d3 N4 T
这是一件好事吗?" l- y6 Q7 w2 u5 @9 D0 z
+ f' {" Z1 r8 ~. U5 s- S- A/ M
我觉得,短期内,这是一件非常非常好的事。# E  A% A  o* [, g  |
7 F1 ?8 e9 K% X5 U# ^/ I, P
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?1 ^0 h. q6 Z. E4 n9 D' R: m

7 G. W7 \3 b3 _. v! [这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。* }, q7 g1 x/ [. \
, u" k0 f  T0 g7 c
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。. e& j1 q6 _- \5 B( U: V( j  c7 t

; `. q( y, d: E7 d9 Q2 l# m但长期呢?
5 l' D# x9 t% W* o# r/ p4 b% }( F+ T! c+ j4 u7 D
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
$ K& @( O, Y% p# D1 a, o7 J2 x
1 \- z8 I0 `3 k( L( Y* R! f是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?' k. w6 Z' h, [. ~
- q' X# w" N% A/ h& k  B; o% Q4 f
我也不知道。
" x/ Y% u! L) o
, e9 U, J1 G' [1 Q& v, q( {: {但有一件事我特别想强调。! Q& d0 a4 ]  W5 u( S4 `5 N
& {/ |+ z- }0 j8 R6 K" S
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
6 ?+ |. \) A, I7 a
) T( E4 [7 ?; w0 R& c" c; i8 J9 @他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。5 p% V! E. M7 b1 D5 p
, n1 u2 T7 t; c" t/ ?0 G
他们为什么还要加入这个联盟,用别人的AI?  L1 c% B& h+ i) `& r- |% y
* {( U  W) x1 ~
我大胆猜测一下:因为挖漏洞这件事,规模太大了。  K. g4 B4 L8 a
. r, }9 N# ^3 w3 C" z
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。% j6 z$ ?( a. v  p

$ D8 V+ e% D/ h' S, d, F1 zMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
2 e1 [/ M+ s: M( ~/ h, W( Z! C/ G, o
* S; @2 c: j/ F$ S: t! m这是规模效应。
% g" h1 @9 c& s0 }& W. U! v  K( }& z
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。+ J: p& P$ X. I# `. ^: M

# o# J. H# H4 b& d这个规模,是人类团队根本无法覆盖的。. h) B: C, B" z

/ [& e2 j7 o* n- }1 x$ ^1 jGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
1 v( w( m) i6 c& i& s& S0 V) S0 {7 O( e$ @0 q# N( \0 n
什么意思?
. z9 [5 _. _) U+ P' i, J' c* C1 y9 Y: F- b
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。# h; D! \6 f% H3 y6 l# e! u
7 K# ~" @  W( r1 k
类似现在的ISO认证,但针对的是代码安全。
- q4 ^# F$ ~* y; k" O* ?; g* Q, a! M- s  X9 I
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。9 G2 |& T1 A5 R- J

, O7 d) a2 L: c. b: @: g这不是不可能的。# }) P, V; J0 k8 Y3 _
) h' F0 S( D2 v
当然,路还很长。现在还只是第一步。但方向是对的。
3 X# V5 I4 X7 }' A4 |( E
0 T/ P) k) {# R5 ?7 R4 f( N2 z6 F9 @好了,写了这么多,让我最后说几句掏心窝的话。
9 Y  e/ c6 E/ S: i! J6 [& A0 F4 R1 U' i; [! R( d- y2 ?  L
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。0 [  i9 H$ N. |8 V

- N" `9 I9 s/ y兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
/ F  z) H* E) d: ~
6 g4 Y* s8 M$ A! r' c$ g! \这次不一样。这次是AI在帮我们发现自己的脆弱点。4 M$ E  O; k/ [% L( _+ @

8 ~+ c& p& ^& A0 \% N这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
6 h/ R( N  g+ X# U$ w( B9 d& ]' @& M9 P: Y" o
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
6 R1 f, f1 b% @
. z' {& ?. ^5 g! l+ q, I我怕的是什么呢?* \+ q* d/ I) v; E* S9 ^
  k/ i0 \, G+ L* Y; {* Y9 F
我怕的是,这个工具,只有大公司用得起。
. L1 m& ]3 g% i( M. u: h, t$ g. U( |7 v
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?: ^2 j  n2 j6 K
; f' e9 i8 e* M  Z& ?" y
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?. I' [+ Q  `# t' I
* L3 o+ G+ q% x
这些问题,现在还没有答案。9 F( }6 C; R2 F) F) _- R) j& B
4 |! s0 y) o) [5 X% O  G
但有一点我特别想强调。
) X5 Q5 b' V6 l0 @0 s- X
: X  n- U: i$ Y* m' k0 W  WGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。/ J( M  h2 s0 r; Y& n7 x2 ?+ y/ o* y
; O. W- A0 @0 H  E' z$ e
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
) j- M% k* l+ v: }2 j+ J
$ V/ w0 H5 x& `) `AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。5 s4 P# H% Q- ^2 S' Y% ^( T! ]
/ F1 Z1 |! Y, E+ A# U, ~$ R7 x3 |; r
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
) z6 f& ]% v, H# b- Z" |0 C1 q/ x# s* m% \: G
这一天什么时候来?我不知道。可能5年,可能10年。! \6 _( a: m6 J4 d4 c

" u3 m- Z. M2 @. E+ G$ {  L: o但Glasswing,让我第一次觉得,这件事不是痴人说梦了。

) }) d: M6 i" `- T1 g' g
作者: aniu    时间: 前天 09:53
联想到了Snowden曝光的棱镜PRISM
作者: xiejin77    时间: 前天 09:56
aniu 发表于 2026-4-9 09:534 x( P# W* Z4 b5 o- p
联想到了Snowden曝光的棱镜PRISM

# g' s- Q. s4 j# l大模型大大降低了此类工具的门槛,之前国内的安全夺旗竞赛,几个夺冠的团队好像都用了AI,最狠的一个用了五个codex自动渗透攻击;反复迭代。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2