TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview, d/ K R+ h' E$ G7 y, J. v
R; c7 J& G" C" d
. e d8 T& H8 q5 m! g3 L" m/ O" g一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
# @6 z3 e8 \: L; X8 U( ], G v. [/ o' M$ \4 l8 R' S% ]3 b6 N+ O9 g" w
故事是这样的。
6 p1 d, D) W- t( E4 U5 z- d
B( N+ h+ a9 p& J( H! u8 Z4 q我今天看到这个新闻,看完之后愣了好几秒。
0 g* _: Z7 O/ n$ V! V- ~
, {& h6 x1 v0 O. v一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。, v) T4 A+ x+ ^, z* l
3 m- F6 T: y! y结果被一个AI模型给挖出来了。
; m: D. D: n; Z( y( y9 ]
. h6 \2 p/ a% R/ S/ D; b: s- @这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。/ f: e7 R/ S- G$ q- |. q; h- s* r( y
7 C8 Y1 A2 s0 g X$ d0 }然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
7 p0 ?& d: [* Q
# ~3 x) f1 h, _! yFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
, ?- b6 |: m+ z A. @. V; x0 Q4 s/ G
. `4 o/ f$ W) m5 P6 U然后呢?
# L4 P" [: M0 g. z/ ~- V9 R- U* \( E+ y, [5 i# i0 Z
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
! c/ ? ^/ h! Z7 f$ a5 G- i7 r9 e8 y$ M9 M4 r$ i/ ?2 y
这个项目,叫Glasswing。
; `, |2 [# s/ x3 Z* V0 i3 A" C- ?' B4 O% Q2 H" K) ?# F
glasswing
; U6 d: n i3 p, k# b
s4 N" L- R& Q& H; U, ?5 P0 _+ r& s0 o6 s. _
先说清楚Glasswing是什么。
& M) p3 C# L0 v) _( Y/ m8 k# g
, u" ]( C5 Z( `* D简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
; ~; D2 h8 J; t# T* Q; [ f4 ~
7 t% p% W# `% H* o0 E/ b0 D4 A有多强呢?8 x2 s) \2 r6 P" s& }+ c' H0 b9 L
+ z5 {2 c. f: |0 O" d1 o7 W! S5 q( Z
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。4 R( V8 j$ x& {% Y, g+ Y
. ~" ?6 O, o" v( A- R
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。% m8 n8 l4 W- ?. A: m
1 N+ H9 W( r. h差了13个百分点。2 W8 O* t! R1 s3 U) x. l
9 H2 N+ F' U: A: f0 i你说这13个百分点意味着什么?( S/ d# ~# h8 ~7 K% J6 t4 h
0 @- @! X4 f* N' E) P3 z4 ~
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
7 q1 S$ g6 x" Y8 _
, Q* i- }2 ?: m$ v& p9 ^意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
: q! f0 O7 p& d* r' F7 b6 X' E! u6 {7 S$ Q' F+ _8 [2 p
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。. G+ t' q, D9 p, ]% D+ Z/ N
% `& n$ W- b; `7 ~; N5 |
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。 | x4 a0 C% l5 ]8 c& H
1 P0 D- T, W7 } c* z# g
OpenBSD是个什么存在?/ [$ n! ~+ U1 k" V3 U& y
: x- B% Y( @+ h" F它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
2 l7 P) ^; m% M- t# e! E9 M4 A5 _4 Q$ d
这样的项目,代码审计了多少年了?二十多年。
7 |3 n3 a7 y3 z( W9 y; O9 c. _3 q W6 r( \
然后,一个漏洞,在里面躺了27年。
' {- f3 @; _4 u( v f# z; ?& |
8 S- ?8 `1 P9 c; P6 g/ z& e这说明什么?& G" y8 P* k' ^, ?
1 O& A. {/ W6 ]不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
$ I; z) T7 s/ } X! E
/ z4 o8 @8 P5 W( J) M) N x: ]但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。/ x6 M: p" O1 K, d& y) T* S$ E4 @
# w7 w8 Z/ j( v/ V* m! VMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
" s7 F( Y9 M1 h! L4 `' S
# o G; n; R2 s/ ?这种漏洞可怕在哪?
, J# |, e6 L6 W4 c* M
& _$ K7 J* {( ^. L# u* V5 I它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。4 d# b9 R$ r O2 X
+ v9 P4 H# K9 ?% `# \传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。- A( w& s7 I I) O
! s, y! m4 \6 F! }) P9 ^
FFmpeg那个例子更让我震撼。
" u1 Q+ O% o! @% e/ y) W# b5 Q
16年。
2 X* ~1 F$ U @! |2 q2 ?; @6 y% `. S$ e. H# I3 @
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
' v' v t/ }9 }- K
4 @; C- K+ \) f* }# E a2 o16年都没有人发现。然后Mythos Preview扫了一下,找到了。
# N+ }9 \& X" g6 i- ]
1 [8 A/ p2 E0 Y' R- m4 w注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
. H4 L0 q( h5 B9 e1 {7 d z! ^# V7 t z+ q# C9 x
这是主动防御,不是被动响应。
5 w! O) e* B% w/ C" e2 k9 G7 G0 Q0 }, w8 _5 X
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。7 [9 x H2 U1 i4 \
" m5 Z7 t4 x) n& l3 Y% g
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
4 J" u% P c- w" ]- }4 b& T" k/ C9 M
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。" T7 V0 J, h; Q s8 V
6 H- n# a* K5 C) E3 i# E
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
- L" R }2 Y7 {$ u
0 B2 R% u, {- @6 p9 l5 I% tGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
2 ~; V/ \ G e" y# p4 T3 k+ R3 U! a! X# I0 z
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。, K: \% G z" F1 d
- ?6 E' K1 w4 w5 t+ i+ z; ]你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。1 ]* v: T) K: b" |
9 B0 a& Z4 l$ V X/ \! K价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
0 Y _7 k- Q" U, r( ?9 p) T# _, L8 n' M" i" P) A( D
这个价格贵不贵?1 `3 c3 o2 M* r; a" K
! |9 p' T# q: G/ @5 X2 x对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。% Z: }! o5 W2 X' ?# \, {& }* t
! {# v) Q; ~. T, u( J, VMythos Preview能发现那些工具发现不了的漏洞。
! i) s2 f- U2 O0 E. g; J- N8 v8 M
5 A# M Q, S8 M1 X7 h' B这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。/ R! N& k1 L! ]4 T( h `+ ?) r0 O
% k/ T' Z8 x3 [, p9 B% ~% y, f
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
* k$ j+ ?3 T9 a5 B" _2 s' B# M- J
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。. ^; U5 J! h' g/ s: ?
" N+ E3 F6 W/ ^3 O$ ?* ~) t7 ^0 gFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
" C" r4 r1 I$ }0 M2 R* N% Z* l) P; p, C0 Y4 m
还有一个细节,我觉得特别有意思。
8 G# o+ E: j' W+ }1 q4 x6 N5 B7 {: v
漏洞发现之后,公开披露的时间是90天。
( _8 b2 x& T; E
9 p* N7 r1 ^4 j; V5 ^- a0 ~90天是什么概念?
; t: L- R5 l! U( A
@4 E5 X- F( y* o行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。# q6 L' l n2 ~
4 B4 h m5 ?4 n% [' v* _1 ~但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
' D) P f9 Z4 @/ t
& ^/ _/ o/ ^& J, b) ?5 KMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。; g0 m+ i- g( m4 Q. B& b
) _8 m. z5 Q/ W: X/ n
这意味着,漏洞披露的节奏,整个就变了。
7 q. T7 l- P9 x3 l5 D
" W- }! V' S0 ^# t# r以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
2 x% }" `3 L0 f5 E. y# F/ f* n% L9 o/ l. W" N( F! w9 q v
厂商的补丁开发速度,能不能跟上AI的发现速度?' _+ Y+ Q* [- D$ g- g1 J/ _6 M8 i
; K( c! V1 ^& N# @/ s
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。5 }% q2 X' I! b: S; c
+ W9 v0 Y- W ~$ M+ T% F8 {写到这儿,我突然想到了一个更大的问题。
' U" F! F' F5 P5 h% ^! X% ]; a5 f$ E8 y4 N1 D2 F6 i1 C+ W; a3 ~
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。0 u# b0 j0 L% B4 B
# \5 `* }& a& z0 |% l透明,意味着隐藏的东西变可见了。
7 s7 Z8 ]* Q; u& Y, \4 N
* D i8 D3 e! _# Q0 X一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。: P: G6 h2 T* g$ R! g# v
* p/ M( c B5 e/ q0 ]这个意象,放在漏洞挖掘上,太精准了。
0 t! ^ |. R) z. r8 T
* {9 X0 r+ w8 \: e u7 E代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
9 M) f2 E# C C$ u) a" c1 K- Z! c" k% W
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。+ ?: _9 i- E1 {: ]
. }6 _8 T& `$ b7 a
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
( L0 r* \+ t) S: I- E$ [. K1 z* {4 R, A$ P0 Q7 M
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。8 F8 R* r U) r* o
. S7 [1 n9 @# X7 Z0 O. f这是一件好事吗?
# D" S& t0 G- L6 W& M
/ O! h' D2 ^; h1 q/ F; \. s, K我觉得,短期内,这是一件非常非常好的事。1 l7 K' Q9 b5 h4 ~
7 G( a6 ?3 ^+ d8 U- \' f% J s全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?- q7 n) D+ l2 y; F# @/ g; J& m$ v
3 X' d _4 y* R0 }' I$ j/ p- }6 d这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
: r5 k5 S- h! B1 \0 `0 l
5 D0 @4 K# B1 v) b, PAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。! ]0 F" |6 ], E7 g9 _2 c! Q0 e2 V4 P
+ @% F2 B' Z& C! q( v/ R5 ?但长期呢?! w* K/ e2 ~; w0 P: z: M1 [6 M
+ F r# P* D! \3 ~2 d6 n4 P
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?, u) k* G. r0 \* n* N/ [
4 N, u0 k$ m2 C
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
8 m* {+ i4 ?5 U9 q, i5 q: S8 x) d8 \1 l) B. N" x
我也不知道。) w# Q2 _; _! c1 ]+ X, f
" e) T2 _5 N0 x但有一件事我特别想强调。
: B5 h! z# \2 b/ a0 W8 g
- l' X" r% a% {& d. D# P' G1 k这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。$ h' N" \* z" v! G! g- s
y K0 ^2 f! F6 H他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。. o8 M% F8 J7 H U
. b: H" G1 }7 s* y1 Q9 ?他们为什么还要加入这个联盟,用别人的AI?
2 y$ A0 i7 u# v+ g6 B1 D7 N% {0 r2 K( k. L1 k, a( t+ G3 U
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
$ z8 a, d _( {0 A; ?# b& L7 @% Q
7 r+ T5 j0 m/ L# o$ K. b全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。: R; k* s7 Y1 Q4 j+ s3 F
8 W; @1 q s$ K4 NMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。- P# d' x& n( ^% r
) g) D1 z1 k i2 \5 k2 E/ ]( ?这是规模效应。
! U3 ?1 ]& a$ F1 u+ e3 L2 ?
) ^9 @/ n+ o" ?$ V: w- [就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
! g7 E5 m7 I. U& m4 X' `& m3 k1 l( S" |
这个规模,是人类团队根本无法覆盖的。
; X# |0 a0 ~2 y q Q
1 t" X E( ?+ F+ b( \! l. y: FGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
: w% a: k) S4 N4 s+ R+ v3 I U- I0 y" P' k7 I* ]- ]+ T( U
什么意思?& X* d5 A0 @4 _$ z! l5 }+ g5 _! B/ n
5 N! c ?" |1 |& D" T0 C& x6 }现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
- J. U' [1 x/ s6 ^) K" ^
! M# E1 `$ ]' [( q! ]类似现在的ISO认证,但针对的是代码安全。
7 x: T. Y; C1 k8 L7 K ]3 m/ J
3 J2 [+ x2 @' N0 k* A" E4 h想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。. u y* }2 ^0 q1 [
" _* O6 _: I3 X' c* m" \
这不是不可能的。0 U; `8 R% E4 a5 ]" I/ h7 a4 f: r
* R( X; A, w g$ k1 z- k4 u
当然,路还很长。现在还只是第一步。但方向是对的。
$ g9 l2 K( @$ e+ {) g y. I/ ~: M" z0 _7 f G" U* n
好了,写了这么多,让我最后说几句掏心窝的话。
6 ~8 q0 y: h4 {& |3 B1 m3 t$ X: O/ B: q& A% g
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
. Y9 k4 Z! t' k l' ?1 {( ?# k8 l" ^8 m+ ]
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。, o0 i, v* M+ R: b f
3 }" M* D5 O9 [这次不一样。这次是AI在帮我们发现自己的脆弱点。
* {$ w8 x- f( i$ T$ j% o$ o
$ \% s3 Z3 V- [这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。4 p9 a6 z5 l% N
) B) |- g+ I" H+ _- t7 |6 \这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
# ? j3 N% v1 S. g! S8 R' C: h( r- l0 M
我怕的是什么呢?# k8 a7 {; s3 ]3 b
R' C( N! z6 b! \0 T我怕的是,这个工具,只有大公司用得起。
: _$ n, o2 B3 f {; G( c2 E( m# H7 v6 P
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
- I8 S" Z8 U Y; y" u+ F7 I. L$ W. f
4 M3 i- H% S4 E4 C) J1 zAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?- J* G7 t( @: S% c& B
2 G# b0 ^. z7 o4 b8 c: I0 _
这些问题,现在还没有答案。. X( s( ^, @* @# t
1 B' x) d- E3 e# a$ L
但有一点我特别想强调。, Q' l' g7 W* z$ k% p( D; \4 ~- I
n0 {$ N2 J8 u* P- K) M8 sGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
' M! m* E& _% ] n" d [
) c2 `, m+ @: u# V) m8 V' [: H以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。1 s9 Y. C( I8 i% @
% {" f U2 V; b( w4 z6 }
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
7 Z7 F' R- \ e: i, }2 V
0 c: c- a2 u3 e4 `- Z6 K& F当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。7 w- f1 w$ z2 e9 r/ b- C( b
; Y# C/ ]' u! v) z
这一天什么时候来?我不知道。可能5年,可能10年。; t- {- n1 @( B3 ~# _& S7 j
! q2 t, ]9 L9 E; H6 S# H
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
3 x% n/ e! y2 {. [, J5 F8 M |
评分
-
查看全部评分
|