TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview3 o* y% c' r$ ?0 O' k# D; ]$ W
, K! c, s- z6 e: t' a/ B5 `
& C2 R# e6 M3 C5 W* S
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
8 ]6 Q+ V# c4 N3 x! Q! h% o3 t8 U3 P2 u# M9 n) G0 r6 ~
故事是这样的。' q) Y: v0 q6 _ B& v6 a2 C
, S' U2 W( G2 C$ a/ Y$ }$ T! \我今天看到这个新闻,看完之后愣了好几秒。& X% h! e& Q) T
* \! a4 x x/ h: C* A: }9 x, @
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。2 b" J$ D+ I* ~7 U z' z3 J
r- t! f a- h- C) f5 }) ]* [
结果被一个AI模型给挖出来了。
2 _: [+ ^: F) a! d; _% g- [
$ l. a; x3 i8 i0 D! [这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。& J4 N* A, }8 Y9 j
. Q7 N) w7 Y, ~+ x
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。' c1 P7 ?) L$ H+ x
+ ^4 g, C% {3 F' YFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。; O6 w! X! s$ ^# ]& I9 L
J, s- Z, a2 @! T然后呢?
6 p/ J* D1 Q% I6 e% m+ @9 m" _
: S+ d/ D" G4 S, l然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。+ f0 i' f# q% A4 q5 _
0 C( [( H/ P. F" T. a4 x$ T
这个项目,叫Glasswing。( J# K9 s+ q# z6 o5 E
- [" A; W/ s3 w0 A' @$ T w3 Uglasswing3 G7 E3 H& ?5 V7 X9 z% L
- w- c' I# t; K9 I* d1 V& @. P' s2 H: B
先说清楚Glasswing是什么。+ q' O5 H! e" m3 o: z
! h4 x% z0 a+ G( w( s& U; V6 B
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。9 e. v5 w3 ^2 _% p7 k
2 y6 @: z) Y3 I3 L$ W, x! o有多强呢?4 t, y( E. G5 J% \# s
0 m' `, r. A0 z
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。+ k+ ]5 q( H* H9 l3 N' p( W6 |
: R1 d7 h' |; ?% L% P3 z* kSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
0 C7 [, `& f. Z! Z% _# g/ a
: H2 l/ k+ Y8 R" m差了13个百分点。
6 F, K0 N( f5 E# A& B( O3 T
) m+ l) p6 y, U0 Q7 Q" K% V8 m你说这13个百分点意味着什么?+ @! _. x* L% s" Y7 z
. V! T& |* |1 s意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。1 R) \: k b3 j0 l/ I4 W% s
2 B% I, k b) J: r, v7 U, E
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。9 \+ @0 T4 z \' ?6 y" a9 U
$ |9 `* \, o1 [; U3 r
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
& t4 L* I" {" h/ d; E# T G. Y4 v% {3 P& Q& H; a
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
$ y1 }" l L7 o' E* f$ k, [1 g; o _; X1 L( w8 G o+ C- g
OpenBSD是个什么存在?
5 m6 @) T+ x/ i. h( ?, Y+ B y" V- Q: }5 ?6 j! L! w, b/ ~; J, n; ~/ Z3 b" F
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。# `8 J; Z7 F$ j# c
* C" Y( C2 f3 g8 d7 e, ^这样的项目,代码审计了多少年了?二十多年。. l$ r1 a1 x- e' W
- a! u q c; `# t
然后,一个漏洞,在里面躺了27年。; T% \) B( B6 h0 @9 d: K
) u+ J9 H7 s$ C/ P6 r这说明什么?
% A! r" c# |4 ~# O8 G; {4 b' w% R5 Q0 `
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。6 G4 N' |! t/ z9 h3 B- o$ y
! @; d1 V5 R0 m6 X
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。( L7 S8 ^/ D8 ]) _( J% k8 v) M6 k
2 D/ u9 x0 s/ Q$ t0 Q+ @& i
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。, j5 Y7 i8 ~& P7 J
& y% d8 f7 |! w这种漏洞可怕在哪?' H% y7 ~" Q( ^; a0 F7 G& K
, Z9 Z/ m( W! U" s它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
, U/ u; ]; ~# d7 R9 `2 H0 Z
}- S v' ^; R& w6 {! o+ t传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
3 s% M9 J0 r9 \) I! z' {
0 }" E9 j* B- S: |, QFFmpeg那个例子更让我震撼。
3 t" z, a3 W( C( J: Y% i6 x
5 v# m8 b$ f; R/ h# b16年。- r$ V# x4 l1 x0 `# W/ k3 I
& S" y4 X* {2 b' FFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。: U; `% W( M, _) {# \0 P
. E6 K+ F( k+ i5 i5 C5 g/ `16年都没有人发现。然后Mythos Preview扫了一下,找到了。
2 X- z2 r! I) C0 v
0 B+ g. s5 j" ]1 b注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
( [7 l& D- M% \0 ]
& O4 P+ e: |4 b( Q4 J1 j) \这是主动防御,不是被动响应。8 x9 a- m5 w- K- r) c( k
5 `+ a5 m d1 }
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。3 k1 B9 B) l$ \8 j( ^" Z$ o! j
" V4 a4 C7 f# ? }AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
c& x7 W- R# P+ ?9 U! j W$ {- a" g
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
3 z+ T7 A! B+ }9 B# y- w4 ?/ \3 Z7 s1 z0 \ a
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。2 S2 J7 M0 Q3 ]' X" E
+ }6 R. |% U& ]0 fGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
% Y7 j) Y4 `1 v/ F0 i( _+ S; g! q- a) i
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
4 M7 s7 j2 o% s( x# H# P2 ~; C' P" f: K7 L4 P8 Z0 o$ K
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
- L. t& V+ P8 j, J, A$ X+ |, ^& L
/ d d' g7 W; z价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
: C0 s& s. X6 |0 j' t4 Q
$ A: X) |- V1 [4 L- G这个价格贵不贵?0 y8 p, ?" P- J# k8 T
2 r9 R G* h3 W' @
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
& d/ a, M& P2 I) A
2 e7 Q; a0 V" Q/ y$ l- AMythos Preview能发现那些工具发现不了的漏洞。
0 P) b' Z" w: B) F4 b1 u
6 r6 i' _0 | \5 _# I) \这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
- L$ P1 N' b4 D$ {- b* P' j
) b) e0 O2 Y: h$ S* x$ z另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
+ b! E$ ~: L3 t
& {; M2 N9 b- j5 y# L这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。# I/ h8 C2 b* E1 G4 f+ K3 P
/ x: j9 W' r }3 C
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
" _( R( U( Y/ F6 U5 W& A1 E' D) ^1 U% G% r# G+ d
还有一个细节,我觉得特别有意思。' ?; K5 p1 }$ L3 N9 \7 }" L
* l* `9 P* L, @ r- ^! y2 _4 l漏洞发现之后,公开披露的时间是90天。' @" K% I! Z2 F" V! p
" q& `+ o5 G0 i90天是什么概念?
6 E- N( t" o/ W- r4 R) N8 G* y) X! _4 G1 ?
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。- `$ h. W. K0 g! d! e
* L2 C0 k4 @+ C9 T7 T& z& z: \# M$ ~2 F3 }但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。4 G& j' q; H+ |: b4 b
$ b8 z2 q& ^6 F4 G6 pMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
6 E, ]1 U- o u& V# x; g l4 H% F5 x4 n8 \, K0 C; P( g5 b7 ?
这意味着,漏洞披露的节奏,整个就变了。! N1 y1 \9 Q5 ?& q& @% v; t
6 d j" ?2 J. I8 M( F% C以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
6 b4 P* _# o7 z1 R1 j4 v! K
- o* i) V9 y: ^$ S" f) k" Y厂商的补丁开发速度,能不能跟上AI的发现速度?" l* @* u. i, ~+ S# V0 \2 l
8 f- b: n5 ^5 X1 }$ y+ s
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
5 N! n( \8 C3 ^: D" d0 B+ L* D* |, E* j0 F
写到这儿,我突然想到了一个更大的问题。
% ~) H9 h% {+ ~3 O! z8 x$ o3 K5 r; a% f5 i* [
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。8 q* q6 n% d; `6 o4 ]
/ i" W6 X& g/ J0 @' z9 j透明,意味着隐藏的东西变可见了。
( X1 {8 i$ P8 k( \" y
6 o: r0 T0 h( U; A' I& o7 W0 K一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。* `& b' E- |! L
+ n) r) \$ @9 `这个意象,放在漏洞挖掘上,太精准了。
L% p# a6 {- l: ? A3 r- C: X( ]$ V& r( a$ ]! ^
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
4 k9 {9 [& y4 \. [" l& B1 L! n9 b& F8 S
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。' b6 i% X1 @9 V
h$ d9 L' B6 O8 _
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
$ s Y* `. S$ J9 q. k5 w' d6 z$ c3 Y+ P! M! M' i4 ~. P
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
: l5 }% l/ B; n* ^; X& U% C6 B+ W7 b# |( s. {! w( U
这是一件好事吗?6 H6 w8 r# p8 I; v: G
9 t: u* c9 N4 C5 @3 e我觉得,短期内,这是一件非常非常好的事。/ J3 @) X% k C6 E- I4 t) e+ S
. n3 A: ?; t, W% Y: s, E, x% I
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
, I1 h0 I- q$ A) h( r& [# H4 o3 Z [- G1 W7 [6 `# |0 Q+ ~
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
1 ^: O: A0 I) }4 U0 l: A7 M3 T; C5 v6 d/ F$ g6 L
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。 I( O; x& [2 j8 B9 e. P: M
& }; R, j# G8 e h" W( a }但长期呢?6 ~- {! U" u7 ~. @" p# D
! A0 ~5 U% o- V9 P$ F
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
2 |' z2 p1 e8 B( g6 N; {2 I1 V' i2 h5 p1 H8 m7 A! f) U6 ~7 k( v
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?. j3 I+ P1 M; B7 g7 d
: a7 a* _0 G* B* s2 D我也不知道。% U& L. j9 }5 @7 c* E
" A& m5 D; |8 c1 |2 y但有一件事我特别想强调。) A1 z4 c2 ]2 F1 l2 W% O" g
. @0 e p5 ^& ]) O
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。* C0 s4 n* S+ }& u7 {! l; I$ U4 v, X
) j( F6 T( B# O' ?他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。- {. Q/ b, a' o* h
4 `# v" f) h3 m
他们为什么还要加入这个联盟,用别人的AI?
6 h+ ^; ?0 D6 m4 T/ N. d
! ]3 h" q3 M) j我大胆猜测一下:因为挖漏洞这件事,规模太大了。
5 |$ B8 U$ b! e, y( g" z0 P0 \# G4 Y2 B; k# ^ m* z2 @
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
4 _0 n/ F' \5 \6 w5 ^* [: Q; ^3 F5 A# [5 d5 d
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。+ A% I5 m: V$ V0 r
/ L* z4 S6 c3 \5 U6 B- h& F
这是规模效应。
# V Q5 ~! f+ ]6 |) Y3 t
$ f3 Q4 P' H- s4 c' j8 Z2 d c就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
# o/ Z5 ?( D2 s& u; y+ w. n
8 }6 }1 v4 i6 h, b. M. |! N这个规模,是人类团队根本无法覆盖的。
G8 |9 P% V# v [$ c' N7 f' y+ r; [, v7 `% K `) I9 y( r e
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
8 G& k) Q+ C9 `$ O$ Q0 @) x- x- E2 d+ u8 n1 D
什么意思?
# Z$ ?/ C, g) H0 q: g: `4 ?$ a0 d& C8 K6 T
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
: h) P. x5 N5 ~% L+ @8 G. v. C% V; L8 l9 A- O, m8 B
类似现在的ISO认证,但针对的是代码安全。
y b& z5 k. w G! O; I6 s% `! A6 Q+ Z b3 k0 Z2 A
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
G9 \) G% ~9 P1 B3 [
& t: ?, u) }! V7 ^' @3 I这不是不可能的。" D* S, m: r8 |/ j0 r0 S4 H
& k& ^" O0 T. U6 z+ w$ O- y当然,路还很长。现在还只是第一步。但方向是对的。
# J/ J2 g; E4 f0 z! E+ _! Q, F$ d V. X* T
好了,写了这么多,让我最后说几句掏心窝的话。
: l6 D' o8 o, n) i. t: _: l; }$ h) i# a# W3 `8 f- `$ P6 ~( o0 N
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
6 ~5 ^$ j* O' c. g9 I8 h% S. H! f7 ?& z5 L* c, [, L7 f2 C4 x
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。6 u, c3 I9 U3 J, \2 ^4 i
9 Q) W- e$ C; M- }$ n这次不一样。这次是AI在帮我们发现自己的脆弱点。: ^! ^ |3 g x- \8 P4 X
) i( o. J; b: N/ \* B8 v
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
1 g A" A$ `. T: S+ v8 Z6 w* o
" _$ k0 b& j" C8 Y这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。3 Q+ @: N- {' ?- p- c8 V
3 l+ j0 \* f5 g; p" F我怕的是什么呢?0 T! N3 x8 U7 @* ^
3 j3 B7 K0 W# x: a* x% D7 ]我怕的是,这个工具,只有大公司用得起。* M' V9 |; N; D7 c
2 x7 z, Z$ u) U* b+ N) rAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
5 P& x" E: f+ n' w: t5 E+ R% K' l# P d# b/ T- }. J
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
3 i/ W# `$ ^# }; L8 |. y
& n2 Y& Z2 t$ w- M这些问题,现在还没有答案。
) W' O- c% ^5 r0 h) \+ ]5 {: t7 w# m: }4 Y
但有一点我特别想强调。
$ Y8 I5 [& D& W" V
* @4 }7 N1 D( A* _9 ?- HGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
8 w* f/ |% z1 M, c% D
6 U* b9 d! C& y% d: I! L7 n4 @以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
5 g d Y! a/ v6 E( l
: @1 I! A* y. o8 @ j5 `5 n3 eAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。: t$ f1 f" l$ c7 [! O* H5 M
$ ]" D2 P6 s6 P9 `: E$ {6 h
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
! N& T/ F2 W% w% c) ]7 r7 i$ O
4 K# l; Y6 o5 F' z这一天什么时候来?我不知道。可能5年,可能10年。% R y* s* Z4 D8 e. y1 V
k2 U+ v' p* Q; x' O' l6 c9 h
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
3 F; {6 i1 }1 Z- x |
评分
-
查看全部评分
|