TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview, A5 A7 R5 M( s7 x
5 Q B9 i% y1 V7 r% E; `$ X& M% e' c( y) o- k; p
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
% C9 }) o N- U- q- a7 d* A# G& J3 h9 N N# T# F8 Y
故事是这样的。
# F! R6 E2 d$ L9 L; y' x* U2 L& w5 Y, L: m& \0 _
我今天看到这个新闻,看完之后愣了好几秒。2 Q- P8 _; j/ M2 t
; L: } L, y" E* c- T4 }
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。 q/ D# }9 N0 e2 Q. {1 b
0 S+ f( d% u1 z& Y9 i
结果被一个AI模型给挖出来了。$ i- P8 r$ R3 h9 y6 [! B {
" L, ^7 c {- n# h& G8 R
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
" v* q) @5 L1 }1 k* @3 z5 Z9 v/ t# i+ l/ O, {
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。 ~4 X, Q) E. {# w
: K u; W& a- S6 P% i
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
6 m. D. N; |9 S3 O w1 ^6 p/ Q* j6 G/ Z$ W4 l2 }3 u8 G! f
然后呢?
1 z- v- ]6 K% J6 t) i/ t5 R
. [0 G* c& W& D8 m然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
2 n* R; O* f8 m9 w& ~/ K7 ?3 K* n, r: E# |( s) |' g) H7 ~
这个项目,叫Glasswing。
7 H6 ~! g' c, d. P# p- P" L c6 b6 q* K" X) _5 r" T. E# E
glasswing
9 h/ Q* e- `) q1 ?/ m5 m* v4 M9 C) f/ o+ S* X
+ S- G5 p8 e9 g0 {4 u9 K
先说清楚Glasswing是什么。3 V/ j6 B$ \/ J" G8 E
% K& B1 l5 ] d, S1 f8 c
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。0 f# q. M3 t/ Q
" s+ }$ S* u; P, |* S9 t有多强呢?
5 x q+ B. r6 y7 u$ J
( f1 j8 U! B& ~CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
* s* T) V$ }- `" z' ]" {8 p1 x7 {2 U' u. V7 S _; M
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
$ `+ I9 o4 {) L3 m9 G$ I4 u) h3 F! d4 v, U4 [, x- b& Z
差了13个百分点。
/ X- f$ d* x8 O, ^
! G: E; T* D! B5 j" G7 T4 J2 {你说这13个百分点意味着什么?7 @, n' w. v. U8 F7 Q; \9 W
: p, l* ?' Q# A" q) g! {" R0 c! k& D
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。$ J. Q3 z! Q; B- N. P! p- P5 F) M( _0 J
L* F0 V ^# I
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
4 s9 \9 b% J% q" H' x
& q8 U8 Q2 l! `3 k* g4 s或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
+ A9 M) F+ w3 v7 W3 F9 p! h$ o7 b7 D6 s0 u6 X s( g% }
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。8 j7 X8 t3 V& J$ I
/ _$ m% O. J. m( E9 [
OpenBSD是个什么存在?7 ]5 z% \1 r g0 C! A
: j' h3 U y+ o- w7 p4 ?6 B) e它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。4 v$ ]0 V. Q! N8 e/ E) r, W$ S
8 _. I" H- p# k$ U' x* v2 L
这样的项目,代码审计了多少年了?二十多年。, O; g1 o. J4 D s
: {! G2 i7 D8 g# `+ r' x
然后,一个漏洞,在里面躺了27年。. B4 _0 E* F+ Z% P E, d8 d
# T. u% F g" ?- h这说明什么?" f" f$ p: x! I7 E
+ z( W" r. }1 Q- [
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。) x% {: H9 j6 N- r c' a
* }# r* g e7 Z- _. }: ]但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
! ]2 j9 B/ K- r/ e9 N4 g) M
3 o, h! K n9 m/ e2 t2 ~% ~) H/ \Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。; U/ P! N1 {6 [4 M8 H2 l1 @
+ \1 ?1 t C3 o这种漏洞可怕在哪?* _3 W; L* w% k# m/ m
8 [. z- a, i1 J7 `它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。+ C: Y+ ]5 e G+ w, D
% N3 p& Y. h0 Z6 p: U传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
, U- U) D2 m/ \3 H
6 E4 F+ J( f6 J8 `5 z" o3 ^FFmpeg那个例子更让我震撼。
1 W9 X- j' J5 \- L U8 i" G( a- f; ~( F+ E& W2 F
16年。
q4 S& T# X7 Z; E, |" N' G8 X/ e/ Q& [* X* z" O4 H, c4 C
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。9 r; V* @# B6 F
! z e# I; j" n
16年都没有人发现。然后Mythos Preview扫了一下,找到了。: }2 [9 C1 H& P
- l9 Y5 A1 p K) P. s8 }' H, A注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。. R" [; _6 v2 |
1 o2 o( P ^3 e, h这是主动防御,不是被动响应。( f# m$ V: ]( K# h1 `' s
& x, |1 e$ R* k; A( Y
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。+ C7 A9 B, n6 w o3 o
+ o, D6 x8 l$ T% m5 g) L2 H& lAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
6 v4 E+ V: Y" d( c! T& Q
' Z! M0 F5 a, U* _1 j这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
_( ~& |/ q6 f- w, V1 [$ z
. o3 f" H7 D1 c1 X) u现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
5 W3 b4 O& h4 S/ l0 V9 I
! l' G5 t; u: Q3 e/ A. z; I" s XGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。8 t( C- E/ p; B, }9 U& O
- D6 X2 `+ X# _: a. e) I
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。0 E# H5 W% D6 x' H" }
2 K4 `& w1 o' I. Y你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。+ F* j& D3 ?+ Y9 ]
7 a; I$ I, z- H0 y( l6 M. R# ]价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。7 I8 x% {1 q& I5 E& C( o) L
. @9 _- t+ V4 J, X! U7 a3 J* ]
这个价格贵不贵?
5 v$ P1 Y1 e! n- Q( P: r1 e4 d7 v1 y. c
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
5 a( E% L' D8 R, s m: M
9 g/ w, C+ R: X0 M4 T& o! uMythos Preview能发现那些工具发现不了的漏洞。1 [* Q- o. B: C
: N8 c0 |' I7 K1 a' B* k9 r这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。' X& H# s" T2 }% s$ p: M( K9 O6 @
( }7 e1 g$ b# Z! x
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
! T+ K& L# p0 |) s: p& X6 }/ B: J. I. P( a
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
4 N+ R) P% |# t% o" n: K( o
+ \+ l, \ u' @: l1 H( h# {4 aFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
O% i5 R5 P8 b& l% U3 L# x& m- O% h! b8 \; A; N% D
还有一个细节,我觉得特别有意思。% d3 Z4 M3 V- D( {8 ^* D6 b
/ ]# @% n+ q' B漏洞发现之后,公开披露的时间是90天。
$ K7 u; H& `: @: Y4 Q4 _9 B9 Y, V: ^
' [& {# R& p @. W( a90天是什么概念?, j; D/ p# m5 E# Q: G( @, k
- ]1 z2 y0 H( q$ q1 j7 ]. [) B行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。2 x, N5 _! m$ Y/ f
% U( H0 h/ g8 ]+ y$ Z但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。. r( m ]8 Z% G! t$ F
* F$ S6 ?* H6 l- d* j2 t0 B
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
$ k' @' F k9 d0 e/ h6 E: h2 c. u9 Q% t! F* x$ X
这意味着,漏洞披露的节奏,整个就变了。
! j; R$ _4 y$ B" |% p2 ?) t9 H6 k; @$ \$ b* C8 p- P& N
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。5 s0 H+ M: e* A
* s$ \( |0 f3 a. t: y
厂商的补丁开发速度,能不能跟上AI的发现速度?) ~# j( `; B! V7 v
, {+ d3 o1 U/ I; I这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。& q; x3 G) y! w K8 C
4 `! ^7 i: r8 L8 Q9 T+ i写到这儿,我突然想到了一个更大的问题。
$ T& L' H& W6 K) M% `8 K8 C4 T/ Q/ K3 K
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。; i) F! Z% o! l' a4 v# a' R8 l/ o
: m# P) Q& |5 r$ Z5 a# B$ Z透明,意味着隐藏的东西变可见了。; I6 \1 Y8 S/ I# P% o
& b+ p u+ {) i K7 \+ e7 E5 ]" G
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
1 ^7 i% A/ s. x8 `- H" V9 P# Y7 c, j
这个意象,放在漏洞挖掘上,太精准了。; X/ l" d9 d j/ \' \) z: m
' c/ ]: x- @8 e l8 b% W
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。* I2 L+ z( E/ P6 N6 K
8 u" F, k/ @% Q$ Q以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。, N/ ^! q5 _$ m+ Y4 m2 j) C1 p
- I& y; \5 z6 M6 t& R: E- A" h* P但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
' T9 a2 z4 i1 W% I* I* U; p! m) n l S; S
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。( w! G% _: h: ?: A8 O. N- ?, }% P
* u3 K. s% l( F) d
这是一件好事吗?$ }! u1 W! b8 @. C. o
$ y4 P2 s8 f. {. n$ @& S. [# G我觉得,短期内,这是一件非常非常好的事。
, X& n9 W3 a7 e0 O2 G5 ^, ]: w
% @4 {' S5 E' A6 l. s6 j S6 d全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?0 ~( q$ H( U8 Q
3 o" @! H0 }' i* R3 c3 i这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
1 o( h* W1 _% _ H$ K7 @: y
2 N% L0 x z' {" C2 E6 XAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
& o# B8 L) c: j N( H k
$ R/ W$ \; I l0 V8 |# f9 c" X6 U但长期呢?
+ E- W# n- u- c0 |' j4 w8 T4 W
. \( Y; T. t; B0 b/ a$ G当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?& N& u2 |( q. a1 f3 P
, z6 Q- b0 l' t5 d: @是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
' f; b+ r3 Q C& |2 q, ^. _5 ?( g+ q7 ^3 k
我也不知道。5 F2 |4 l$ _: g- T" n
- k0 G- E3 J+ X0 E$ o
但有一件事我特别想强调。1 }, J, I4 C+ h* ^+ e* m2 B
# B) v0 p+ h' y6 O @% h3 B6 r2 s. e这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。. U, x) n6 B+ W# A; Z/ X6 C
9 [$ S; I2 B! d a$ m% K5 u9 W
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
' ? V# }. {5 D; D0 ]& k9 q8 }9 F1 v, U( O$ n( Z
他们为什么还要加入这个联盟,用别人的AI?
# h* g j* e* t, W' U' ?& u
$ O8 A ^7 w7 M我大胆猜测一下:因为挖漏洞这件事,规模太大了。; H5 C3 E) f5 G3 }) H! e
- Y, C3 _) j. v- P, i! {
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。) N; k. \/ i& Q9 y6 }- m' S3 J
: @" k9 E% U: c* ?1 B
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
/ U: U3 M9 t" ~' p4 [( Q" [; @& T* I0 U( W+ Y \( J) Q
这是规模效应。, j# P2 L- z! B# N/ ^% ?* H1 V
& p( B+ W( v7 q就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。0 |0 j, T$ P8 ]2 y( n3 j
. O2 f+ U7 B, n, o" }1 l这个规模,是人类团队根本无法覆盖的。% F9 d$ R. z5 j* D, t
7 K1 m0 T& E Q% D$ C5 t0 y8 ?Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
- |4 t# R' B' v7 ^* M5 _& m# p0 N8 | P2 z# B6 x
什么意思?* f1 t) A# `: ?! ^& z9 E
6 o( G8 a4 L. _& p# x现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。; m1 y G$ G6 k: P+ c
" r+ r6 y2 O- z+ o e类似现在的ISO认证,但针对的是代码安全。
?& a: o( X7 D& Y4 f+ @$ l2 F& R( a% v1 t% v: C% J5 ?7 Q+ W
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。- m; T0 e5 a' {3 x! b, O0 h
3 S( @' D( f7 Z
这不是不可能的。0 ~: _0 z. q4 r6 a8 z6 f
2 Z0 l2 }* q* I4 w" t2 @当然,路还很长。现在还只是第一步。但方向是对的。
8 o9 `: _$ h' O$ B& g9 G$ k
: w. M0 e0 d5 y( }- k1 D好了,写了这么多,让我最后说几句掏心窝的话。( _8 l! e+ X9 e3 _9 o7 a* R
m2 \% x( I' M1 i# f2 P9 B我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。/ h3 v* g# u9 M9 l
: | E' m3 }6 }9 U O, N5 p
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
2 m @6 m, y. V' Z* d! c A- W
- D. L( i" N: u这次不一样。这次是AI在帮我们发现自己的脆弱点。
( B, G9 _0 E3 c3 J
! y' Q( D5 d' C* Q Z这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。* \7 s: G4 E6 f- ~5 t% Y5 r
6 t! ]# T, c! V这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。2 s+ q, p) N$ s7 p4 v1 D+ W$ t9 C/ l- V- s
0 q) n/ B, m' F" o) R我怕的是什么呢?
/ v8 _6 V, i/ Y% I, _6 c
# I( p% l7 i# |. ~( y& F0 N- {我怕的是,这个工具,只有大公司用得起。
3 n6 n* v8 t, i" t) ?2 u6 I7 N/ ^0 D! V/ ^' v2 p
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?: y- ?. T# q2 t, c- t: M! H
7 ^7 c* h. o2 jAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?9 A* t \, r; C& h% }6 ~
- n( R! B2 H. U* U这些问题,现在还没有答案。% {3 P; Q: M; |7 }' @- s" Q
& a, A( r2 b# E$ }# I' Q* \* [但有一点我特别想强调。3 A; p. G( `8 h% F
: w e* U4 c! |7 c
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。; p/ s) @5 V5 n* Q1 L. w5 |4 ]
. ?: |8 f* k& d) j以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。6 @1 e" A- |# u, @/ U# \& Y
: {. ^6 j" Q! s6 i8 v9 r
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。% t `. ~) i; A) a! d
; w+ _2 F* t9 K. t8 g
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。' }9 o# p7 C. a# [. E
& W: l: n D' V" ^3 L; M& q" C& j这一天什么时候来?我不知道。可能5年,可能10年。/ X& o z! ^* A- ?" F/ ]1 P
, z( w, p9 X/ P3 c但Glasswing,让我第一次觉得,这件事不是痴人说梦了。5 u7 ~; T( R( k* h& c
|
评分
-
查看全部评分
|