TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview* [ p4 @4 G. c% }! e
9 [8 T: N* f4 x( w# f3 A, o
4 i% ~, Y t/ V8 l5 Q% {7 v" g一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……9 M% P" ^( E$ O) i
3 k8 q8 y0 {: G d故事是这样的。* @/ {8 v3 S. o0 P( {7 q; [
/ y0 d* J" C) ^* O0 X( V我今天看到这个新闻,看完之后愣了好几秒。! R- u/ Y/ U. e- y3 _
% X9 u( P$ u$ C4 v& C" I) l一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
3 N8 {' K9 P" |+ W
; y; _8 @% `; k- z& N, z, T结果被一个AI模型给挖出来了。
* r" C4 R' q- x: M8 v: P- M/ q- S; i6 i. I1 [' X
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。( Y) c4 {- m! c L0 M
) u! {3 Q: b* @6 n
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
: n* j2 ], `# P+ n! o6 V# ^
# \1 F" z+ S% A6 H$ C! m' H. BFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
\$ ?# F. @6 |2 ~ F6 \3 n: a
* b: Q4 T% }- K E; U4 }然后呢?
% _, g2 Y) p; w& z* ?. \; e& X# i& Y+ g8 g9 Y
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
8 w) z7 j5 a! Z0 F$ R4 \
3 M, m6 l, \& l( Y这个项目,叫Glasswing。4 A4 A c9 n9 N
) L# O$ b* q& b4 K
glasswing
: i* \% t0 p( H( O5 c7 X5 Q# }# _" W. R" L4 G& G# V7 c1 M
- `2 q1 Q+ D5 e, D% l$ M
先说清楚Glasswing是什么。
- T) J* X% \: k9 ^3 \- |2 {, d, ^" f* K; M3 v' A
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。8 [( z4 {! h _3 S7 L# s$ L' ^
; M1 C1 _; _+ t- C; r, b4 u" z& w有多强呢?
( a; y5 i& n/ t6 L1 U" b4 T( j5 O. h6 n) ^! N) y- Q. {, q
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。: t- F* {5 `* b1 ^2 N) j+ r9 v
, ]# L/ ~1 G* g: t: C
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。* H, g& y7 V* l1 [1 l
$ \& ]! y) O8 a/ o. w
差了13个百分点。
3 u# J: C: R8 Z8 {0 G
( W* n2 M- ]; f4 T- ^" F你说这13个百分点意味着什么? V0 N) ^, G7 }4 W- {, {" z j
8 _! i* N( P, {8 J' [9 g: ^4 o
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。7 v8 S7 s8 F; U! g: J( [
7 Y9 u: ?" N) g
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
$ Y) m' g) R) @4 s# I# p0 i4 p$ @9 l f* s; n9 m% w: [
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。" M% i5 T& {6 q! l' e0 @
6 b2 p- F4 ]$ u, N. }说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。. r+ B2 w0 A8 v V; ?& ^
' l, L0 I* N9 y3 FOpenBSD是个什么存在?8 J4 w! k4 j+ V/ d0 t( D/ ] K7 j
& M: |5 q# Z9 g7 h
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。: H, j3 M; }* v3 ?, [# I( u
# h5 T. P2 |8 p+ E3 X这样的项目,代码审计了多少年了?二十多年。7 ^% H" e; L0 w( S" z' u. E5 |& m
. V5 H$ l- F: h0 B8 g9 U6 a" ~
然后,一个漏洞,在里面躺了27年。& W* N6 B* Q5 }) J+ G" x& l
/ Q q8 Y/ g7 m+ B- @) E9 i这说明什么?9 i3 ^# z$ { |* m/ T
0 U3 D4 O6 Z" a% f/ W$ m) `不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
2 S, c" S! b" S4 `, x) e8 d4 D
/ v' S/ E7 ~1 J! x6 i但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。9 V& m0 N' H3 J
4 d$ T# X+ m/ B) Z; |4 Q/ B- rMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。4 H3 N1 o6 ~6 {6 p/ k
% m4 E1 o, S$ N+ v% {这种漏洞可怕在哪?
7 @# {" c+ k2 j* B; k9 A+ ]- s
* |- y& X3 {0 }; l6 j它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。" W0 e; G5 a: ]5 p' I
( v3 K$ g; F8 V5 \- |! V1 k4 v传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。0 n: R# N% [9 r+ l) |
5 J( K- [* ~ Z% P; r: w0 M' e
FFmpeg那个例子更让我震撼。9 ?; K1 _+ l D
2 Q3 ]( ^2 v" G* R16年。
) H' L. ]( @- V$ ^' k9 A( n2 y. ~
( ^* I% x6 E* dFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
4 |, S6 M. L Z& i8 Q" I" J Z5 E4 b6 O2 e# F+ {
16年都没有人发现。然后Mythos Preview扫了一下,找到了。
5 [+ j- S; K* J7 _) C( a
]( S0 S! @( b# X, B注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。7 R A. _- I3 t# K2 \# [' h
% N. ~& }$ _- _0 f4 w这是主动防御,不是被动响应。
: `3 U9 M& [; h& C2 ~9 W3 T; [4 k# S. s0 ]. X
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。1 Q' k/ e0 E5 H( f# H- P
: [/ c7 m+ L5 ?$ Y6 e% x: R3 x
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。( c" y& K/ L" U% E; H* ?- F" D2 X+ n
) K1 U2 \4 V- q* R0 _
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
. q; G, b% i/ a9 I
& P7 j! ?5 s$ G6 q% s1 g现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。! c \5 Y" J6 M! |
2 E7 C7 x( S" b( n
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。# L5 t9 Z Q$ p/ t7 C# m: H
' ?) w9 n: ?) N, |9 W U$ V2 @这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
' S' Y3 U+ `, U
" j& n- B7 t# `6 X* O, a3 P你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
$ o: B" R: |, j3 r4 b4 ]9 M4 ]: Z. I. R/ J
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
5 c4 \* }. I. M! i, R! V
+ X( i/ n0 D9 @& W: B$ R8 a这个价格贵不贵?5 g, c4 u5 @! x1 T/ M# k
+ J9 l1 t* L! q) y对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。! J7 E4 p& t1 Y* c
( b. {5 ~0 L# LMythos Preview能发现那些工具发现不了的漏洞。: e/ j' U9 f8 m/ y
+ t9 ]1 n, I" T7 @* N1 ^
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
% T( A& b. {7 W, M4 |6 V* H f% O9 r# s7 w
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。4 d3 D8 O2 f1 F$ b7 |; g8 F
2 F* i8 N1 l5 C* t( Z! c这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
9 E8 ]! l: D( z* m
/ i/ H4 [; E# X% l/ ~FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
/ L. d0 h* }* p* p/ ]
' q* \2 m& l/ k/ l还有一个细节,我觉得特别有意思。2 b, j3 t2 e% f( m
* X6 k9 E2 @1 R漏洞发现之后,公开披露的时间是90天。$ Z- B3 F1 f; ~( ?) f& O
3 \4 f/ G0 R7 p* ]. U$ E* c' Y
90天是什么概念?
0 ~( }& R4 i+ r. O: U6 S4 Z. T+ U- l+ K" J, T2 l
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。& O2 s( b9 {3 f' v
! H1 P4 p8 x* s( n0 a但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
0 ] P$ d$ L' z9 M# z- ?9 i) J1 u, H: F: x1 l9 h& l9 }1 N3 ~
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
. s5 M- l: w+ C. |8 Z ~3 ?: U9 `+ [3 \& h! D
这意味着,漏洞披露的节奏,整个就变了。2 d1 y) y; u8 z3 ?" g! u# L
J- i; J8 E3 \; v1 ^0 g
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。& |. w( \/ t* L' r
8 N9 c: x1 P# G% u
厂商的补丁开发速度,能不能跟上AI的发现速度?
( I3 P! f6 p, t6 V
' w7 b) L2 E$ o这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
5 m. h5 r( G% b6 @7 i& W0 \* r% _' a1 z) t/ t, ]7 j, f
写到这儿,我突然想到了一个更大的问题。7 i' s# w% ~/ _1 k5 s7 @/ C; Y
' J. }9 m, N! A+ GGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
" i- j4 |# q1 T4 n# l. L0 B3 a1 Q$ S& C: I: `6 p& c
透明,意味着隐藏的东西变可见了。
' l1 S6 L: h6 a4 ~, k: p& P; |; A* e* _0 \$ K: i
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。* }. r3 G1 [1 B) j
1 \6 @8 p% e0 E% u) [这个意象,放在漏洞挖掘上,太精准了。, a6 v$ r6 P! o: Z" S# D( Q$ M
% k/ i! i* c4 v2 p% y, E2 q6 `/ u代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。( w U. \9 N f
4 ?1 U' o& w8 U' \/ }, ~! h
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
# ?! z1 F, h7 |, u
3 l. E& F" Y; s! {9 p' O' e2 q$ S但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。( J+ p$ A- R7 O, H0 q6 Y6 r j
; A5 K$ S# l0 y3 R代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。0 E$ g# {/ k0 A. u: [- k1 z2 u0 d( I
( j8 N7 j- m2 {3 T% |9 ~这是一件好事吗?0 W7 b5 A% c7 I2 _/ w6 ^
! |1 s; j* m3 V, D' x# H0 s6 C
我觉得,短期内,这是一件非常非常好的事。% A1 j" V' X( ?
7 V0 Q8 m+ m/ _' c! V
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
- P, }$ V8 |+ Z2 E1 L3 c2 }/ v1 F- V* a$ \
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。! f N1 l2 t+ I9 W( `7 p! ^
% E1 G e8 ]0 d4 b" ?, U% x! p
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
- _1 C6 e' [' I1 h: ]& H0 a- P) q
但长期呢?
; h0 g( G: O' s5 t2 n' I& D) M1 J9 R$ T7 r& ?* g
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?, g/ |3 z: w ]1 [2 H3 k) O6 ^1 y
! @ h. \, C. E1 M1 X4 `! n0 w是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界? X1 X# C; \4 n0 i
6 B+ f$ c7 w! K0 G7 Q0 x! j我也不知道。
8 N( \1 ^$ c: \* ?: B/ t- |* E) c& c8 I" W
但有一件事我特别想强调。* n0 z- X; P" [
. V5 E( d1 `% {7 E& V/ W& X' n
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。6 C9 l4 e$ \# U) t
$ o3 B$ n3 k8 k7 ~
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。8 H! g5 ^% Z0 l# y3 D2 C' w
( |$ H% S: r* ~! p0 r% n+ i他们为什么还要加入这个联盟,用别人的AI?$ C% {& g4 F# u7 D) q+ C
+ Z, ]3 i" O1 J: @8 g我大胆猜测一下:因为挖漏洞这件事,规模太大了。
1 r7 R' b# Y2 C8 Y b- l$ O7 d' F3 G; O4 l' `/ A3 t
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
% l8 \6 c- A& t. ]: z5 x- B9 |6 G9 h O& k+ s
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。8 o1 C7 \) z. t
+ J1 O9 g0 D4 w8 n- k; {
这是规模效应。& s0 `, R4 n2 e6 g$ d( ^. c" U9 D" b
3 R7 ^) Q2 p) i( }! U+ b+ V
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
# v8 r* Y4 B$ X2 E- Q6 Y( a' T# L5 }; n7 {0 C
这个规模,是人类团队根本无法覆盖的。
6 S0 I( L* p% L
7 r* T2 ]0 u* z7 [/ R* {& v9 pGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。. c9 p# q# L. t- [9 }
1 T' H: M; b5 a& K3 c什么意思?
% Q/ y+ a, B5 Z% k
- w, Z& f3 \9 l$ ~0 x4 j4 S现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。5 B/ d2 [, E! ]9 Y' r+ u) P' v
$ S: H9 q5 z5 U3 {& k1 e类似现在的ISO认证,但针对的是代码安全。* c8 d5 B4 H3 G2 p8 g& }9 y9 I
; ~3 u" E4 Y$ k; A% z1 M
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。# H: X: a+ c: ^. d, K: i
* K- p9 Q8 w1 h这不是不可能的。
1 a# U( R3 V" u: G. Q7 }- _4 E
) ]& Y6 l4 t3 O" g: g) {% ` d- E当然,路还很长。现在还只是第一步。但方向是对的。1 e7 X& ^. ^/ I3 E& ^
' D& K$ `, i8 r0 o
好了,写了这么多,让我最后说几句掏心窝的话。3 R6 S0 X( n: N/ F" y7 S+ m
* [/ s6 L/ N6 R' C
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
5 J- \/ m4 `8 k. x9 n' U
( u9 b8 E+ v: p; L2 r. v7 K兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
' }9 U/ a) i# e4 n* I: w4 Z9 t- t' J. F: i* s7 V
这次不一样。这次是AI在帮我们发现自己的脆弱点。
7 [! b7 b3 R# `- c0 ~9 C
# q. Q/ V' Q, O' \9 p0 V; f/ p) L' O这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
7 J2 o- ]0 W9 `1 i' b. v% X$ v) q H) c+ m* r ?# R% x5 K
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。! K1 ?9 ]3 }- t2 i f( t
+ d' s$ v) p }/ i! \
我怕的是什么呢?' I% H( I: z7 G. ?
; R" o* L& g# O5 ~, \7 D我怕的是,这个工具,只有大公司用得起。
, P2 G; l! l, s$ U6 l# A( g3 O
/ }( ^4 l; J- g0 A9 z9 sAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
) S! w8 N! e$ y- ]' O4 X1 y p
, G' {1 J- o a& IAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
* f) X) X X8 T' A0 _ t# b0 c6 {5 L. w, S$ B
这些问题,现在还没有答案。! K+ R" G6 F9 G* ~8 i4 M
+ C! d% U3 q# S& |但有一点我特别想强调。
1 J: j% j9 F( K. N9 m* B
3 S. C* K& \* X& u; ^2 WGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
2 a8 v- p& @/ x& N$ v. Q3 v* Q+ v$ u
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。, u2 W1 @3 Q4 o) [: U
" A0 u! m& S+ d3 u: _5 sAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。- o9 F. V. n" F- P5 \: C# w3 p6 X
0 F" p& e4 X/ q8 ^; q当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
0 g2 J0 F8 z f" {
! L5 D$ x6 T2 ~这一天什么时候来?我不知道。可能5年,可能10年。& b) W2 N# F4 `" y, b) v
, |3 _3 s# w# B, Q! s* M* Z4 |, {但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
) x3 o: h) Z- } |
评分
-
查看全部评分
|