TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview* m3 W9 F w! |8 {/ J# p$ ]
; q9 H5 U& J* |9 E3 D; [5 z- e
1 J e+ l2 s( D ]一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
, ?* d0 m J# S! h3 ]! S1 a- l
4 p. D1 _- }- l6 g' f故事是这样的。
. T) e6 e3 X S3 Z- p
- }- C# N+ E* S0 u. V R% h我今天看到这个新闻,看完之后愣了好几秒。3 e6 W5 }9 X, j6 S
! B9 E* Y: @; O( ^! N& a p一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
! }. x; X3 ^5 r6 E
: I( P0 t4 Q- {2 w4 g( [6 X, D结果被一个AI模型给挖出来了。6 w4 X4 |7 h, t" y; l2 r, \+ H3 E
# x7 L5 V) _- |' u, l$ T M4 ]
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
2 F; J4 l- c6 ?. x4 R0 ]( L/ H4 B- D2 m* F, { s) Q$ b
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
$ d+ o9 _% z$ y/ m4 u4 C6 g7 v* T5 \
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
' S0 l8 v# G' U6 m/ }& \" E' N3 r8 I- E
然后呢?
# {, d$ b, p; a1 |
" m. }) Z) _/ Y0 i1 a9 [5 |然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
8 d0 v$ S* L! ]: g3 X' j( _7 A
8 i! j" {/ R& n9 w: P! t* K( {* g这个项目,叫Glasswing。
/ _- J' i4 \0 f! f# p2 P# l) ]. C& k) a+ a3 H( N0 K" h( m. C. |
glasswing
3 A" C4 ]( E% M! ?' z3 A# f z, p* ]8 c, E7 |! O" _
1 s; t+ n( s9 A2 M先说清楚Glasswing是什么。
, W5 E6 T- }+ @0 b, M" S- j4 e, [% l+ S, R
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
: d, J8 s) ]$ z, B: z' w# D8 O2 g
! M# x2 e. B# A1 v4 e有多强呢?
W' d& b+ Z2 q8 d; I7 |7 q/ l7 u& ?" f' M/ T
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。( k& ]9 j d5 z+ |( G6 D' [6 ~
3 Y2 r" [) k: ?SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
8 ], x" W5 I0 W$ y: i& n3 @( _6 j* b* l3 {% y7 ~5 L4 B
差了13个百分点。' Y1 U! g0 h! \5 S
8 s: ?' W) e F" |& v4 G你说这13个百分点意味着什么?+ Y! i: `5 p, w! y2 Q; q4 H: t
3 ~4 A! b7 V3 @9 q) b- Y意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
! c; X1 Y3 P, |( J+ Z6 x$ }2 o' f1 o4 u N) \- H! v6 b
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
. C, }4 ?# Z. H7 e
- k# u. k" i3 T4 J1 n或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
a. s* p' z9 w; c" j1 Y4 L, K s+ R' j- i* C$ z
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
2 ^7 t: s6 o* I3 D% \
, z; r' d, t8 g$ ~! VOpenBSD是个什么存在?
6 B" Y/ U3 @% ?1 i5 i9 H; [
' X2 a1 A' l" a' d: @0 ~; u它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
6 M/ Z0 J# N$ M' o; O* P
. k# e2 H6 k2 B8 P0 o% d这样的项目,代码审计了多少年了?二十多年。
+ W2 h1 Y, @$ I& \1 Y1 A6 t5 c9 ~
, D! ]/ i4 `; e6 H+ h! V& C然后,一个漏洞,在里面躺了27年。
' l: F: M! l1 B/ T5 s# V' C1 R2 f) Y. C1 W6 w
这说明什么?; Y Q% j8 R& v; K/ Y1 B) C4 x
6 f( \3 ?4 l) k8 w7 v: f
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。+ d2 H; W) E, B O( b3 k; L
( h$ g8 }% J! a% ~# j4 `但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
! s1 L. A$ V9 E; ?0 o/ M6 w, J- `" G, p( D+ M3 r
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。3 N4 I) K. W0 M* f7 a# `- x5 v
0 v( [5 s( D. q1 n) q- L这种漏洞可怕在哪?; k; R4 F) Z( D8 [- k' {
V1 T+ @! m8 z- y
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。) C& H- g3 N1 V* r7 j) z
* U2 d9 K- [$ o% V' a. W传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。1 n% u: |# q+ m( C
4 V7 U7 j- G' @( E/ T; |% E/ }$ T
FFmpeg那个例子更让我震撼。" h8 S" H" D6 K8 \$ e) O
! g8 G- z5 p$ c* W& i9 B7 W
16年。 u- f# n0 w2 ?
$ c( l0 a( K9 i; a% F
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
! M: f+ X3 G" Y4 q
3 E- c, H# A' f- v* n W16年都没有人发现。然后Mythos Preview扫了一下,找到了。. j' V' d* F7 l# U9 q& V
- S& y7 t' e" w( G+ L2 }; W9 X' A注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。( [, P3 f5 B/ B& W: V) b2 X; r
2 _, h: m- g6 u$ h这是主动防御,不是被动响应。
: j& [% Y5 T# N+ ?) c8 Q
* n6 l4 @! D8 `+ @ \传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。" O( v5 w. {8 Q5 j
* t5 ~3 U2 {/ l7 N/ q0 IAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
3 t; e* a% j7 {
) C- _; ~/ b* a; \4 |1 }5 C: ?( v! W这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
% I( s! c! a! U8 l4 R
7 M) z4 `6 F2 y$ U2 ?1 O现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
2 D* r1 p5 w2 m" T
- g, {+ V. R m0 P' O5 gGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。/ Q$ ~' g s) Y N- H3 X4 h0 ^; w, K
' G$ E, M( B0 |8 J" B
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
8 v" d; e5 G; q3 |2 q: L4 S0 z6 J- }& q4 S5 Q3 V6 O2 d
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
4 \# m, T( ?2 j5 Z8 H
/ x. L3 M$ c' ]- d价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。3 c3 m) j+ e R3 e/ g' e8 I
j7 [, i% n- I1 ^. Q7 R# q
这个价格贵不贵?' U! I" K( R* r& r
+ F8 q' u5 C( T$ h5 ^7 D [对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
' i$ }9 V3 T: U1 N5 H6 f6 K! A+ q) v
Mythos Preview能发现那些工具发现不了的漏洞。
! f0 `9 H) k- x" @) G) O3 A. w/ R, F) e
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。" e. K: Q; U0 R2 T5 Y
0 X& b2 e: E6 p9 I) L; n, z+ K. a0 H另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。+ d+ Y! S d% q* Q/ I' F
' W* q6 `% h; v' m$ v这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。& r9 w, _' @# q1 o% P; M3 ^! e$ C
! a- z' b1 z! A- ? Q7 V
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
- Z5 i1 o7 B9 G) Z* |' M0 t$ N5 \9 x8 y, X- {, N
还有一个细节,我觉得特别有意思。5 U$ B! |. A8 ^* F/ X$ ^% r
% \+ j: q9 v& Z* M$ z) |
漏洞发现之后,公开披露的时间是90天。; m6 U4 f# v6 h" m; p5 o
; R4 l# K1 H8 R$ V c! N2 D
90天是什么概念?
( _2 g( n2 d9 B( k7 l. A ~( u& W3 I6 h) F/ i0 m" t9 y! d8 {5 P
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
5 ?# [/ ?# v, R# o. L/ h* Y
( b( O' v1 h3 C但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。) [& K) }- v8 N: M, [8 U
8 G2 r4 t* g8 h1 @
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。7 {7 ~$ O. ~1 h# i6 E
8 ~5 U% A5 H9 ]这意味着,漏洞披露的节奏,整个就变了。" W0 B( X8 d' G
" a9 b% _) F5 U! ~& f, d! J: y% d
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。& H8 L6 K: `- g: }& y. M
8 ?- ]# A. `3 a/ v E2 ]# e r
厂商的补丁开发速度,能不能跟上AI的发现速度?" f6 N$ T* d+ E1 m2 B; t
: e9 k- P/ \$ m( X' S k& z3 G这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
: j( }: U% K) M. b* P+ @$ M7 ~% {% b# p" X
写到这儿,我突然想到了一个更大的问题。% w, {% g* ]# J5 O( B" R
& Y0 |) r0 g2 z1 vGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
& c, M% K3 c; N+ U3 Y! O# P0 d6 u2 S3 {, C" }$ B
透明,意味着隐藏的东西变可见了。 ]% @" U4 e$ J6 E
* `! ~! ]: E' _8 b: c. u' C% s
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
8 n+ Q8 X! S* j6 m& G# Q& e
4 Q1 k' f1 r) _( `. t. Q这个意象,放在漏洞挖掘上,太精准了。+ V7 X, h, G6 |5 j& p. K/ S
7 \9 h. m6 g3 m9 {: a$ ~/ A代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
# W' w1 }: P# r8 t' T, z. O% P3 R) ~0 x0 t
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
X1 r) Q! f" V# }% F! P2 I: C" O( S, _2 ~5 t
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
& A+ ^* [0 m# e, ` A( C) g1 ?5 `1 g/ p6 p
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
5 s9 _- u& z* Q9 C/ V; a% t( ]
! s+ S2 ]. |# ~0 y这是一件好事吗?
; P. X/ L" ^1 L y7 e2 K4 {. L% z' z x
我觉得,短期内,这是一件非常非常好的事。" f8 i# I7 j: Z( U
. v$ w# }8 I6 u# v0 j全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
/ O) P9 L! V* ]# k- h J* Z4 \$ p3 \9 ^1 c9 B
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
/ s' n- S% s! {( q6 F* s* G6 K$ n9 L8 v' `
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。# r2 |; ]% [; [" P& K
8 Q% z+ O8 R( h6 v3 I" S4 |3 A9 L
但长期呢?2 l0 [ ~) ?( f( V* ]- q, ?
9 g8 _- w2 u$ b% j
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?& U. H& F6 q4 \7 x/ J9 }- G
5 k7 T( i' z. S
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
% f3 s% `0 e* j& L% q j( Z* {
* P5 k) c2 e7 J, [$ S) p8 J. @我也不知道。
+ @4 R6 i, S% |- y$ C/ y3 a. ?
# {- _( K ^2 h但有一件事我特别想强调。
! G3 g. P* V( `" L# e |4 K
7 L0 z# A8 Q( x/ ~' t这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。( G. q8 }& |+ d% a1 T J1 ^
: t1 Z# F6 l! l: M ?; P% j! o/ L他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。, a" B0 @: j3 M) {. ]
* c7 r# n8 v3 H+ A B8 D6 E他们为什么还要加入这个联盟,用别人的AI?
. L* [: J+ ^+ N5 F; T7 Y- g ^7 X/ \
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
% u2 x7 D" b7 H6 N5 e; b0 d6 n
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。* B& H. U: B. [2 b* n
& t) f( a+ Z4 E1 d% ]/ \! r
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
. r6 H8 ^; m" [" _ G$ q$ @# F
5 ]+ `. F+ f+ M这是规模效应。) [5 f. \5 m% E; H7 U0 j, Q& K) H
0 v! ]. A e/ ]6 U3 F
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。1 U9 L. W7 k- |! f1 e
! W) a4 |- m" P3 X4 G6 W2 x
这个规模,是人类团队根本无法覆盖的。
3 E0 M/ P6 b8 V* _+ j
6 e' q) J3 l3 l! tGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。8 E$ {. @1 n. b) b P) X
* ~4 {( z( M9 }/ V3 D1 D( n. r
什么意思?
; F" v8 J2 y( l! [% I) @# i; M1 J, q; y5 R
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。0 e r7 y0 y: u5 U A
& o0 ?/ s# O y8 ~ u# r! Z, W( a# p
类似现在的ISO认证,但针对的是代码安全。
- Q" f' v4 O5 ~: a" c, v. ^) b3 g+ m0 A
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
7 G" e5 y3 ~ j+ p9 b; T# U0 m$ A& V* z4 u$ c# y7 D/ O3 M. b2 z4 }3 U
这不是不可能的。3 F8 l: d" K9 |3 V; [5 Q6 Y
& s3 ^. Y& W: A' V0 n+ |/ m当然,路还很长。现在还只是第一步。但方向是对的。; b; |1 h1 `! {# @6 H5 k
2 {' }; C2 H% }# I* S4 M
好了,写了这么多,让我最后说几句掏心窝的话。0 x% ~1 m, f3 b; c) s
( F2 ]6 \! c6 w' U* J8 ~
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。! w! k3 O0 D7 X$ ^4 `/ X8 M
2 ]' y+ o' S) G% W
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
3 K6 Y( D, w* z) R, Q- Y" G+ ~: o( q4 [
这次不一样。这次是AI在帮我们发现自己的脆弱点。
. m2 F7 L1 J# f. P0 c
- g$ Y' m ?! n! y; H6 `& b* c/ |这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
: k3 H& r" w+ R& l* {- X8 G& U6 M7 U- R( s: z& T
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
( }# u9 o5 Y/ R6 D, ~! J
4 M$ h0 [2 n6 V我怕的是什么呢?6 q d7 {. O2 c ^4 @5 L$ ~& L
" e5 k1 o% s9 X" E1 H我怕的是,这个工具,只有大公司用得起。6 Y5 [" @6 @) [: S3 C! F' i; I0 v/ L
+ ?: E' u, r: y/ e6 G+ g2 `
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?2 U) p& o& g; J( K I4 `$ T. p7 t1 ], @2 w4 |
4 M+ r5 E4 M- p
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
2 F( ?$ T( G- ^( d4 R1 m+ G) Q: C: Z# g, ?
这些问题,现在还没有答案。
& i* W9 \- u; I# N
" c+ E4 c4 V( e) z5 C但有一点我特别想强调。
& U* c* x% I) w% {4 f. g7 _
7 J) e$ Q3 b+ _: U) S% O/ aGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
8 _& S# y) O7 Z9 l+ v# Q7 ^* ^9 c8 U T* c: v+ P* Y
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。8 r; K/ {' b2 G/ V
; y& c+ h2 R4 N! B s; c9 u2 |6 ^; G
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
* d# U- _- f! ` T0 U6 q! P) B6 I; a% ~% ?/ V5 h% O
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
, e, i/ g) u9 q. f) f1 r P7 U& D0 J2 b; C
这一天什么时候来?我不知道。可能5年,可能10年。3 d, f9 j' b# v }
! ^9 x* A4 r, M: q但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
1 M3 R" f& f6 y3 }* I |
评分
-
查看全部评分
|