TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
# K# U q X& O! T7 x7 a& Z. E2 r
$ ~! j1 N, c, O7 T9 q) o! A- I, I
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……- f6 C0 Z2 N% j
4 j- y; i2 j0 S" U& O0 H- c: I
故事是这样的。; a$ k0 N% m% |9 c
/ l9 P/ M/ r6 [8 ?+ N7 F
我今天看到这个新闻,看完之后愣了好几秒。
. d1 T$ J( f: f/ E1 T0 ]& f3 {6 r( n- ?8 O* E, E k- k
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
7 B- v/ N& x7 A: l/ M1 H$ M
! N+ }! }' t0 m& C3 n- P# f8 [) g! R7 E; K结果被一个AI模型给挖出来了。. g1 T$ K, a6 P' G
9 T2 l7 b& ^+ r! r这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
# }6 I" t8 q# J" Q* q
; u/ |& A1 z* o: Y& k6 x r然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
5 v, g1 v& o/ v
( T/ K, t3 S5 `8 j4 v5 ~& ]; nFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
% w4 ]" X; _& @
2 k/ Z& }% d& J) f* [然后呢?: E _, n+ i% O6 A; M4 j
5 Z$ t4 A8 H1 ^+ U. X
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
- U* w6 k) n6 \( n. F, f1 I9 N8 m; j9 y
这个项目,叫Glasswing。( y; I6 J7 i9 {0 C
- a( e/ u0 q) }( S; L5 I
glasswing8 x! E% }- ~* O# J4 j: t
$ v% f( M z+ J* S, N% Z8 N
. U5 {0 V9 x& c
先说清楚Glasswing是什么。
7 j [* N, l: n% h+ j6 n
; m" `9 ~6 @9 q- ?! Y( R# A简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
Z# t K, m h) }" w6 V2 m' ?; M+ r! t+ u Y, X- n' ^: L; i9 o) D
有多强呢?
" R; J7 T- S6 Y) H5 }8 y
b: N# u: k/ }1 p# g1 ^( r2 g; PCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。; _# g! l; C. y! I+ Y
- |) i% w5 i5 D% P7 m$ w1 O
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。6 ^' B+ k) r6 n! e+ l( Z' `4 C
' L2 c' K* R0 M8 R. }# @/ o差了13个百分点。+ ]$ P; a, D4 B, V# Z* l
3 y# b. I1 C! Z1 u# i" ^! F' I你说这13个百分点意味着什么?0 Y9 W5 u% {0 l) s( B* d$ ^- M/ I
5 p5 u; r$ M% G8 o$ `
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。! a; W; J& M+ l3 v6 ~7 n Z9 ~4 Y
5 W& `+ y5 B' Z# w( ?意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
- _; P# p, Z' ^, ?% l! @- ?! B) ?4 ?. B7 }5 r
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。* Q. v9 E8 M! M0 I/ F7 r
& ]& M- Q; W1 A* C! ~ ~说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
5 O4 M$ U- i% g+ z/ i7 P& v% |" [* \5 `: I' I( Z, c8 o
OpenBSD是个什么存在?
% {, B$ W! L; `; W! A0 t4 z& _ Z6 L( N4 }
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。" T7 U) a3 m( o) L0 d3 o
6 T" |) g3 ~" W% J! z这样的项目,代码审计了多少年了?二十多年。- V2 T+ j+ s9 `3 ^( P7 { o
! L: @- O5 w$ r4 V, J# U) x然后,一个漏洞,在里面躺了27年。
: D3 u" a; C+ L' N. `3 j
/ M% a1 f$ m- x3 Y+ F; q8 c这说明什么?
, D: J; I1 _0 @& f* S6 M& s! H, h9 @
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。" n+ T3 f! r1 v, X- m: B$ M
7 A2 B: E$ l; V* c* X$ v1 p
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
$ L, x v( d B* u& ?! T; v0 l; d' f& _- W) ]( V/ u% K
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
* w' c+ D+ X- b7 F/ Q. c3 {- Y+ Q. f/ |4 a
这种漏洞可怕在哪?6 ?2 y. x6 g! _6 l
% Y7 i/ M, J1 p; t Z: [
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
v+ o1 b! \! o
+ D2 [# a1 x/ j7 T传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。: {8 G2 b: B$ ^1 h1 [4 W* Q. @ m
; \ A3 s- C5 v$ ]% z& }$ u# e( @
FFmpeg那个例子更让我震撼。5 F9 K4 P+ r/ F% d, W; N4 w/ z
! D+ o* s6 Q, J. w$ P! |+ G16年。
2 U% s3 t1 R, C f
4 a3 W/ m2 g E7 w8 L) R( OFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
, ^$ D' V, J! X8 G* k
8 ?% ^: \2 l7 N0 o8 R1 f16年都没有人发现。然后Mythos Preview扫了一下,找到了。: T% v4 {% i3 m- G' I0 u
& ~& R! b! F4 G4 Y' S% m注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。0 y( E" e; X0 G' n8 a8 r' `4 u3 s( h) d
- {/ ^) g* C3 G8 T* @: Q
这是主动防御,不是被动响应。
& E; j7 Q8 J5 R
' ~, L& T! B: G2 \: I: j传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。: u& N% r9 G7 @! F
/ n- D9 F7 x7 I# D
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
$ ~; K3 M" O7 U- O
0 E6 D+ W& b. w) ]" c d3 e3 X. p这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
- u% u" c1 G" y3 P$ r+ p0 V- a( ~9 ]% p( a
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
! C7 P. m; j; b/ H2 o0 N8 [) C4 W V, d1 e1 c- W, |) F
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。! o5 I3 m* ]7 e% w5 a( R! a
! Z% @1 ]6 R0 m这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。$ G7 _& H9 T( k( o7 l6 v& u- Y
* w7 ^2 f6 j- S8 ^. l+ z# J" O$ _你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
# i$ m$ C! p: e3 q; z8 Z9 ]+ v$ I' A& j, {
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
/ h3 [( Y( m+ N% ^! f) a% _3 s0 b. i" E7 i4 b+ C0 v
这个价格贵不贵?
4 g$ w9 e# N: ~1 [' e* v% O2 {( M
" U2 o2 ?8 U' H' U对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
* t; S4 I4 A% D- l+ M. n2 N" z1 w f* Y5 V% w6 X# H
Mythos Preview能发现那些工具发现不了的漏洞。, A$ @$ c* x) \2 n2 i3 b# s
u4 |3 s' R" X% h( r这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
' ~& V ^' v& |2 l! i2 Q5 c' {7 _
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。: H7 a4 ]* e( k0 S
* f& @' W0 i6 }+ N5 W" [7 G3 |
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。9 a" q4 v" `' D; Q8 g& P7 ^3 Y0 S
6 Y N3 x- W( K* T/ q3 _' @FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。5 z+ ^3 K* y) b. q
9 D1 @" T. I+ B+ ^; B- I4 `4 A
还有一个细节,我觉得特别有意思。
. p+ y7 x: E* r/ m7 k, C* L/ R7 J+ h% w, [8 e
漏洞发现之后,公开披露的时间是90天。
5 i" F- n" t; l1 }5 g u' i- w( [2 _1 d
90天是什么概念?; D: @4 k$ \5 f. w9 C2 @: z5 i
# ?! F* S5 ~: a% D
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。& q5 e# v4 P; |) m2 i' Q/ P
- y; h# s& E; H% A& l# g9 ~ ^6 E
但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
% w+ t/ u: ]% ?6 A% `1 \. X9 [/ U) u6 L7 d8 i% ?) a
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。3 m0 y1 p' l, |+ F: ^: z
' a6 C; M; I7 t* {0 X9 i* r这意味着,漏洞披露的节奏,整个就变了。% F/ x+ D% ^ K: F; B! l2 m! T
- E# }: V7 A# w' a; Z以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。4 L; K$ |8 |$ u* }# l
7 w' \' f/ b# J
厂商的补丁开发速度,能不能跟上AI的发现速度?
8 B7 E* B: P0 `. t4 X' ~: [1 m F3 t$ T+ `: p
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。7 |' w0 X b5 a* Q
2 B# a5 ]3 U4 u& |/ z
写到这儿,我突然想到了一个更大的问题。
/ F- C- D: }# |) K H
6 z- l& z* u9 T: Q/ Y; BGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
, u$ d& w) v6 O5 A* V) I
( ?' Q0 H* v' ~" C透明,意味着隐藏的东西变可见了。
a0 [$ ^2 \" g5 K$ J' n% c
, Q% z! \7 B( }: @. C一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
5 e5 K* r4 C5 w
+ T% _4 D9 l) V, G3 f: L+ `这个意象,放在漏洞挖掘上,太精准了。
/ s$ g3 r0 L `4 ~& W. n _' S) a$ x
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。/ u, o* ]4 V4 ?" Q
% F; z- J2 q/ i4 Y5 z% ^以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。' [$ C" P" L- U! C& C
" S# h: I3 v; x9 M5 U: n但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
7 H/ g) [' P* x
) D0 a" R, }6 O: _9 f代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。/ Q& Y) t; O# p4 k
) a6 T5 G& q# \! y" l这是一件好事吗?
/ U' H- U5 w$ l' x2 x3 w
- x& O4 [& f% ~9 p3 M7 `我觉得,短期内,这是一件非常非常好的事。
1 _% n; f6 t2 M' I
/ P7 f' q/ ~0 _7 E0 U全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?7 l- p6 e1 o/ [
" B3 j4 |5 q, Q" u' X' l
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。$ o2 O s$ J/ G9 G
/ k3 x" H* j v( U( Q" K4 C& zAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。4 R; P% `0 e y# `- Q
3 ~( m, M6 O1 a& `3 i
但长期呢?- K& X. b5 [, Z; Z& ^0 W0 T# L3 `- H7 d
$ v' p. D& e! E6 t当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?/ O) d* D7 } j8 W- q( c2 \
$ K3 M; D. G. ]2 ^/ [ J是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
# L I. c0 H; X" B) a
+ t5 J5 Z; v$ T7 c& `我也不知道。
2 a& i( V0 ]& N% `, T+ J6 v4 k9 O' Q" S- D; J9 k8 b/ k0 {
但有一件事我特别想强调。
* Y9 U6 q; q7 G
7 N6 `8 D1 D) C) c) t D这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
h" b# q4 }: L: v. m0 M0 B- l3 ?( n, _8 p. W# U6 o, [
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。0 {! j3 E$ `5 _5 }! Z+ Z
# R2 \6 T3 |0 b
他们为什么还要加入这个联盟,用别人的AI?
( K9 E2 K& Y' B8 v( y8 p% D g' Y4 u& _' `' I# d
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
$ z* c; m3 `: T+ k2 G" |4 i$ Q0 Y" Q/ s$ c B, r7 N3 \
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
2 X3 I, `; K2 T4 `$ A2 p8 i
1 ^" a, H8 i" m5 b5 [Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
7 ?' X& P d1 ]4 @- c! }! r6 X% s: e h4 p/ N6 q% Z; h8 t
这是规模效应。6 ?2 r; O! G5 S6 J8 @* J
/ t6 Z R$ H. \
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。+ H% {+ N& Z! k- l0 @4 p
' P: |4 p* t' }$ S [8 E! f
这个规模,是人类团队根本无法覆盖的。
3 q+ L! @4 i, w+ I+ C4 F- L- \) N* e0 K/ ~, `
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。5 m9 i8 c+ d, H+ `
# Z; v9 V% T/ a3 y5 A8 ~' a5 ~
什么意思?
$ C1 _9 X% [- B) F* H5 C d2 P6 _# @" a* V, g
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
0 d0 k) n+ C# F! z2 T, C8 O$ u, p! l; Q' B: L% Y
类似现在的ISO认证,但针对的是代码安全。
( _1 w3 \8 Y, g, C. }3 d+ @+ S
0 u, g! y- \: Q) Q L8 O想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。6 V! f" a1 F+ R( l6 E" r
+ d8 I) S" ?1 ~) Y
这不是不可能的。
E9 N9 O# d0 r5 Y. ?4 v
& }8 g$ U7 b# T! a8 Z w当然,路还很长。现在还只是第一步。但方向是对的。) }9 H# e! @2 |5 H
* X& M6 ?! O8 Q* T. N* B" H
好了,写了这么多,让我最后说几句掏心窝的话。1 B Q( Q$ O/ h; z1 c7 G
; v8 _- f+ A' m1 k- v; p! @+ ^
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
! H; a) n" H* E& J1 }7 S8 s, k0 w' M# G2 j
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
5 x$ V: a6 r, Z3 F5 K9 H, {0 w3 y0 k+ S4 g0 t2 C7 _
这次不一样。这次是AI在帮我们发现自己的脆弱点。, v! P. q# U k, o% p
4 k) j4 z, Y6 E2 D
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。6 O. J: x9 A& n8 |4 I2 h$ M
/ G9 a9 ?9 b$ @9 J2 |
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。, L. i5 y# B: e c
; m2 ]0 ~: D8 M, s: Q2 N/ b+ a
我怕的是什么呢?; ^" F) A, b& {! C$ O2 b
1 s6 V0 e0 `$ z# E9 p
我怕的是,这个工具,只有大公司用得起。
2 ?- A( h5 s' K. F: ]5 C7 F5 J' B4 q
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
. _$ |1 Z3 ^+ Q+ l; ~2 [( {5 K$ l( ?2 J* @% i
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?: T. e; ?* g6 y, v2 P3 u
* O& z6 k* R4 u9 r
这些问题,现在还没有答案。, M: W8 r2 M" q. W$ b1 R
( |0 x6 c' z9 P% Q4 k6 p但有一点我特别想强调。
; H) x* C4 Y; q M
" D, g! e7 H' A' q. s3 \6 DGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
( D' X2 q+ ~ x! w* P0 u( N# Q" D7 U- T F1 ^
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。% t; D2 N: Z& p+ P* y4 M3 E+ @
3 T! f; b' L2 c; J) |0 a; L: v
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。3 D: s, y9 x4 g2 M+ c% @+ }" G
# V) O0 [- y2 ?; w$ b
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
& |- N0 C$ M! k) N. s( i7 ~/ @1 O; W2 m: l8 k W
这一天什么时候来?我不知道。可能5年,可能10年。
) @- B2 K9 N. y) k+ Y; o+ h h- \! x% u* L: u
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
" _% K; C+ m8 b4 E8 a H |
评分
-
查看全部评分
|