TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview( ?/ _. z Y5 ^( Z) u! N y
7 N, o3 P- n6 W7 C T. L
5 O# b% M) k, ?7 Q& I
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……/ f* C6 I0 f/ z" r y
V4 ?# O6 t7 a4 a6 @故事是这样的。
2 H- C- l" B. M ^3 l" ?8 x2 i7 U! P# z+ r, b% a: o/ u6 J
我今天看到这个新闻,看完之后愣了好几秒。2 A3 e l6 n4 M5 }+ ?1 E9 ?
) [0 n1 w/ x3 `5 v
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。4 J! a) u: U. p8 C6 `* ^
. {; u. j, q a3 {
结果被一个AI模型给挖出来了。! e! i! u" [! K& X1 N/ ], I
+ e0 v: t7 a; P: r B; }" H这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
$ V& }% ^& B: t8 e2 i+ [ h5 U5 g6 L
; S6 K4 S- x9 x; N3 V6 d4 {然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。4 X2 v) Q6 p- w/ i/ ~
* k- u3 |! e0 \( b) e ^* @FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。/ d' B$ f' o7 _% K7 J
" z3 M1 T. e) S: Y然后呢?
# x( `# U; w8 D$ V$ C) n
J4 e' y$ v. T6 U' u- d% v然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。; k" B. ?9 J: }$ a
. \2 E. h8 t$ [/ C: {0 |- A这个项目,叫Glasswing。
- p, }) e2 ~" d7 u, R
: N% ]) I! H% i; ], }glasswing6 t5 f$ a3 r/ M8 [6 V
8 z- l1 x- h Y, _2 L: H
: M/ i" E8 a9 I- z" F- d& y先说清楚Glasswing是什么。8 f: J6 [& P9 q3 S8 T0 X
" A# M$ }8 O( f7 W
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
9 ]8 U8 J( I0 Y8 n; u# z+ W' J5 O- d9 ^1 ~
有多强呢?' J) {6 o" b& j( @
, g. }7 h- ? A2 L0 _! N' OCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。1 |8 U) K8 `* _
7 g( z& y: j2 c2 `% T, ?; L6 [9 z
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
5 F. D: d4 \5 n* P
3 Y- H& I, q! W. J5 b# Z8 t8 A2 b$ y; M差了13个百分点。 [4 M5 D3 Z5 R$ O
! H" [ J/ |, f- |, {
你说这13个百分点意味着什么?0 g7 c+ }) E! k+ A b+ V
6 E' d7 G; U* T" J2 D f' M7 Z
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
' ?! l( E: d$ a. m% I" M6 n% F# S- w! f9 l R. w2 w7 b
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
6 Y0 \5 V4 \, t4 U M* n+ S, W9 a! g
8 O: N' c; L5 U" F2 ?" {或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
0 D3 P, q, B0 q& m. |$ b' C5 f0 {5 q+ D
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
8 |- t5 M: K: e' m/ c3 Z5 Q- R- Y: j4 Y8 y5 H% b
OpenBSD是个什么存在?% C6 g. t0 p6 {. H! r( X2 t6 Q3 V3 a
2 M- X3 H( z8 O2 b6 [6 Q+ w2 [3 H它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。& V. i: Z$ D2 T3 y
6 L- G8 T I- e8 _" {' C) c1 `: F这样的项目,代码审计了多少年了?二十多年。
/ `. S- q5 ^4 ? j& g2 W
/ Y0 ^. j5 M& r4 r ?0 ?2 t9 e u然后,一个漏洞,在里面躺了27年。
1 z. K; H+ [) Z# J: D- b
# j0 W2 v. j/ L. _, ^5 [# B7 @" c$ H这说明什么?3 {& l. a* J3 b& j) u+ _) c f
4 s& {" e& @+ ~4 `8 Q不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
: h: p8 F x1 P# r5 t4 d# x- a' Y* ^" Y+ v3 i3 {4 B
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。* L8 M u1 X* P% S% C3 D5 b
3 j$ t4 U' H8 G: P' N+ X# ~1 [& w* uMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。 V' N( R6 a# l4 X
* [, J) U: }- g/ t
这种漏洞可怕在哪?9 o/ Q# K: R6 a- U
! j- l9 h m* f6 W
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。; {5 s4 N8 N# D
, A w( K4 O H8 X$ [5 X {传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
: H1 d; k3 Q# ~2 g4 U# {( ?; |6 t2 ~. v+ m" a. q% F
FFmpeg那个例子更让我震撼。9 C% K( j" m1 c4 T, ?
! A% p$ c3 I4 Y8 I6 M16年。7 U4 R. U/ x. a% R) a
) W& j& n% P9 ^2 D$ cFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
( M; T- C; _" k4 ?3 m
- I& D# V/ C! Y0 }$ `# q, G16年都没有人发现。然后Mythos Preview扫了一下,找到了。9 k7 K& x( }) v$ m7 L
. z+ D* B! S3 J& @注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
8 P5 x% p6 M+ R7 l" s% J3 v7 k) u" l* U8 K5 u9 _" x
这是主动防御,不是被动响应。" G- a, N3 w l
+ V, z7 b' x e( f7 l传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。+ q/ d# n) D! R+ U) H
% t! g$ F7 N6 ^& M& T9 q
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
8 b! \. w0 l2 O% K4 q4 v$ \, g6 y6 D( U6 U9 {
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。1 c4 n7 X+ c' `8 m# u6 t9 Y+ E% A
2 P5 W J; ^; d8 Y- Y现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。7 X- W0 g2 E, A6 v0 z: S, N
0 U$ \0 E2 e4 p. `0 m& i1 QGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
) Y' R; W) V7 I" Z: ?! o H" m
0 C) g! e, w4 |: _$ D6 R4 }/ t这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
5 q, \5 d' |( o! t5 P# c+ l9 ?0 N5 K. y$ M
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
# t: H, J4 A+ q, g4 A _ f, r0 ~3 s# T" \, n2 k. g! I# N
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
/ O9 | j. R5 B6 o( X% W) o4 u! A. @4 n1 r5 ?
这个价格贵不贵?
1 k- F& D* m" \ _) l
6 t$ j! ^- R# ~* ~对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
9 A3 T2 A: k2 n+ z! P7 B9 N6 M" i& V+ A7 z2 {1 B+ G1 q" h
Mythos Preview能发现那些工具发现不了的漏洞。4 w9 F- k; C3 g8 [) }+ E
& m) s! T$ |2 D' D& ^6 S
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。& {0 s5 V" {+ L o+ {! d
; U* M0 v Q7 K' y另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
. p1 s, g5 @6 W' H1 H0 J: M) } v. F
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。0 m6 t" Y% G3 q& W6 Q/ B
5 I) Q! X7 j4 @6 Y1 K3 Y
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。( H7 y% @( u S/ X& C
$ N' X% v8 c6 a8 J) o还有一个细节,我觉得特别有意思。' ]6 _$ {7 m2 B9 F: F, w8 w
9 t1 |1 U l# G" t7 A8 o
漏洞发现之后,公开披露的时间是90天。7 w1 ^/ _7 a k+ G" w
7 @3 n% J$ E! R" q90天是什么概念?! e6 T7 B- x0 {
% U5 A: q( f3 f$ j1 _$ Q! T7 q行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
. G& O, ?' G, {: |
% N4 z) y* y" m% C1 ?& }' o但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。8 M: t# ]) D! L) j' C# n+ `
2 W# b9 K/ |% z" X: [8 O- t3 f; A- u
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。' ]' T3 C% v) v( l0 d- A/ H
7 l; ^) v$ l3 V X
这意味着,漏洞披露的节奏,整个就变了。
- l) |* E( t" ~; }% ]$ {1 ~+ z( ^3 w* i# [' T$ a3 [
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
/ A5 ~, T5 [" A# Z: ~9 M, X0 C! Q) a& ]9 J
厂商的补丁开发速度,能不能跟上AI的发现速度?1 X- m, I3 }0 Q6 R, Z
7 Q7 g" M' t( U# j
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
1 D$ \' Y$ V I8 }9 J; D" y0 x4 G6 |; b2 V. R
写到这儿,我突然想到了一个更大的问题。
/ N, ^) ~; ~ v9 } o+ _1 B6 t8 p7 ~" f: u/ j' k3 ?8 V
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。 H, z n7 L" ]
1 ?: y2 N" D# \
透明,意味着隐藏的东西变可见了。0 ^! v7 H/ |3 k J: l: {0 `
0 y( S Q2 p9 j6 C' W2 J2 J6 C/ L
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
, o8 R6 G9 _, n' y- [0 o! A( a, y1 U
这个意象,放在漏洞挖掘上,太精准了。5 p5 J; n6 q& E- d8 s, R% k
3 w |! @- T5 x5 l' [2 G3 k$ w
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。: l* }: |. m2 y" b: b& M8 e$ V
# `, X/ S& `' g. W; X以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。5 t' {. Q6 P& i5 R
9 c1 g, C8 m6 T5 b) ~) T; o- R
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。- j* [+ m2 x, @4 K% K' E
) b9 z- U t8 b" I& A, j4 ?6 |
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
9 ?- N7 X( L/ r! r0 R; [% ~, H% \/ s' f7 P
这是一件好事吗?
- Z+ B% f$ o9 ]
# y' u& k7 x' M* A) N8 u我觉得,短期内,这是一件非常非常好的事。
8 ]! ~7 O# t' S& t3 P! U/ l' O8 p5 G. ]
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?% n& g1 Z) O3 \6 Y$ [
% d# A1 n3 Q! W( H' K6 X/ L2 l这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
( J. r' V4 [" Y" y4 y+ J
5 c; `' v6 i' i3 iAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。9 G0 \: f) T+ |4 O* w* A" n( I2 V7 n
$ c8 R, s+ ^" W, g B+ ]# \
但长期呢?
$ ?9 n/ V' t( t* K! F( V& b8 ^$ y0 |$ K4 ^6 W
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?0 M. ]# a4 Y4 e/ L8 {* B% A
* y, A9 B! e- k是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
. |, O$ e: w8 n. R% f0 {9 I8 n% Q1 o: i8 S% @+ w9 {3 z7 C! f
我也不知道。1 p& C9 L9 F0 u k# K
9 F9 Z; | O3 b$ c/ |* u但有一件事我特别想强调。( X, ^2 U( ~+ v3 \- [8 l/ Y4 }# Y
! B" N1 M, ~% s4 [) J& K9 B* p! `4 k% m% b这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。0 e0 y( B4 u g- V" G2 x' K
3 s8 p5 f2 a. s9 {3 o
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
" I# f; M7 ^% {
1 P! `- l2 m9 {$ e! \! s他们为什么还要加入这个联盟,用别人的AI?
" b- ?; l. _% Z9 O- [6 q$ `9 C- {7 _, n8 _
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
y2 ~* j9 c6 E. t H5 }- q [* j0 k# @1 [/ U: M
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。6 P K% b9 p, z# D: E
8 _6 Y1 f. o7 T; W- pMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
0 g( {" H& s5 h1 j$ y+ D& X( K( h
: g% J0 e1 h: L6 s. ~" B这是规模效应。 Q7 D" z* ^2 O l! }7 ~) n9 B
3 b9 X1 s& v$ u+ |5 N' S
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
. {# l: l! H1 H+ s0 k u4 F# d6 t+ T" l$ y
这个规模,是人类团队根本无法覆盖的。
( ?4 _' \7 Q6 i X4 w0 e) b% |) y3 F* m6 G3 r
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。$ M+ Y( V9 h. q% E% A
9 }) x( q, @# @) d什么意思?4 A: Z4 n* G H: ~( i+ I. t; M) {! {
4 R, k6 b8 W% _5 h% u+ |- }$ H
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
7 ~' A# M* p: T5 H7 ~: f9 o" X6 c6 B% X- n+ U
类似现在的ISO认证,但针对的是代码安全。
9 X- B9 t; a* U$ C. a
1 y9 K2 l2 v+ P想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。 J8 Y& N2 S$ s( p$ M3 R
) g# g, T1 O4 j8 h+ N7 M: {这不是不可能的。
4 U5 |& z* h3 v. G$ k! q3 ^: `5 u: [9 f+ X4 J* |
当然,路还很长。现在还只是第一步。但方向是对的。" k! }8 i5 i2 J4 _% t4 Z1 F
' U( y* E6 k- |. U2 P! Q+ k x
好了,写了这么多,让我最后说几句掏心窝的话。9 [+ b; o5 k6 x* x# O l# ^
$ B+ m2 N( t8 ~5 _我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
0 O9 i/ c @& R: z; S2 o6 c$ I+ q& D+ W& h
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
, K) h3 r6 V9 B" [ T% i/ T
2 ^7 D# ?) z8 n+ Z& L# d这次不一样。这次是AI在帮我们发现自己的脆弱点。' }) D9 E+ l/ g! E- K' u v/ n
# m! L2 }- t) Z, h
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
! {; B1 R" T; M) I# n0 J! H* B+ J3 F" ?& y: X, J( d, H* z- t( U# Q' ?
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。4 {! m, f' r: n- A! p3 M
x# |$ k8 T9 B& i7 v我怕的是什么呢?( Q! p! U5 v2 I$ z0 ^+ Q( y
5 r3 E, _ F# e我怕的是,这个工具,只有大公司用得起。# p: f' o( b7 m: }- w. v
* j9 p1 ~1 \2 HAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?- l0 F2 Y. n! Z& T {% q, C& @
% ^8 T3 Z0 }# ~5 ^' e) NAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少? ~" p5 u, j `* D- j) L
" C2 h# Y' c: D0 P8 T8 L2 g0 U3 C* F这些问题,现在还没有答案。/ b( E/ u' D! N: Q& c+ I
% n* B; [% I2 s但有一点我特别想强调。4 P# J/ X# y7 z ~, `
: A, R$ A% Q* C& B1 MGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。7 m6 _6 c% g) F j5 {+ z
, X+ P2 R# [% M6 K( K2 A以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。3 f# l) s/ Q4 }0 E
+ H/ c; a; j" } d% d
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
1 y) r9 j# g4 M/ w1 b9 d+ d1 H$ j8 A) ?4 ~; a* Y" @
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
- A6 v# r) m5 ^+ T: M) Q( A+ X$ \* h2 ^+ _
这一天什么时候来?我不知道。可能5年,可能10年。" V% B- E, {- i! N# Z
. J) {# E0 t: O+ V% m+ W但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
, S! v j( S: H. c( L3 A |
评分
-
查看全部评分
|