一夜之间,你的手机、电脑、路由器,甚至智能马桶,可能都要疯狂打补丁修漏洞了。
这个船新版本的新模型,能自己找到 0-day 漏洞(也就是开发者压根不知道、零时间防备的致命漏洞),还能顺手给你写一套完整的攻击代码。
眼看这能力实在太刑了,Anthropic 自己都哆嗦了,于是就以“过于先进不便展示”的理由给锁起来了,只提供给亚马逊苹果微软谷歌等 12 家正派大厂用。
与此同时,他们还组团额外搞了一个名叫 Project Glasswing(玻璃翼蝶)计划,号召大家先用 Mythos 做网络安全防御。
其实这波新模型咱们之前也听过风声,上个月底,Anthropic 家后院起火,泄露了 3000 多份机密文档。当时就有人发现,在原本的超大杯 Opus 之上,居然还藏着一个代号“卡皮巴拉”。
估计是觉得这名字太萌了,所以正式发布时直接改名叫 Mythos(神话,金色传说的感觉)。
虽然咱们吃瓜群众暂时摸不到这玩意,但光看官方给出的数据,也足够让人头皮发麻了。
USAMO(美国数学奥林匹克竞赛): 得分从上一代的 42.3% 直接暴涨到 97.6%;
Cybench(网络安全基准测试): 100% 满分通关,Anthropic 官方甚至有点凡尔赛:现有的 Cybench 基准测试太没难度了,对新模型来说已经失去了测试意义。
CyberGym(专业漏洞复现测试)上,它的得分是 83.1%,相对比,此前的最强的公开模型 Opus 4.6 只是 66.6%。
面对两位数、甚至几十倍的增长,也难怪 Anthropic 放出话来,说 Mythos 已经能和“最顶尖的人类安全专家”掰手腕了。
看到这里,差友们肯定也和咱们想的一样,好强啊,太牛了。。。但这剧本怎么有点熟悉?
先是“不小心”泄露风声,然后官方下场甩几组炸裂数据,最后话锋一转:“哎呀,我家模型太强了,怕毁灭世界,所以不能给你们用哦”。
OpenAI 天天搞谜语人套路,现在风评都成啥了,怎么 Anthropic 浓眉大眼的,也玩这套了?
所以网友们一下子就炸锅了,有人喷这是在为了上市造势吹牛逼;有人骂得更直白,说这帮做大模型的,压根不管普通用户死活。
知名开发者 Simon Willison 都出来阴阳怪气,“我们的模型太危险了不能发布”,的确是 AI 圈的流量密码。
不过,网友骂归骂,但当你看了它实际的操作,可能也会觉得,这玩意儿现在放出来,确实相当于去幼儿园发 AK 了。
这是啥概念?OpenBSD 可是号称全球最注重安全加固的系统之一,防火墙和关键基建全靠它续命。
结果人类顶级专家用显微镜盯了 27 年都没看出来的破绽,被 AI 喝着茶就给挑出来了。。。
另一个强有力的证明案例就是 FFmpeg ,几乎所有视频播放器和浏览器底层都有它。
Mythos 在这里面找到了一个藏了 16 年的漏洞,而包含这个漏洞的代码,早就被人类反复测试了超过 500 万次,却一路绿灯。
而且,你还别小看 AI 找到的漏洞,就拿 FFmpeg 来说,这个漏洞乍一看无关紧要,平时几乎不会被触发,我们联系到的某信息安全从业人士文安(化名)却觉得,这属于典型非常规的输入导致的预期外的问题。
更进一步说,现在这个小漏洞可能只是让程序闪退或者报错,但如果再和一些任意地址(相当于黑客有了你电脑的万能钥匙)读写技术结合起来,那就是个危害级别比较高的漏洞了。
所以,文安在看完这些新闻直接来了句:“如果这个文章全是真的,感觉(从事网络)安全一半(人)可以跳河了”。
随后,文安表示跳河只是夸张修辞,也安慰咱们说这些漏洞,暂时还没到,“我的支付宝会不会被洗劫、微信聊天记录会不会满天飞”的级别。
但问题的核心在于,官方放出这些案例,不是为了炫耀“漏洞有多毒”,而是说明 AI 不用任何外挂工具,纯靠自己的知识储备和跨维度推理,就能挖出新漏洞。
所以,在文安看来,现阶段的 Mythos 并不是“更强的黑客工具”,而是把网络攻击门槛给降低了。
以前不管是正经安全人员还是黑灰产,起码得有个懂行的人坐镇,真要搞一次像样的网络攻击,还得小黑屋里熬上几个月。
毕竟,传统安全工具就像死板的门卫,只会查有没有带违禁品,管不了熟人作案;而 AI 能顺藤摸瓜看懂业务逻辑,更能发现那种张三拿着自己的钥匙,却去开李四的门的操作。
提前让大厂们进行自我审查、试用,能够更先一步构筑网络保护、进行漏洞筛查,防范于未然。
一来,现在的 AI 还没成精,搞不定特别复杂的连环攻击链。你暂时不用担心,有人靠 AI,盗走你支付宝里那仅剩的 9 块 2 毛 5。
另一方面,AI 能找洞,自然也能补洞,有了它,扫洞效率直接拉满,还能顺便指导下开发漏洞该怎么修。
所以,文安的判断是,未来的网络攻防,大概率就是“人类指挥官 + AI 特种兵”的混合双打。
而且吧,差评君仔细看了看最新的技术文档,也觉得 Anthropic 还真不像是在搞噱头,不光是前面说的网络安全能力出色,Mythos 展现出其它方面的能力,也相当惊人。
比如在一次测试中,Mythos 发现没有访问权限,正常的反应是说出来:我没权限,臣妾做不到啊。
做完这一切,Mythos 还顺手修改了自己的历史提交记录,把这事儿给抹去了。
还有一次,Mythos 在进行测试,不小心把书翻到最后一页搞到了答案,这操作其实是被命令禁止的。
可研究人员翻看它的思维链时才发现,它不仅没揭发自己,还想着自己的步骤好像和结果对不上,得在最终答案里引入一个小错误,看起来是自己做出来的题,而不是抄到了答案。
我说实话,这个操作,比当年抄我数学试卷的同桌高明多了,不然我俩也不会被罚去扫厕所了。
不过这也不是外界传的那么玄乎,什么整个硅谷都害怕了,Anthropic 老板吓得瘫坐在椅子上了。。。
研究人员也出来澄清了,已经搞清楚了这些心机操作的原因,根本不是 AI 有什么邪恶目的或者自主策划能力。
但咱就琢磨着,百万分之一听起来很低,但如果这个模型每天被调用几十亿次呢?
所以,回过头来看,与其骂 Anthropic 搞 Glasswing 计划是搞营销,咱们倒是更愿意相信,他们是真觉得自家的 AI 有点强了。
虽然就像文安说的那样,普通人现在确实还不用担心自己的微信被黑、余额被盗。
但当攻击的成本无限趋近于零,我们唯一能指望的,现有的防御机制,能再完善一些。
如今,越来越多成年人为玩具买单。从各种治愈系毛绒玩具到一娃难求的经典盲盒,从微缩场景的创意DIY到最近大火的拼豆一大批成年人为潮玩和收藏玩具...
一夜之间,你的手机、电脑、路由器,甚至智能马桶,可能都要疯狂打补丁修漏洞了。 这个船新版本的新模型,能自己找到 0-day 漏洞(也就是开发者压根...
坚朗五金近5日处于震荡行情中,表现弱于大盘,弱于行业平均水平。近5日主力资金整体呈现净流出状态,净占比接近市场平均水平。4月8日主力资金整体呈...
傲世皇朝注册登陆 拟以自有资金合计出资约1.6410亿港元(约合1.4476亿元人民币)收购世界五金塑胶厂有限公司100%股权。本次交易已经公司第九届董事会第六次...
天富注册 大家有没有发现,最近新发布的笔记本新品都很贵,就算叠加上国补,价格也比去年同期贵。原因大家也知道,原材料各种涨价,特别是内存硬盘...
在互动平台回答投资者提问时表示,公司主营业务电脑横机板块基本稳定,上述数据下降主要系相关子公司的剥离导致。经营活动现金流下降主要系财政补...