Anthropic限制AI模型访问,担心未来网络攻击风险
Anthropic宣布,随着新模型在操作系统、网页浏览器及其他软件中发现数千个关键漏洞,其人工智能模型 Claude Mythos Preview 将仅向少数精选公司开放。
Anthropic表示,这款新的通用模型还在所有主要操作系统和网页浏览器中发现了高严重性漏洞。
“鉴于人工智能进展的速度,这类能力不久后就会扩散开来,甚至可能超出那些致力于安全部署它们的主体。”
人工智能已被黑客广泛用于发动网络攻击。根据AllAboutAI的数据,人工智能驱动的网络攻击同比增长72%,2025年全球87%的组织遭遇了人工智能赋能的网络攻击。
Anthropic对如果类似的人工智能能力被恶意行为者利用会发生什么表示担忧。
为应对这一问题,Anthropic周二宣布推出 Project Glasswing,这是一项汇聚40多家公司的新计划,参与方包括 Amazon Web Services、苹果、思科、谷歌、摩根大通、Linux 基金会、微软和英伟达。
Project Glasswing 将利用 Claude Mythos Preview 的能力进行防御性漏洞发现,与合作伙伴共享数据,并通过在恶意行为者利用之前修补关键漏洞来抢先应对威胁。
数十年前的漏洞正被发现
零日漏洞是指在任何有能力修复它的人甚至还不知道其存在之前,就可能被利用的软件缺陷。历史上,发现并修补这类漏洞需要稀缺且昂贵的人类专业能力,但人工智能可能改变漏洞发现的规模和速度。
Anthropic表示,其发现的漏洞“往往非常隐蔽,或难以检测”。
其中许多漏洞已有10年或20年历史,目前发现的最古老漏洞是 OpenBSD 中一个已有27年历史、现已修补的缺陷——该操作系统主要以安全性著称。Anthropic补充称。
它还发现了 FFmpeg 媒体处理库中一个已有16年历史的漏洞、开源 FreeBSD 操作系统中一个已有17年历史的远程代码执行漏洞,以及 Linux 内核中的众多漏洞。
Mythos Preview 还识别出全球最流行的加密库、算法和协议中的多项弱点,包括 TLS、AES-GCM 和 SSH。
它补充称,网页应用“包含形形色色的漏洞”,从跨站脚本和 SQL 注入,到跨站请求伪造等特定领域漏洞不一而足,而后者常被用于钓鱼攻击。

Anthropic称,其发现的99%漏洞尚未修补,“因此披露这些漏洞的细节对我们来说是不负责任的,。
软件将变得更安全,但不会一蹴而就
Anthropic表示,这很可能只是一个趋势的开端,且“守护全球网络基础设施的工作可能需要数年时间”,但人工智能将帮助加固软件和系统。
“从长远来看,我们预计防御能力将占据主导:世界将变得更加安全,软件也会得到更好的加固——在很大程度上,这将由这些模型编写的代码推动。但过渡期将充满挑战。”