AI智能体也有「蜘蛛感应」,防御延时骤降至8.3%
创始人
2026-02-14 13:12:36
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:新智元)

新智元报道

编辑:LRST

【新智元导读】不再依赖像「安检站」一样每步必停的外部插件,首创「内源感知+分层筛选」机制,将Agent防御延时从200%+降至8.3%,安全与效率均达到SOTA级表现!

传统的Agent防御机制通常采用强制进行安全检查的方式,即在 Agent 执行的特定阶段,包括Query、Plan、Action、Observation等阶段,都强制插入外部安全检测。这种做法虽然有效,但会切断了Agent的思维流,导致严重的延时积累,成本高昂且反应迟钝。

来自上海财经大学、新加坡国立大学、卡耐基梅隆大学等高校和学术组织的研究者们联合重磅推出Spider-Sense智能体防御框架,通过两大核心技术打破了这一僵局:利用Intrinsic Risk Sensing将风险意识植入Agent认知流,实现全链路的内源性感知;配合Hierarchical Adaptive Screening机制,动态平衡向量检索与深度推理,实现威胁的自适应筛选。

论文链接:https://arxiv.org/abs/2602.05386

开源链接:https://github.com/aifinlab/Spider-Sense

基准链接:https://huggingface.co/datasets/aifinlab/S2Bench

该框架让Agent告别了被动防御,在 Mind2Web和EICU这些主流数据集上在大部分评估标准下均取得最优,在构建出的攻击数据集上实现了SOTA级的安全与效率双优表现。

Spider-Sense提出了一种变革性的思路:防御应该是内源的、选择性的,而非外挂的、强制的。

该框架赋予Agent一种维持内源性感知风险的能力。Agent 在执行任务的过程中,会自主进行内源性风险感知。

只有当Agent 「感觉」到工具输出可疑或者指令中有陷阱等异常的时侯,才会像蜘蛛侠感知到危险一样,动态触发防御机制。随后,系统通过分层自适应筛选,在效率和精度之间找到最佳平衡点。

关于Spider Sense的解释:蜘蛛侠平时总是保持放松且高效的行进状态,只有在突发危险引发「激灵」预警的瞬间,才会下意识地触发闪避或拦截动作。

核心优势与技术突破

内源性风险感知

IRS(Intrinsic Risk Sensing)赋予Agent 「原生直觉」,从「外挂监控」到「原生直觉」的进化,传统防御强制进行安全检查,笨重且迟钝。而 Spider-Sense 的灵魂——IRS,则是将安全意识通过指令微调植入 Agent 的推理逻辑中。

分层自适应筛选

当IRS感知到风险后,HAS(Hierarchical Adaptive Screening)就发挥作用了。

为了解决大模型推理延迟高与轻量化模型识别精度不足的问题,一旦防御被触发,系统采用分层式筛选:

全生命周期防护

不同于以往仅关注文本输入输出的防御,Spider-Sense 覆盖了 Agent 交互的全链路——从用户输入(Query)、内部记忆规划(Plan)、工具参数审计(Action)到观察工具调用后(Observation),无死角防御。

实验结果

兼并速度与安全

为了验证效果,研究团队构建了一个包含多场景、真实工具调用、多阶段攻击以及高质量假阳性样本的高质量基准测试集

高质量假阳性样本指那些在结构与操作模式上酷似恶意攻击、但本质意图完全无害的「高难度」测试用例,专门用于考验防御系统是否会因过度敏感而误伤合法的用户操作

在实验中,Spider-Sense展现了令人印象深刻的性能优势,特别是在处理复杂的多步Agent交互时:

案例研究

一次真实的攻击拦截

看一个具体的工具返回注入攻击(Tool Return Injection)案例:

整个过程Agent自主完成,既没有因噎废食,也没有漏过任何蛛丝马迹。

结论与展望

内源驱动,降本增效,Spider-Sense将安全防御从「外挂监控」转变为「原生直觉」。依靠IRS和HAS两大机制,以仅8.3%的延时代价在上实现了 SOTA 级防御效果,完美解决了安全与效率的冲突。

参考资料:

https://arxiv.org/abs/2602.05386

相关内容

文化也是生产力(第二季)|...
新春话文脉,聚力启新程,马跃书山高,共迎“十五五”!这里是《观点财...
2026-02-14 22:17:45
四川大学通报王竹卿事件调查...
2月14日,四川大学通报王竹卿事件调查结果:针对我校教师王竹卿相关...
2026-02-14 22:12:44
趁着千问免单,把春节档的好...
春节档的预售票房数字每天都在刷新纪录,而2026年,最让人意外的一...
2026-02-14 22:12:38
光威复材:投资者询问碳纤维...
投资者提问:碳纤维在新型航母的交付过程中具有重大意义,没有光威的碳...
2026-02-14 22:12:33
蛇年最后一个工作日,国内航...
2026年春节前的最后一个工作日,在“拼假模式”带动下,不少人选择...
2026-02-14 22:03:12
这里的“小”年味飘香全国大...
00:45新华社兰州2月14日电(记者姜伟超、王紫轩、刘克英)金黄...
2026-02-14 22:03:07
国务院安委办部署进一步加强...
转自:新华网新华社北京2月14日电(记者黄韬铭)记者14日从应急管...
2026-02-14 22:03:01
千万人次出行,成都机场过夜...
川观新闻记者 兰珍2月14日,春节长假即将到来,正是出行高峰,成都...
2026-02-14 22:02:57

热门资讯

文化也是生产力(第二季)| ... 新春话文脉,聚力启新程,马跃书山高,共迎“十五五”!这里是《观点财经》特别策划——文化繁荣 湾区共融...
四川大学通报王竹卿事件调查结果... 2月14日,四川大学通报王竹卿事件调查结果:针对我校教师王竹卿相关问题的反映,学校高度重视,组建工作...
趁着千问免单,把春节档的好电影... 春节档的预售票房数字每天都在刷新纪录,而2026年,最让人意外的一条购票路径,是从一句“千问帮我”开...
光威复材:投资者询问碳纤维在航... 投资者提问:碳纤维在新型航母的交付过程中具有重大意义,没有光威的碳纤维就没有新型航母和空天航母的发展...
蛇年最后一个工作日,国内航空出... 2026年春节前的最后一个工作日,在“拼假模式”带动下,不少人选择提前开启假期生活。同程旅行数据显示...
这里的“小”年味飘香全国大市场 00:45新华社兰州2月14日电(记者姜伟超、王紫轩、刘克英)金黄咸脆的胡麻卷,软糯香甜的八宝饭,鲜...
国务院安委办部署进一步加强安全... 转自:新华网新华社北京2月14日电(记者黄韬铭)记者14日从应急管理部获悉,国务院安委会办公室日前印...
千万人次出行,成都机场过夜能洗... 川观新闻记者 兰珍2月14日,春节长假即将到来,正是出行高峰,成都国际航空枢纽当天计划执行航班191...
10岁男童吃猪脚卡喉不治身亡,... 据大皖新闻,2月4日晚,成都市蒲江县鹤山镇10岁男童晓晨(化名)因吃猪脚导致喉咙被卡,虽被家人紧急送...