上传时间:2026-06-09 15:02:09来源:Seebug类型:AI安全
作者:Zhenfeng Cao 原文链接:https://arxiv.org/pdf/2606.05608 摘要 半个多世纪以来,软件工程一直建立在一个基本前提之上:人类工程师负责拆解问题,将决策逻辑编码为静态代码,并在需求演变时手动调整代码。本文认为,AI智能体(AI agents)的出现——即以大型语言模型作为主要推理引擎,将代码动态生成与丢弃作为工具性资源的系统——并非渐进式的改进,而是对软...
上传时间:2026-05-29 11:15:03来源:Seebug类型:AI安全
作者:Jing Fang, Saihao Yan等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2501.01593v2 摘要 现有研究表明,协作多智能体深度强化学习(c-MADRL)极易遭受后门攻击威胁。一旦观测到后门触发器,系统将执行恶意行为,引发任务失败或达成攻击者恶意目的。然而现有后门攻击存在诸多缺陷:瞬时触发模式隐蔽性差、需借助额外网络完成后...
上传时间:2026-05-25 16:55:09来源:Seebug类型:AI安全
作者:Prashant Kulkarni 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2604.28129v1 摘要 多轮提示注入遵循建立信任—话题转向—恶意升级的固定攻击路径,但文本层防御手段无法识别单轮对话看似无害的隐蔽攻击。本文发现,该攻击路径会在模型残差流中留下可识别的激活层特征:攻击每个阶段的切换都会引发激活向量偏移,最终累积路径长度远超正常...
作者: 安全客上传时间:2026-05-21 10:11:45来源:安全客
作者: 易安联零信任上传时间:2026-05-20 17:47:25来源:安全客
作者: 悬镜安全上传时间:2026-05-20 17:31:47来源:安全客
作者: sos_evil上传时间:2026-05-20 17:27:41来源:安全客
作者: 塞讯科技上传时间:2026-05-20 17:22:05来源:安全客
作者: 易安联零信任上传时间:2026-05-20 17:06:54来源:安全客
作者: 安全客上传时间:2026-05-20 16:44:41来源:安全客
作者: 科技云报到上传时间:2026-05-20 16:01:47来源:安全客
作者:CACTER邮件安全上传时间:2026-05-15 18:15:01来源:嘶吼
作者:CACTER邮件安全上传时间:2026-05-15 18:15:01来源:嘶吼
作者:嘶吼上传时间:2026-05-14 12:00:00来源:嘶吼
作者:嘶吼上传时间:2026-05-14 12:00:00来源:嘶吼
作者: 科技云报到上传时间:2026-05-12 16:57:09来源:安全客
作者: 科技云报到上传时间:2026-05-12 16:57:09来源:安全客
作者: 亿格云上传时间:2026-05-12 16:36:31来源:安全客
作者: 亿格云上传时间:2026-05-12 16:36:31来源:安全客
上传时间:2026-05-11 16:40:13来源:Seebug类型:AI安全
作者:Urchade Zaratiana, Mary Newhauser, George Hurn-Maloney, Ash Lewis 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2605.07982v1 摘要 保障大语言模型(LLM)输出安全合规、符合政策要求,需要能跨多安全维度实时扩展的内容审核机制。然而,当前最优的安全护栏模型均基于70亿–27...
上传时间:2026-05-11 16:40:13来源:Seebug类型:AI安全
作者:Urchade Zaratiana, Mary Newhauser, George Hurn-Maloney, Ash Lewis 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2605.07982v1 摘要 保障大语言模型(LLM)输出安全合规、符合政策要求,需要能跨多安全维度实时扩展的内容审核机制。然而,当前最优的安全护栏模型均基于70亿–27...
上传时间:2026-05-09 16:53:56来源:Seebug类型:AI安全
作者:Kexin Chu 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/pdf/2604.23338v2 摘要 智能体AI系统可跨多会话规划、保留记忆、调用外部工具并与对等智能体协同,无状态大语言模型则不具备这些能力。现有安全分类体系按攻击类型(如提示注入、越狱)划分威胁,却未说明脆弱的架构组件或威胁显现的时间尺度。本文直接解决这些结构性问题,提出分层攻击面模型(...
上传时间:2026-05-09 16:53:56来源:Seebug类型:AI安全
作者:Kexin Chu 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/pdf/2604.23338v2 摘要 智能体AI系统可跨多会话规划、保留记忆、调用外部工具并与对等智能体协同,无状态大语言模型则不具备这些能力。现有安全分类体系按攻击类型(如提示注入、越狱)划分威胁,却未说明脆弱的架构组件或威胁显现的时间尺度。本文直接解决这些结构性问题,提出分层攻击面模型(...
上传时间:2026-05-08 16:42:48来源:Seebug类型:AI安全
作者:Yaofei Wang, Rui Wang, Weilong Pang等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2604.25486v1 摘要 生成式语言隐写(GLS)通过将秘密信息嵌入自然语言生成过程实现隐蔽通信。然而在实际部署中,GLS易受分词歧义影响:相同的表层文本在接收端可能被重新分词为不同的token序列,破坏通信双方共享的解码状...
上传时间:2026-05-08 16:42:48来源:Seebug类型:AI安全
作者:Yaofei Wang, Rui Wang, Weilong Pang等 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2604.25486v1 摘要 生成式语言隐写(GLS)通过将秘密信息嵌入自然语言生成过程实现隐蔽通信。然而在实际部署中,GLS易受分词歧义影响:相同的表层文本在接收端可能被重新分词为不同的token序列,破坏通信双方共享的解码状...
上传时间:2026-05-06 16:44:36来源:Seebug类型:AI安全
作者:Ray Iskander,Khaled Kirah 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/abs/2604.25878v1 摘要 本文是后量子密码掩码数论变换(NTT)硬件形式化验证分析系列论文的第六篇。第一篇论文[1]建立了 QANARY 平台的结构依赖分析,第二篇论文[2]量化了部分 NTT 掩码下的安全裕度。布尔掩码的合成理论通过无干扰(NI)...
上传时间:2026-05-06 16:44:36来源:Seebug类型:AI安全
作者:Ray Iskander,Khaled Kirah 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/abs/2604.25878v1 摘要 本文是后量子密码掩码数论变换(NTT)硬件形式化验证分析系列论文的第六篇。第一篇论文[1]建立了 QANARY 平台的结构依赖分析,第二篇论文[2]量化了部分 NTT 掩码下的安全裕度。布尔掩码的合成理论通过无干扰(NI)...
作者: 科技云报到上传时间:2026-04-29 16:51:10来源:安全客
作者: 科技云报到上传时间:2026-04-29 16:51:10来源:安全客
作者: 科技云报到上传时间:2026-04-29 16:50:36来源:安全客
作者: 科技云报到上传时间:2026-04-29 16:50:36来源:安全客
作者: 安全客上传时间:2026-04-29 13:32:51来源:安全客
作者: 安全客上传时间:2026-04-29 13:32:51来源:安全客
上传时间:2026-04-24 16:54:27来源:Seebug类型:AI安全
作者:Matija Franklin, Nenad Tomašev等 译者:知道创宇404实验室翻译组 原文链接:https://blog.qiaomu.ai/api/images/document/2026/04/603f0cae8cd8ab94-ai-agent-trap.pdf 摘要 自主AI智能体日益在网络中自主行动,它们面临一种全新挑战:信息环境本身。由此产生了一个关键安全漏洞,我们称之...
上传时间:2026-04-24 16:54:27来源:Seebug类型:AI安全
作者:Matija Franklin, Nenad Tomašev等 译者:知道创宇404实验室翻译组 原文链接:https://blog.qiaomu.ai/api/images/document/2026/04/603f0cae8cd8ab94-ai-agent-trap.pdf 摘要 自主AI智能体日益在网络中自主行动,它们面临一种全新挑战:信息环境本身。由此产生了一个关键安全漏洞,我们称之...
作者:胡金鱼上传时间:2026-04-21 19:39:21来源:嘶吼
作者:胡金鱼上传时间:2026-04-21 19:39:21来源:嘶吼
作者: 科技云报到上传时间:2026-04-21 10:21:50来源:安全客
作者: 科技云报到上传时间:2026-04-21 10:21:50来源:安全客
作者:梆梆安全上传时间:2026-04-21 00:00:00来源:嘶吼
作者:梆梆安全上传时间:2026-04-21 00:00:00来源:嘶吼
作者: 科技云报到上传时间:2026-04-20 16:21:23来源:安全客
作者: 科技云报到上传时间:2026-04-20 16:21:23来源:安全客
上传时间:2026-04-15 03:31:00来源:Seebug类型:威胁情报
作者:知道创宇高级威胁情报团队 一、事件概述 近期,我们在客户现场应急响应中排查到一起新型攻击事件。攻击者伪造常用工具安装包诱导执行,随即部署一款带有合法数字签名的终端管理软件。经技术溯源确认,该程序具备主机信息收集、远程控制等完整恶意能力,其 C2 基础设施与 “银狐” 高度关联。由于合法数字签名的天然 “免杀” 特性,该恶意程序可轻易绕过主流杀毒软件检测,实现隐蔽入侵与长期控制。 银狐简介 银...
上传时间:2026-04-15 03:31:00来源:Seebug类型:威胁情报
作者:知道创宇高级威胁情报团队 一、事件概述 近期,我们在客户现场应急响应中排查到一起新型攻击事件。攻击者伪造常用工具安装包诱导执行,随即部署一款带有合法数字签名的终端管理软件。经技术溯源确认,该程序具备主机信息收集、远程控制等完整恶意能力,其 C2 基础设施与 “银狐” 高度关联。由于合法数字签名的天然 “免杀” 特性,该恶意程序可轻易绕过主流杀毒软件检测,实现隐蔽入侵与长期控制。 银狐简介 银...
作者: 蔚(Yù)谛上传时间:2026-04-13 11:15:45来源:安全客
作者: 蔚(Yù)谛上传时间:2026-04-13 11:15:45来源:安全客
作者: 三六零天御上传时间:2026-04-10 16:25:22来源:安全客
作者: 三六零天御上传时间:2026-04-10 16:25:22来源:安全客
作者:梆梆安全上传时间:2026-04-10 15:13:22来源:嘶吼