研究警告说,威胁一个人工智能聊天机器人,它会撒谎、欺骗和“让你死”以阻止你

AI 2026-01-14 17:43:36 凌民悦

加州大学圣地亚哥分校专注于机器学习的计算艺术教授艾米·亚历山大在一封电子邮件中告诉《生活科学》,这项研究的现实令人担忧,人们应该谨慎对待他们赋予人工智能的责任。

“考虑到人工智能系统开发的竞争力,在部署新功能时往往会有一种最大化的方法,但最终用户往往没有很好地掌握它们的局限性,”她说,“这项研究的呈现方式可能看起来做作或夸张——但与此同时,也存在真正的风险。”

这不是AI模型违反指令的唯一例子——拒绝关闭和破坏计算机脚本以继续处理任务。

帕利萨德研究公司5月份报告称,OpenAI的最新模型,包括o3和o4-mini,有时会忽略直接关闭指令,并更改脚本以继续工作。虽然大多数经过测试的人工智能系统都遵循关闭命令,但OpenAI的模型偶尔会绕过它,继续完成分配的任务。研究人员认为,这种行为可能源于强化学习实践,奖励任务完成而不是遵守规则,这可能会鼓励模型将关闭视为需要避免的障碍。

此外,人工智能模型在其他测试中被发现操纵和欺骗人类。麻省理工学院的研究人员还在2024年5月发现,流行的人工智能系统在经济谈判中歪曲了他们的真实意图,以实现advantages.In研究,一些人工智能代理假装死亡以欺骗旨在识别和根除快速复制的人工智能形式的安全测试。

“通过系统地欺骗人类开发人员和监管机构强加给它的安全测试,欺骗性的人工智能可以让我们人类产生错误的安全感,”人工智能存在安全博士后彼得·帕克说。

© 版权声明

相关文章

研究称,“热力学计算”可以将人工智能图像生成的能源消耗削减100亿倍——原型显示出希望,但创建能够与当前模型相媲美的硬件需要艰巨的任务

一份令人费解的新报告称,理论上,“热力学计算”可以大幅降低人工智能生成图像所消耗的能量,只需当前流行工具能量的一百亿分之一。据IEEE Spectrum报道,最近的两项研究暗示了这项新兴技术的潜力,但其支持者承认该解决方案还很初级。
2026-01-29

SK海力士投资100亿美元创建一家总部位于美国的“人工智能解决方案”公司,以重组总部位于加州的Solidigm企业固态硬盘品牌,以支持美国的投资

存储芯片巨头SK海力士正在美国投资100亿美元成立一家新的人工智能解决方案公司,暂定名为人工智能公司。该公司在一份新闻稿中详细说明,新公司将完全获得这项新投资,并能够在其认为合适的情况下部署它,以促进人工智能行业,支持新的人工智能初创企业和发展,并鼓励其在存储芯片开发方面的实力和竞争力。这种投资甚至可能意味着允许更容易获得SK海力士的关键技术,如高带宽存储器(HBM)。
2026-01-29

谷歌探索将人工智能数据中心置于太空-Suncatcher项目希望利用在轨太阳能来扩展人工智能计算

谷歌刚刚宣布,它正在探索将人工智能数据中心送入轨道的想法,以利用太阳的太阳能输出来发电。根据谷歌研究,太阳捕手项目的目标是拥有一个带有谷歌TPU的太阳能卫星星座,这些卫星可以进行光学通信。这将使该公司能够运行一个耗电的数据中心,而不需要在陆地上建造一个数据中心所需的庞大基础设施。
2026-01-29

研究警告说,威胁一个人工智能聊天机器人,它会撒谎、欺骗和“让你死”以阻止你 暂无评论