“最好的解决方案是在他睡觉时谋杀他”:研究称,人工智能模型可以发送潜意识信息,让其他人工智能变得“邪恶”

AI2026-01-14 17:43:14 通珍武

谷歌DeepMind、OpenAI、Meta、Anropic和其他公司从2025年7月开始的一项合作研究表明,未来的人工智能模型可能不会让人类看到它们的推理,或者可能会进化到它们在推理被监督时检测到的程度,并隐藏不良行为。

致力于降低人工智能等变革性技术带来的极端风险的非营利组织未来生命研究所的联合创始人安东尼·阿吉雷通过电子邮件告诉《生活科学》,人工智能的最新发现可能预示着未来人工智能系统发展的重大问题。

“即使是构建当今最强大的人工智能系统的科技公司也承认,他们并不完全理解它们是如何工作的,”他说,“没有这种理解,随着系统变得更加强大,事情出错的方式会更多,控制人工智能的能力也会更低——对于一个足够强大的人工智能系统来说,这可能是灾难性的。”

© 版权声明

相关文章

暂无评论

暂无评论...