在回答相同问题时,先进的AI模型产生的CO2排放量是更常见的LLM的50倍

AI2026-01-14 17:43:45 詹蓝策

一项新的研究显示,我们试图制作人工智能模型越准确,它们的碳足迹就越大——一些提示产生的二氧化碳排放量是其他提示的50倍。

推理模型,如Anropic的Claude、OpenAI的o3和DeepSeek的R1,是专门的大型语言模型(LLM),比它们的前辈投入更多的时间和计算能力来产生更准确的响应。然而,除了一些令人印象深刻的结果之外,这些模型在解决复杂问题的能力方面也面临着严重的限制。现在,一组研究人员强调了模型性能的另一个限制——它们过高的碳足迹。他们于6月19日在《通信前沿》杂志上发表了他们的发现。

研究第一作者、德国慕尼黑应用科学大学研究员马克西米利安·道纳在一份声明中表示:“询问训练有素的法学硕士对环境的影响很大程度上取决于他们的推理方法,明确的推理过程显著推高了能源消耗和碳排放。”“我们发现,推理模型产生的二氧化碳排放量是简洁反应模型的50倍。”

为了回答给它们的提示,LLM将语言分解成标记——单词块被转换成一串数字,然后输入神经网络。这些神经网络使用训练数据进行调整,计算某些模式出现的概率。然后他们利用这些概率产生反应。

推理模型进一步尝试使用被称为“思维链”的过程来提高准确性这是一种技术,它通过将一个复杂的问题分解成更小、更容易理解的中间步骤来遵循逻辑流程,模仿人类如何得出同一问题的结论。

相关:人工智能不断“产生幻觉”,但有一个解决方案。然而,这些模型比传统的LLM有更高的能源需求,对希望部署它们的公司和用户构成了潜在的经济瓶颈。然而,尽管对更普遍地采用人工智能对环境的影响进行了一些研究,但不同模型的碳足迹之间的比较仍然相对较少。推理成本为了检查不同模型产生的二氧化碳排放量,新研究背后的科学家在不同主题下问了14个LLM 1000个问题。不同的模型有7到720亿个参数。

计算是在英伟达A100图形处理器上使用Perun框架(分析LLM性能及其所需的能量)进行的。然后,该团队通过假设每千瓦时产生480克二氧化碳,将能源使用转化为二氧化碳。

他们的结果表明,平均而言,推理模型每个问题产生543.5个标记,而更简洁的模型只有37.7个标记。这些额外的标记——相当于更多的计算——意味着更准确的推理模型产生更多的二氧化碳。

最准确的模型是720亿参数Cogito模型,它正确回答了84.9%的基准问题。Cogito发布的二氧化碳排放量是为更简洁地生成答案而制作的类似大小模型的三倍。

“目前,我们看到了LLM技术固有的明显的accuracy-sustainability权衡,”道纳说。“在正确回答1000个问题时,没有一个将排放量保持在500克二氧化碳当量以下的模型能达到80%以上的准确率。”但是这些问题超越了准确性。需要更长推理时间的问题,比如代数或哲学,导致排放量比直接查找查询高出六倍。

研究人员的计算还表明,排放量取决于所选择的模型。为了回答6万个问题,DeepSeek的700亿参数R1模型将产生纽约和伦敦之间往返航班的二氧化碳排放量。然而,阿里云的720亿参数Qwen 2.5模型能够以三分之一排放量的相似准确率回答这些问题。

这项研究的结果并不确定。研究人员强调,排放量可能会因所使用的硬件和用于供电的电网而异。但研究人员指出,它们应该促使人工智能用户在部署这项技术之前进行思考。

“如果用户知道他们人工智能生成的输出的确切二氧化碳成本,比如随便把自己变成一个动作人物,他们可能会对何时以及如何使用这些技术更加有选择性和深思熟虑,”道纳说。

© 版权声明

相关文章

暂无评论

暂无评论...