地下室人工智能实验室捕获了10,000小时的大脑扫描,以训练思想到文本的人工智能模型——六个月内从数千人那里收集的最大已知神经数据集

AI 2026-01-28 22:30:19 水磊堂
一家旧金山初创公司在过去6个月里运行了人工智能领域一个更不寻常的数据项目。Conduit表示,它已经从地下室工作室的“数千个独特的个体”那里收集了大约1万小时的非侵入性神经数据,形成了它认为是迄今为止组装的最大的神经语言数据集。该公司正在使用这些录音来训练思想到文本的人工智能模型,这些模型试图在参与者说话或打字前几秒钟从大脑活动中解码语义内容。参与者在小隔间里坐了两个小时的会议,通过语音或在“简化”键盘上打字与法学硕士自由交谈。早期的会议依赖于严格的任务,但在注意到参与强烈影响数据质量后,Conduit转向了个性化的来回对话。目标是最大限度地提高每次录音过程中产生的自然语言量,同时保持文本、音频和神经信号之间的紧密时间对齐。在发现没有商用多模态耳机满足其要求后,Conduit自行构建了硬件。该团队将一流的脑电图、fNIRS和其他传感器组合到定制的3D打印外壳中,并为训练和推理创建了单独的设计。训练耳机是密集、沉重的四磅重钻机,旨在最大限度地扩大信号覆盖范围,而推理耳机将在模型成熟后进行消融研究来塑造。所有数据现在都通过Zarr 3格式流动,该格式将来自多个传感器类型的输入统一在一个框架下。该公司最初将电气干扰视为数据质量的主要威胁。工作人员用橡胶包裹设备,试验电源调节器,最终完全关闭主电源,依靠电池组消除脑电图记录中典型的60 Hz尖峰。这种方法产生了自己的问题,包括帧丢失和重型电池的稳定旋转,但Conduit后来在发现规模改变了权衡后恢复了正常电力。一旦数据集跨越大约4,000到5,000小时,该模型就开始在人员、展位和设置中推广,降低了积极降噪的价值。随着流程的扩展,运营成本下降。在5月至10月期间,通过重新设计其后端以实时捕获损坏的会话并允许会话管理员通过摄像头监控多个展位,Conduit将每可用小时数据的边际成本降低了约40%。定制预订系统引入了动态定价和超额预订,以保持其耳机在每天20小时的时间表中被填满。Conduit表示,它现在几乎完全专注于模型训练,并计划在以后的版本中详细介绍其解码系统。在谷歌新闻上关注汤姆的硬件,或者将我们添加为首选来源,以在您的订阅源中获取我们的最新新闻、分析和评论。
© 版权声明

相关文章

研究称,“热力学计算”可以将人工智能图像生成的能源消耗削减100亿倍——原型显示出希望,但创建能够与当前模型相媲美的硬件需要艰巨的任务

一份令人费解的新报告称,理论上,“热力学计算”可以大幅降低人工智能生成图像所消耗的能量,只需当前流行工具能量的一百亿分之一。据IEEE Spectrum报道,最近的两项研究暗示了这项新兴技术的潜力,但其支持者承认该解决方案还很初级。
2026-01-29

SK海力士投资100亿美元创建一家总部位于美国的“人工智能解决方案”公司,以重组总部位于加州的Solidigm企业固态硬盘品牌,以支持美国的投资

存储芯片巨头SK海力士正在美国投资100亿美元成立一家新的人工智能解决方案公司,暂定名为人工智能公司。该公司在一份新闻稿中详细说明,新公司将完全获得这项新投资,并能够在其认为合适的情况下部署它,以促进人工智能行业,支持新的人工智能初创企业和发展,并鼓励其在存储芯片开发方面的实力和竞争力。这种投资甚至可能意味着允许更容易获得SK海力士的关键技术,如高带宽存储器(HBM)。
2026-01-29

谷歌探索将人工智能数据中心置于太空-Suncatcher项目希望利用在轨太阳能来扩展人工智能计算

谷歌刚刚宣布,它正在探索将人工智能数据中心送入轨道的想法,以利用太阳的太阳能输出来发电。根据谷歌研究,太阳捕手项目的目标是拥有一个带有谷歌TPU的太阳能卫星星座,这些卫星可以进行光学通信。这将使该公司能够运行一个耗电的数据中心,而不需要在陆地上建造一个数据中心所需的庞大基础设施。
2026-01-29

地下室人工智能实验室捕获了10,000小时的大脑扫描,以训练思想到文本的人工智能模型——六个月内从数千人那里收集的最大已知神经数据集 暂无评论