据报道，OpenAI 正在积极开发音频 AI 模型，并为首款硬件设备做准备。

IT之家1月1日下午报道，OpenAI正在全面提升语音AI能力，为未来推出基于语音的个人AI设备铺平道路。知情人士表示，该设备将使用听觉交互作为其主要形式，而不是依赖屏幕。目前，ChatGPT 的语音功能不使用文本响应背后的相同模型。 OpenAI内部研究人员认为，现有的音频模型在准确性和响应速度方面明显滞后，该公司决定整合过去两个月的工程、产品和研究工作，重点克服音频模型的缺点。这一调整直接体现了 OpenAI 的硬件目标，即创建可以通过自然语音命令进行操作的消费设备。此前的报告表明，第一批产品至少需要一年的时间。随着新架构的引入，音频模型现在可以生成更多自然且情绪化的语音响应，能够同时与人类交谈并对中断做出反应。 OpenAI计划在2026年第一季度正式推出该模型。在硬件方面，OpenAI与谷歌、亚马逊、Meta和苹果做出的决定类似。这意味着现有的传统设备在设计时并未考虑到未来与人工智能的交互。 OpenAI 团队认为语音是最接近人类交流本能的东西，我们希望用户能够通过“说话”而不是“看屏幕”与他们的设备进行交互。与 OpenAI 合作硬件项目的 Jony Ive 也强调，无屏设计不仅更加自然，而且还有助于防止用户沉迷。他认为新一代家电应该纠正过去家电的负面影响并为此承担责任。然而，OpenAI 仍然面临着现实的挑战。专家指出，许多 ChatGPT 用户不熟悉使用语音功能。这种情况不仅是戴尔效率低下，而且还缺乏功能意识。 OpenAI在推出音频优先的AI设备之前首先需要改变用户的习惯。在组织层面，OpenAI 组建了一个专门的团队来推动其音频 AI 战略。 Character.AI 语音研究员 Kundan Kumar 负责总体方向，Ben Newhouse 正在重新设计底层音频架构，多模态 ChatGPT 产品经理 Jackie Shannon 也参与其中。 OpenAI 计划推出一系列产品，包括智能眼镜和无屏智能音箱，而不是推出单一设备。企业内部的愿景是以“持续伴随”的形式存在的，它理解了内部活动和使用的必要性，并继续支持声音和视频的传输。 Para respaldar este diseño a largo plazo, OpenAI Gastó casi 6,500 millones de dólares (TI 之家备注：实际售价约为 45,560 百万人民币）2025 年原则上，由 Jonny Ivey 共同资助，并提供相关服务。涉足供应链、工业设计、模型研发等多条工作线。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。

归档

分类

由 admin

发表回复取消回复

您错过了

特朗普总统：“‘友好接管’古巴？ “ 相信。

进步很大！伊朗做出“史无前例”的承诺，永远不拥有可用于制造核武器的核材料，实现“零武库、零库存”，并同意全面核查！特朗普总统最新声明

中科院是否计划停止向开放获取期刊支付高额文章处理费？不少研究人员回应

违反人性

据报道，OpenAI 正在积极开发音频 AI 模型，并为首款硬件设备做准备。

由 admin

相关文章

特朗普总统：“‘友好接管’古巴？ “ 相信。

中科院是否计划停止向开放获取期刊支付高额文章处理费？不少研究人员回应

特朗普总统发表国情咨文并谈论移民、经济和犯罪问题。

发表回复 取消回复

您错过了

特朗普总统：“‘友好接管’古巴？ “ 相信。

进步很大！伊朗做出“史无前例”的承诺，永远不拥有可用于制造核武器的核材料，实现“零武库、零库存”，并同意全面核查！特朗普总统最新声明

中科院是否计划停止向开放获取期刊支付高额文章处理费？不少研究人员回应

违反人性

发表回复取消回复