IT之家1月1日下午报道,OpenAI正在全面提升语音AI能力,为未来推出基于语音的个人AI设备铺平道路。知情人士表示,该设备将使用听觉交互作为其主要形式,而不是依赖屏幕。目前,ChatGPT 的语音功能不使用文本响应背后的相同模型。 OpenAI内部研究人员认为,现有的音频模型在准确性和响应速度方面明显滞后,该公司决定整合过去两个月的工程、产品和研究工作,重点克服音频模型的缺点。这一调整直接体现了 OpenAI 的硬件目标,即创建可以通过自然语音命令进行操作的消费设备。此前的报告表明,第一批产品至少需要一年的时间。随着新架构的引入,音频模型现在可以生成更多自然且情绪化的语音响应,能够同时与人类交谈并对中断做出反应。 OpenAI计划在2026年第一季度正式推出该模型。在硬件方面,OpenAI与谷歌、亚马逊、Meta和苹果做出的决定类似。这意味着现有的传统设备在设计时并未考虑到未来与人工智能的交互。 OpenAI 团队认为语音是最接近人类交流本能的东西,我们希望用户能够通过“说话”而不是“看屏幕”与他们的设备进行交互。与 OpenAI 合作硬件项目的 Jony Ive 也强调,无屏设计不仅更加自然,而且还有助于防止用户沉迷。他认为新一代家电应该纠正过去家电的负面影响并为此承担责任。然而,OpenAI 仍然面临着现实的挑战。专家指出,许多 ChatGPT 用户不熟悉使用语音功能。这种情况不仅是戴尔效率低下,而且还缺乏功能意识。 OpenAI在推出音频优先的AI设备之前首先需要改变用户的习惯。在组织层面,OpenAI 组建了一个专门的团队来推动其音频 AI 战略。 Character.AI 语音研究员 Kundan Kumar 负责总体方向,Ben Newhouse 正在重新设计底层音频架构,多模态 ChatGPT 产品经理 Jackie Shannon 也参与其中。 OpenAI 计划推出一系列产品,包括智能眼镜和无屏智能音箱,而不是推出单一设备。企业内部的愿景是以“持续伴随”的形式存在的,它理解了内部活动和使用的必要性,并继续支持声音和视频的传输。 Para respaldar este diseño a largo plazo, OpenAI Gastó casi 6,500 millones de dólares (TI 之家备注:实际售价约为 45,560 百万人民币)2025 年原则上,由 Jonny Ivey 共同资助,并提供相关服务。涉足供应链、工业设计、模型研发等多条工作线。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。
欢迎访问985猎奇研究所,探索黑暗传送门的神秘与魅力!