编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?

编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?

2024-06-12    51'59''

主播: 津津乐道播客

1199 14

介绍:
GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。 同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。 更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。 ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。 投资机构 a16z 近期发布报告,创立了「Voice AI Agent」的投资新赛道并高呼:「是时候重新发明通话了!」 技术上实现 《Her》 的「最后一步」是什么?创业者如何利用现有技术能力满足用户?哪些场景最可能诞生真实付费需求? 本期节目,嘉宾将从模型开发者、实时互动从业者、AI 陪伴玩具创业者的不同视角,探讨「对话式 AI」的边界,分享实践中看到的新机会。 有嘉宾说:人工智能实现 human like 的最后一步,是允许 AI 与人类拥有平等地位:如果你希望 AI 像人,那就请允许 AI 可以随时地回应你也打断你,聆听你也忽略你…… 如果是这样,你愿意吗?