首页 动态 正文

OpenAI 推出新一代可对话的 ChatGPT 语音机器人

 2024-08-01  

OpenAI 正在推出一款先进的人工智能聊天机器人,具备与用户进行语音对话的能力。这款新型聊天机器人现已面向部分用户推出,标志着 OpenAI 向更智能的人工智能语音助手迈出了重要一步。

 

更强大的语音助手

 

这款新的 ChatGPT 语音机器人功能强大,可以实现更自然、更流畅的对话,类似于 Siri 和 Alexa,但更加智能。这意味着它可以理解不同语调所传达的信息,对中断做出反应,并实时回答查询。此外,这款机器人经过训练,能用更自然的声音表达多种情绪。

 

结合多模态技术的 GPT-4o 模型

 

新语音机器人的核心是 OpenAI 的最新 GPT-4o 模型,该模型结合了语音、文本和视觉能力。为了收集用户反馈,OpenAI 首先向一小部分 ChatGPT Plus 订阅用户推出了该机器人,并计划在今年秋天向所有 ChatGPT Plus 订阅用户开放。ChatGPT Plus 的订阅费用为每月 20 美元(约合人民币 144 元)。

 

安全功能和测试

 

新语音功能最初在今年 5 月宣布,但因需要更多时间完善安全功能而推迟了一个月推出。OpenAI 表示,已与 100 多名外部红队成员测试了该模型的语音功能,这些测试人员来自 29 个国家,讲 45 种语言。他们的任务是探测模型的缺陷,确保安全性。

 

为防止模型被用于制作音频深度伪造,OpenAI 与配音演员合作创建了四种预设声音,GPT-4o 不会模仿或生成他人的声音。

 

早期争议和法律挑战

 

在 GPT-4o 的早期测试中,OpenAI 因使用一种名为“Sky”的声音而遭到强烈反对,该声音被指与女演员斯嘉丽·约翰逊相似。虽然 OpenAI 否认声音是约翰逊的,但已暂停使用 Sky 语音。OpenAI 还面临多起涉嫌侵犯版权的诉讼,已采取措施防止生成受版权保护的音频。

 

未来功能展望

 

OpenAI 计划在未来为这款助手加入更多高级功能,如视频和屏幕共享。这些功能将使助手更加有用。例如,在一次演示中,员工将手机摄像头对准一张纸,请人工智能模型帮助解决数学方程式,或共享电脑屏幕请求编程帮助。这些功能目前尚未推出,但预计会在未来某个日期上线。

 

总结

 

OpenAI 的新型 ChatGPT 语音机器人代表了人工智能语音助手的未来发展方向,通过结合多模态技术和强大的安全功能,为用户提供更智能、更安全的对话体验。

 


  •  标签: