OpenAI为ChatGPT引入语音和图像功能

OpenAI最近为其ChatGPT引入了革命性的新功能:用户现在可以与ChatGPT进行语音对话,并展示一张或多张图片进行讨论或分析。


语音对话功能可以在iOS和Android上通过设置中的选项启用。一个新的文本到语音模型为语音功能提供了支持,能够生成与人类相似的音频。OpenAI与专业声音演员合作,为用户提供了多种声音选项。


图像输入功能允许用户展示给ChatGPT一张或多张图片,以进行讨论或分析。该功能得益于多模态GPT-3.5和GPT-4模型的支持。


为确保这些新功能的安全性,OpenAI正在逐步部署。他们意识到与这些功能相关的一些风险,例如人声合成技术可能被用于冒充或欺诈。因此,OpenAI采取了多种措施,包括限制ChatGPT分析和直接评论个人的能力,以确保隐私。


此外,OpenAI在部署这些新功能之前,与“Be My Eyes”应用(为视障人士设计)合作,了解其用途和限制。他们正在寻求真实世界的使用和反馈,以改进这些功能的安全防护和实用性。


OpenAI计划在不久的将来将这些新功能扩展到其他用户群体,包括开发者。


这些更新与OpenAI的目标一致,即使AGI安全、有益并随着时间的推移变得越来越有能力。 

Next Post Previous Post
No Comment
Add Comment
comment url