1. 首页 >精选经验 > 综合经验 > 正文

OpenAI的ChatGPT现在可以看到听到和说话具体方法如下

导读 我们开始在ChatGPT中推出新的语音和图像功能。他们提供了一种新的、更直观的界面,允许你进行语音对话或向ChatGPT展示你正在谈论的内容,Op...

“我们开始在ChatGPT中推出新的语音和图像功能。他们提供了一种新的、更直观的界面,允许你进行语音对话或向ChatGPT展示你正在谈论的内容,”OpenAI在一篇博文中说道。

值得注意的是,ChatGPT中的新语音和图像功能将在未来两周内向Plus和Enterprise用户推出。语音将在iOS和Android上推出,图像将在所有平台上提供。

用户现在可以在旅行时点击地标的图片,并就其中的有趣之处进行实时对话。

“当你回到家时,拍下你的冰箱和食品储藏室的照片,以了解晚餐吃什么(并询问后续问题以获取逐步食谱)。晚餐后,通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题,”OpenAI说。

此外,用户现在可以使用语音与人工智能聊天机器人进行来回对话。

要开始使用语音,请转到移动应用程序上的“设置”>“新功能”,然后选择加入语音对话。然后,点击主屏幕右上角的耳机按钮,从五种不同的声音中选择您喜欢的声音。

这种新的语音功能由新的文本转语音模型提供支持,能够仅从文本和几秒钟的样本语音中生成类似人类的音频。OpenAI与专业配音演员合作创作了每一个声音。

要使用图像功能,请点击照片按钮捕获或选择图像。如果您使用的是iOS或Android,请先点击加号按钮。图像理解由多模态GPT-3.5和GPT-4提供支持。这些模型将其语言推理技能应用于各种图像,例如照片、屏幕截图以及包含文本和图像的文档。

“OpenAI的目标是构建安全且有益的AGI。我们相信逐步提供我们的工具,这使我们能够随着时间的推移进行改进和完善风险缓解措施,同时也让每个人为未来更强大的系统做好准备。对于涉及语音和视觉的先进模型,这一策略变得更加重要。”该公司表示。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!