OpenAI的ChatGPT现在可以看到听到和说话具体方法如下

导读我们开始在ChatGPT中推出新的语音和图像功能。他们提供了一种新的、更直观的界面，允许你进行语音对话或向ChatGPT展示你正在谈论的内容，Op...

“我们开始在ChatGPT中推出新的语音和图像功能。他们提供了一种新的、更直观的界面，允许你进行语音对话或向ChatGPT展示你正在谈论的内容，”OpenAI在一篇博文中说道。

值得注意的是，ChatGPT中的新语音和图像功能将在未来两周内向Plus和Enterprise用户推出。语音将在iOS和Android上推出，图像将在所有平台上提供。

用户现在可以在旅行时点击地标的图片，并就其中的有趣之处进行实时对话。

“当你回到家时，拍下你的冰箱和食品储藏室的照片，以了解晚餐吃什么(并询问后续问题以获取逐步食谱)。晚餐后，通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题，”OpenAI说。

此外，用户现在可以使用语音与人工智能聊天机器人进行来回对话。

要开始使用语音，请转到移动应用程序上的“设置”>“新功能”，然后选择加入语音对话。然后，点击主屏幕右上角的耳机按钮，从五种不同的声音中选择您喜欢的声音。

这种新的语音功能由新的文本转语音模型提供支持，能够仅从文本和几秒钟的样本语音中生成类似人类的音频。OpenAI与专业配音演员合作创作了每一个声音。

要使用图像功能，请点击照片按钮捕获或选择图像。如果您使用的是iOS或Android，请先点击加号按钮。图像理解由多模态GPT-3.5和GPT-4提供支持。这些模型将其语言推理技能应用于各种图像，例如照片、屏幕截图以及包含文本和图像的文档。

“OpenAI的目标是构建安全且有益的AGI。我们相信逐步提供我们的工具，这使我们能够随着时间的推移进行改进和完善风险缓解措施，同时也让每个人为未来更强大的系统做好准备。对于涉及语音和视觉的先进模型，这一策略变得更加重要。”该公司表示。

标签：

免责声明：本文由用户上传，如有侵权请联系删除！