ChatGPT向全体用户开放Voice语音交互功能,开通使用ChatGPT语音功能保姆级教程
AI奇点网11月22日报道丨当地时间11月21日,OpenAI对外发布了ChatGPT Voice语音交互聊天服务,并且将这项此前由ChatGPT Plus(GPT-4)独占的功能,下放到全体ChatGPT APP用户。用户只需注册ChatGPT账户,下载APP,就可以使用这项服务。需要注意的是,免费版的用户只能使用基于GPT-3.5的人工智能语音生成交互服务;ChatGPT Plus订阅用户则基于GPT-4。
OpenAI 于今年 9 月发布了基于 ChatGPT 的文本转语音功能,基于GPT的神经网络模型,从生成的文本内容转成类似人类的语音。该功能此前仅面向 ChatGPT Plus 订阅用户提供,现在向所有没有订阅付费的用户推出。
该系统通过采样配音演员录制的几秒钟音频,能够创建具有不同口音和风格的自定义声音。OpenAI 与专业的配音演员合作录制了声纹特征,然后使用开源的语音识别系统 Whisper 将口头语音转制为文本,获得这种数字合成的仿真声音。
ChatGPT Voice语音交互功能,说白了就是能直接通过人说话,以自然语言最直接的语音与 ChatGPT 完成对话交互。让人震惊的是,ChatGPT的声线真实感和回答的逻辑性让人有一种《钢铁侠》电影当中“贾维斯”的错觉。
此功能仍然属于测试阶段,通过苹果应用商店或者安卓应用商店下载ChatGPT APP版本,打开ChatGPT Voice语音功能即可体验。
打开ChatGPT APP的设置。
进入设置页面,点击 Beta Features
点击 Beta Features,开启 Voice conversations
开启 Voice conversations(语音对话)。
然后点击主页的房子图标,回到对话界面,找到右上角的耳机图标。
点击主页图标,开启语音对话。
你也可以查看对话的历史聊天记录,与聊天机器人的每一轮语音对话,均会以文本的形式呈现在聊天对话记录当中展示,方便随时进行查看。OpenAI还为用户提供了ChatGPT Voice的多项小功能,包括暂停、中断对话,更换人物的音色等功能,有五种音色可供选择。
虽然只是GPT-3.5,不过全新的语音交互方式确实很新鲜很真实,令人直觉的交互体验。事不宜迟,快去调戏ChatGPT吧!