OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容 – 蓝点网
OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,推出态版该功能仅限于 Android 和 iOS 版 ChatGPT,多模对话点网并且可以上传图片由 ChatGPT 进行分析、本可别图识别并给出回答。语音 当这个功能可用后,及识用户转到 ChatGPT 设置里点击新功能,像内然后就可以开启语音对话功能,容蓝还可以从 5 个声音里选择一个。推出态版 OPENAI 表示: 新的多模对话点网语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的本可别图样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,语音我们还使用我们的及识开源语音识别系统 Whisper 将您的声音转录为文本。 第二个功能是像内图像识别功能,用户可以使用移动端 ChatGPT 拍照或选择照片发送给 AI,容蓝然后 ChatGPT 会像素级分析图片内容并按照用户提问给出详细的推出态版回答,例如分析工作图表、在设备工作异常时进行故障排除等等。 OPENAI 表示: 图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。 新功能将在接下来几周推出,首先获得该功能的是 ChatGPT Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。 最后,OPENAI 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 ChatGPT 集成,将在 10 月份推出。
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 优酷《饕餮记》定档12月10日 安悦溪王佑硕开启美食冒险之旅
- 2022款捷豹XFL正式上市 售39.98万元起
- 《鬼泣5》销量被《鬼泣4》秒成渣 游戏事真如何?
- 《帝国神话》希腊文明DLC部分建筑工作台及武器原画设定曝光
- 离火之境各职业特点介绍及选择推荐
- 拉瑞安高管否认《博德之门3》将登陆iOS:消息来源很愚蠢
- 《真女神转生5:Vengeance》50个新要素 调整点公开!
- 成立不到2年,三翼鸟为何受用户认可?场景是关键
- 睦居鹿板材:从选材到质检,全方位打造高品质ENF级环保家居产品
- 荣威第三代RX5/eRX5开启预售 12.49万元起
- IGN分享《动物井》13分钟实机:玩法有趣 创意十足!
- 挑张喜好的当壁纸!《上古卷轴》尽好游戏截图赏
- 用心用情,为兴业银行合肥繁华大道支行高效服务点赞
- 璀璨微光,星火成炬丨帅康联合钟南山医学基金会等单位,发起呼吸健康万人筛查暨健康厨房科普行动
- 武汉昙华林游有哪些店展好逛的
- indiePlay迎来10周年!2024 indiePlay中国独立游戏大赛报名开始!
- 职业年金是什么意思?什么是职业年金(2024年职业年金最新解释)
- 宝马Z4 M40i未来将提供6速手动变速箱可选 将于今年推出
- 又有新动态!三翼鸟携手20家高定品牌开展战略合作
- 男霸气女素净!游戏VS动漫海量细彩绘做赏识
- 搜索
-
- 友情链接
-