首页  >  资讯  >  文章
2023-10-10 09:26

美图发布视觉大模型Miracle Vision3.0丨华为“小艺”将支持通话语音转文本丨视觉中国与华为研发视觉大模型

AI奇点网2023年10月10日报道丨AI资讯早报

美图发布自研视觉大模型3.0,全面应用于美图旗下的影像与设计产品

10月9日,美图公司举办15周年生日会,在活动上,美图自研AI视觉大模型Miracle Vision3.0版本正式发布,将全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业“工作流提效”。

美图创始人、董事长兼CEO吴欣鸿将Miracle Vision的核心能力拆解为“奇思妙想”和“智能创作”两大特性,其中,在“奇思妙想”层面,Miracle Vision通过“提示词智能联想”功能降低大众的使用门槛,而在“智能创作”层面,Miracle Vision则通过“深化创作”功能,进一步丰富作品细节和提升表现力;在应用领域方面,Miracle Vision将持续在电商、广告、游戏、动漫、影视五大行业深耕。“吴欣鸿强调,AI视觉大模型的出现,不是要取代现有的从业者,而是帮助他们提升工作效率。”

华为对外展示“小艺助手”通话语音转文本功能

10月8日,华为终端BG CTO李小龙在微博上剧透了华为鸿蒙语音助手“小艺”的通话及语音转写功能,并声称新功能很好用。他以AI帮助接听平安车险的销售经理的电话为例,“小艺”可以帮助用户对付销售电话的来访。

图片

有网友在评论区询问,该功能是否可以模仿机主声音,李小龙回应称,用户可以自己录制开场语。

视觉中国与华为云达成视觉大模型研发合作,基于盘古大模型开发

视觉中国宣布,近日,该公司与华为云正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型,共同实现视觉领域高度智能化发展,推进更深层次的内容产业智能转型。

今年7月的华为云HDC 2023开发者大会上,视觉中国作为华为云大模型高质量数据联盟首倡单位参与了大会,视觉中国总裁柴继军在大会AI圆桌论坛上介绍了视觉中国“AI+内容+场景”战略。

华人团队提出交错视觉语言生成模型MiniGPT-5

10月3日,加州大学圣克鲁兹分校的华人AI研究团队提出了一种新的视觉大模型解决方案——MiniGPT-5。这是一种以”生成式Voken“概念为基础的创新型交错视觉语言生成技术。

图片

据介绍,通过特殊的视觉Token”生成式Voken“,MiniGPT-5将Stable Diffusion的扩散模型机制,与以ChatGPT为代表的LLM(大型语言模型)相结合,为更强大的大模型多模态生成能力预示了一种新的模式。

除了原有的多模态理解和文本生成能力外,MiniGPT5还支持提供合理、连贯的多模态信息输出。

OpenAI奥特曼:简单模仿&封装ChatGPT的公司活不久

9月22日-24日,OpenAI CEO奥特曼出席YC Alumni Reunion 2023校友会,并做演讲,他提出一些创业建议。据网友总结,其观点大致可以分为三点:

  • 简单包装OpenAI的公司活不长久
  • 看好AI医学顾问、AI个性化一对一辅导等方向
  • 盲目筹资非常不明智

此外有消息称,奥特曼在本次演讲中剧透了下一代大模型的研发方向,并称GPT-5和GPT-6将具备多模态输出能力,相比目前的GPT版本可靠性更高、个性化定制体验更好。

8

相关文章