Runway上线多重「运动笔刷」功能丨腾讯、百度发布自研视频生成模型丨科大讯飞1月30日发布星火大模型V3.5
AI奇点网2024年1月22日报道丨AI资讯早报
当地时间1月19日,AI视频生产创作平台Runway宣布,旗下的Gen-2模型中的运动笔刷(Motion Brush)功能将升级为多重运动笔刷(Multi Motion Brush)。该公司成功解决了在同一个画面内实现独立控制视多个区域的物体运动,让不同的物体、对象内容分别展开不同的运动形势。
使用方法很简单,用户可以控制多达5个运动笔刷,针对画面内的物体进行简单涂刷,让画面呈现更加丰富的运动表达形式。该功能目前处于Beta测试阶段,可以在免费帐户中进行体验。
1月18日,腾讯AI实验室发布了视频生成模型VideoCrafter2,相关论文同日也已经发表。该模型研究了利用低质量视频和合成高质量图像获得高质量视频模型的可行性,通过使用高质量图像对空间模块进行微调,在不降低运动质量的情况下,将分布转移到更高质量的视频上,克服了高质量视频扩散模型的数据限制。
项目主页:
1月18日,百度的AIGC研发团队发布了视频生成模型UniVG,这是一种统一模式视频生成系统,能够以文本和图像的任意组合作为输入。团队将系统内视频生成模型的多个任务,重新划分为高自由度生成和低自由度生成两类,并针对不同自由度采用不同的生成方式。
项目主页:
1月20日,科大讯飞在基于算力底座“飞星一号”平台的讯飞星火认知大模型V3.5目前已经完成训练,相比V3.0版本,新版本在逻辑推理、文本生成、数学答题及小样本学习能力等方面大幅提升。科大讯飞宣布,将在1月30日下午2点举办讯飞星火认知大模型V3.5升级的发布会,届时将在科大讯飞视频号等多个平台在线直播。
据悉,讯飞星火认知大模型V3.5完全基于全国产化的算力底座“飞星一号”平台,“飞星一号”由科大讯飞与华为共同研发,目前已完成大模型的训练。
据The Verge今日报道,TikTok目前正在测试AI生成歌曲功能AI Song,由大型语言模型Bloom提供支持。用户发布视频时,直接在提示词的文本框中写入歌词,AI Song功能将会针对生成“文生音频”的歌曲,并且用户可以自由切换歌曲的流派来改变曲风。
部分官方邀请的内测博主已经提前尝鲜,目前该功能仍未向所有用户开放,目前它似乎还存在人声跑调等问题,据部分内测用户反馈,AI生成的歌曲人声听上去有些走音。
近期,针对网上传闻的“微软计划关闭微软亚洲研究院”的路边社消息,微软全球资深副总裁、微软研究院负责人Peter Lee在推特上回应称,目前没有关于关闭微软亚洲研究院的讨论或主张。
“我们一如既往地支持微软亚洲研究院及其世界级的研究工作,对未来的研究计划充满期待。”微软公司总裁兼董事会副主席Brad Smith则强调,“历史的经验表明,从世界范围内汲取思想才能够获得成功。‘护栏’与‘把控’固然重要,而‘参与’的重要性同样不容忽视。”
此外,据外媒了解,微软研究院也在温哥华成立了新的研究中心,并在持续对外扩招人才。