Gen 3 Alpha最新公测_文生视频runway发布最新模型

首页 > 资讯 > 文章

2024-07-03 17:39

Runway最强文生视频模型开放公测丨Gen 3 Alpha镜头运动效果拔群

文生视频工具的内卷，又又又又又一次升级了，没有最卷只有更卷。Runway Gen 3 Alpha 昨日开启付费用户公测，随着越来越多用户动手测试、分享，可以看到不少逆天成果。

一名指挥正指导乐队演奏图片来自：X 用户@RyanMorrisonJer

总体来看，成片仍然是十秒出头的短视频，细节的精致度和丝滑程度上有不错的提升。当然了，一些无厘头硬伤还是会出现，毕竟模型没法真正理解物理世界。细节的提升主要在表面材质的平滑和仿真程度，包括人脸皮肤、光线折射、动物皮毛等。

一只正在吃面的大熊猫图片来自：X 用户@takapon_jp

镜头移动的流畅度也表现不俗，结合官方提供的 prompt 词，能看出提供了更多关于镜头语言的选择，用户只需要输入指令，能更自如地呈现镜头运动是本次更新的一大亮点。

俯瞰赛博城市夜景图片来自：X 用户@AIeseshi

无独有偶，Luma 也在 6 月 30 号更新了自己的首尾帧功能，用户可以指定两张图片作为视频的起始和结束画面，模型将自行分析和完成整个视频。类似的功能字节旗下的即梦ai也提供，不算是新鲜事儿。

Luma 官方对首尾帧的演示图片来自：LumaLabsAI

既然赶上前后脚更新，用户们难免让几家做一做同题竞赛、捉对厮杀。除了 Luma，背靠 OpenAI 的 Sora 也不会被落下。

走在东京夜晚街头的女人图片来自：X 用户@keitowebai

从成片对比来看，Gen-3 还是相当能打的。Gen-3 的优势除了上述流畅自然的镜头运动、景别切换，对 prompt 内容的理解也不错。当然了，各家多多少少，都还是有物理逻辑硬伤，场景理解也有问题。

上图为 Luma，下图为 Runway Gen-3 图片来自：用户@shunchi_uu

不过，只有付费用户才可以体验 Gen-3 Alpha，我们整理了订阅计划的基本信息：

最低月付 15 美元/月，年付 12 美元/月

最低套餐内包含 625 积分，每月自动刷新，可额外付费加购

最低套餐即可使用 Gen-3 Alpha，最长视频时间为 10 秒

625 积分的产出量约为 125 秒的 Gen-2 视频，44 秒的 Gen-1 视频，或 125 次文生图

支持无水印导出，视频最高支持 4K ，图片最高支持 2K

考虑到 Gen-3 对积分的消耗只会比就模型更多，折算下来制作的成本约在一美元左右，价格并没有被「打下来」。想要尝鲜的朋友，以下是链接传送门：

?? https://runwayml.com/ai-tools/gen-3-alpha/

有一点提升，但不多

值得注意的是它在转场上颇具创意，X 用户@JH4TC 把自己用 Gen-3 生成的几个视频剪在了一起，它们都涉及到主体对象从一个场景切换到另一个场景里。

这样的段落里，虽然镜头只是向前推动，没有炫酷的动线，但是画面里的景色和需要快速又丝滑的改变，可以说，Gen-3 为此提供了很不错的「转场方案」。在下面的案例里，行车路线要从雪地变成树丛，首先出现的是积雪中的车辙印，再逐渐出现树叶。

这是一个合理又丝滑的转场变化，符合通常影视制作的逻辑。类似的，还有跳伞员原本在高空中，忽然一跃进入了一个酒店房间。

图片均来自：X 用户@JH4TC

这个案例里最大的 bug 是人物出现了三只手，不过，忽略这个问题的话，两个场景的切换时，墙壁的剖面一闪而过，的确是一种常见的转景思路，经常出现在「一镜到底」的影片设计当中。

期望管理，观念回归

在这个时间点上来看，Runway Gen-3 的公测，像是一种对观念回归的召唤：文生视频工具的定位，不在于一步到位，直接完成创作，而是类似于其它大模型产品，扮演辅助角色，提供不同的可选方案，来提升工作效率和减少工作量。

文生视频工具的本质，始终是为用户的创意需求，提供潜在方案。比如在 X 用户@bennash 分享出来的 Gen-3 成品中，出现了同一个主题「imagine」，同样的玫瑰花+马赛克花砖元素，Runway 给出了既相似、又不同的成片。

以「imagine」为主题的绘制图片来自：X 用户@bennash

是不是有点熟悉?本质上，和 Mid-journey 每一次 prompting 后会收到几张图片，是同样的道理。用户只需要选择最为接近自己心中设想的画面，再做 fine-tune，不必从 0 开始绘制、搭建。

不同的是，目前的文生视频工具，光是生成单个视频已经非常费劲，毕竟文本与动态影像之间有着不小的距离。像 MJ 那样，一次给出多个方案供选择暂时无法实现，用户只能一次次尝试，最终账单也可能非常惊人。

一卷再卷，竞争步步升级

Runway 曾经是文生视频的领先玩家，但今年以来，这个赛道的形势急剧变化，Runway 的先发优势，目前已经被 Sora、Pika、Luma 等快速追上。

在国内，快手出品的可灵 ai，字节出品的即梦 AI，生数科技出品的Vidu 等，也都在以最快速度入场参赛。其中以可灵表现最为突出，影像的细节和一致性都非常惊艳，物理逻辑也完全在可接受范围内。

可灵官方演示图片来自：可灵ai

Vidu 发布时，一度宣称自己是「中国版Sora」，官方演示的确不错，但后续乏力，还需要更多观察。

Vidu官方演示图片来自：Vidu

另一个被认为可与 Sora 对垒的是 PixVerse，来自爱诗科技，五月时发布了最新的「魔术笔刷」功能，能够更精准地控制画面局部动态。

PixVerse官方演示图片来自：PixVerse

即梦的原名是 Dreamina，背靠字节，在字节重码下注人工智能的前提下，即梦的表现也相当不错，尤其是影调和画面色彩，更为丰富。得益于字节的社交基因，社区的分享氛围活跃。

车厢里回眸的年轻女人图片来自：即梦用户@瓷瓷

从视频拍摄角度上来讲，相比于人物的正反打、渲染氛围的空镜头等，场景转换是更为关键的环节——它可以表示故事情节的转折，也可以是人物状态的变化。

Gen-3 在转场设计和镜头运动方面的提升，意味着有一定创作能力的用户，可以这样关键的创意节点上，借助文生视频工具生成影像方案预览。在这种关键位置上，花点积分，出几个预览方案，有助于提高下游制作步骤的准确度和效率。

Runway 官方演示图片来自：Runway

文生视频的内卷，只会越来越激烈，没人会怀疑，接下来生成的影像会更高清、更流畅、更细腻，这只是时间问题。但进入下一阶段，则会面临更严苛的目光，提升了哪里、是否关键，将会是所有生成类工具需要面对的问题。

本文摘自APPSO公众号

查看相关话题： #AI视频 #Runway #gen-3 alpha

Felix

原创作者

被主编折磨的小编一枚

作者已发布 61 篇文章

近期文章

Kimi上线探索版，单次精度500页丨快手推出Pyramid Flow开源文生视频模型丨特斯拉无人驾驶Cybercab惊艳亮相

最新AI硬件测评 | 字节 Ola Friend 耳机体验，首款智能体耳机表现怎么样

微软Office全家桶再爆办公革命丨谷歌搜索将标注AI生成图片丨OpenAI 安全委员会将成为独立董事会监督小组

60秒直出3D内容，纹理逼真！Meta最新3D Gen模型实现60倍速生成

英伟达市值超越微软成为全球第一丨谷歌AI大模型为无声视频自动配音丨马斯克：人形机器人普及率将是汽车10倍