首页  >  测评  >  文章
2024-01-22 17:25

Midjourney V6生图超进化!国外大神深度测评:对比V5.2版本,画质逼真骇人,人像细节不再有「AI感」

摘要

Midjourney绘图大神的超深度测评来了!Midjourney V6比起V5.2版本,究竟有哪些地方的改进?一篇读懂,来感受一下吧。

今天来看一份Midjourney V6图像生成模型的海外测评。最近,国外的一位名叫Andrei Kovalev的大神网友,做出了一份Midjourney V6的超深度评测。测评很专业,V6和V5.2版本到底有什么不同,很直观地就能看出来。

下面,就让我们来跟随大神的脚步,深入感受一下Midjourney V6的性能有多强吧。

V6模型,究竟比V5.2强在哪?

在以往,当我们看一张AI生图时,可能很容易就会推测到这是AI画的作品。但在Midjourney V6中,你很少会有这样的感觉。

在这一部分的测评内容当中,Andrei Kovalev介绍了Midjourney V6的优势、劣势,以及和V5.2相比的主要变化。

首先来测一波相同提示词在两个模型版本生成的图像的差异性。

提示词:

Tim Walker的高级时装正面肖像,清澈的白色空灵机器人,半透明的皮肤淹没在电线的海洋中。红色和青色色调,发光的高光,深色阴影。

图片

Midjourney V6

图片

Midjourney V5.2

作者发现,V6有以下方面的改进与变化。

  • 在遵循提示词方面更准确了,并且使用更长的提示内容时,效果会更好
  • 新模型的一致性大大增强了
  • Midjourney V6改进了图像提示的用户体验
  • 现在Midjourney V6有了两个新的升频器,具有微妙和创意模式,都可以将分辨率提升两倍
  • 有一个「unopinionated」的 --style raw模式(类似于V5.2)
  • 还可以在图像中添加文本

所以,Midjourney V6究竟变成了什么样子?

超现实主义画派

以往每次的Midjourney升级,都会提升照片的真实感,V6也不例外。最能定义V6的关键词,恐怕就是超现实主义。

提示词:

川内凛子的少女太空飞行员摄影肖像

图片

Midjourney V6

图片

Midjourney V5.2

总而言之,V6的逼真度爆表,上升到了一个新台阶,尤其是在摄影风格上,已经到了让人迷惑的程度。

提示词:

Kourtney Roy的老海员摄影肖像

图片

Midjourney V6

Midjourney V6生成的图像如此之逼真令人惊讶,恰恰是因为它生成的图像是存在缺陷的,没有过去AI图像生成时的那种「过度完美」——它存在镜头构图不完美、刻意突出的失误区域、意外的失焦元素以及各种胶片质感的效果等等。

提示词:

Mitsuo Katsui拍摄的初音未来照片 --stylize 175

图片

当然,Midjourney V6不止是人像画得好,其他的画面内容也同样抓人眼球。

提示词:

第比利斯的延时摄影 --stylize 175

图片

而且,在某些情况下需要更微妙的外观和感觉,这时Midjourney V6的“超现实主义”画派,就显得有些尖锐,显得有些矫枉过正。

提示词:

Ara Guler对1970年代伊斯坦布尔赌场赌徒的肖像

图片

Midjourney V6

图片

Midjourney V5.2

细节创作很疯狂

每次在Midjourney准备发布下一代模型之前,许多人都会屏住呼吸,想看看他们会如何处理细节。

Midjourney V6中的细节,很疯狂。而新的Upscalers(AI画质增强)功能,则让细节更进一步。

提示词:

Ivan Bilibin的画作,描绘骑着白狼的冬季领主

图片

Midjourney V6

图片

Midjourney V5.2

不过,虽然图像的复杂性随着每个新模型的出现而稳步上升,但在此过程中,却丢失了一些东西,比如纹理。

比如,Midjourney V4的精细程度在V5.x版本中提高了十倍,因此几乎不可能实现胶片颗粒或真实笔触这类效果。

虽然离真正的颗粒感似乎仍然遥不可及,但Midjourney V6显然朝着以前失去的原始性,迈出了明确的一步。它的纹理令人惊叹,比起V5来大放异彩(在V5中,需要选择「non-refined」的视觉风格)。

提示词:

Marianna Rothen的梦幻女孩

图片

Midjourney V6

图片

Midjourney V5.2

另一个能很好地描述Midjourney V6的概念,是非常规组合(Unconventional Composition),这导致了V5.2中结构化和平衡方法的重大转变。

以前的模型追求几何完美、黄金比例和中心主体,而V6追求不对称,经常将主体从画面中间移开。

提示词:

Tyrus Wong的跨维度神秘野兽

图片

Midjourney V6

图片

Midjourney V5.2

这可能会提供更具动态性和吸引力的视觉效果,但也需要相应地调整提示。即使是很小的调整,也可以恢复中心构图和对称性。

画面可变性增强

可以看到,在Midjourney V6中,同一提示结果的可变性增强了。与早期模型相比,单个提示的四个变体,通常显示出更明显的差异。

提示词:

Jessie Willcox Smith的《银术士》

图片

Midjourney V6

图片

Midjourney V5.2

许多情况下,这会产生一种更具创意、更有趣,有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。

多元化的艺术风格更容易兑现

在提示中,我们可以引用「Style modifiers」的名称,召唤图像的特定视觉风格、技术、流派、主题或上下文。

像素艺术

图片

Midjourney V6

图片

Midjourney V5.2

现在,每个新模型都更善于了解源材料,并且在输出中重新创建它,这已经是一个传统。

然而,Midjourney从未停止这种戏剧性的变化。

图片

Midjourney V6

图片

Midjourney V5.2

无论这些风格本身多么伟大,真正将它们从对原作的单纯解释转变为独特的东西的,是我们添加的提示。

支持在图片中添加文本

画一幅:双手拿着报纸,标题为「Midjourney的文本 - 真实还是骗局?」

图片

Midjourney V6

图片

Midjourney V5.2

更多功能详解,请参考原文的网页:

3

相关文章