ChatGPT迎接最强绘图搭档丨火星撞地球:DALL·E 3 vs Midjourney生图效果对比测评
近日,全球知名人工智能大厂OpenAI发布了旗下的“文生图”绘画工具新版DALL·E-3。
DALL·E-3是什么?
说实话,DALL·E这款AI绘画产品,自打推出之后变化并不大,原因主要是ChatGPT的爆发,占据了开发团队太多的精力。
对产品过于保守的策略,让同时代诞生的Midjourney很快抢占了目前在线绘画占据主要的份额。
在以前,DALL·E-2对比Midjourney虽然没有逊色太多,但画风略显稚嫩。
时隔一年多之后,DALL·E-3突然发布,令EVA是又惊又喜。
然而,今天的Midjourney与Stable Diffusion已经吃掉了AI绘画领域的大半壁江山。
士别三日当刮目相待,起了个大早赶了个晚集的DALL·E-3会有什么特色呢?
官网上贴了这么一段话:
文本生成图像的AI系统往往忽略文字或描述的倾向,迫使用户去学习如何更好地构建提示词句,让产品的应用门槛加高。DALL·E-3在生成与您提供的文本完全一致的图像方面的能力上有了重大飞跃。
本质上,这就是在吐槽Stable Diffusion专注于插件与微调模型的开发方向,让产品越来越“专业”,门槛越来越高。强调了自己的“文生图”是所说即所得。
从上边这张官图可以看到,DALL·E-3力求文本含义的精准呈现。
除此之外,相较于其他产品,DALL·E-3更强大的亮点,就是与自家的ChatGPT深度结合,可以直接在AI聊天机器人里边调用“文生图”能力。
比如下面这则演示视频,展示了如何利用ChatGPT+DALL·E-3的AI创作能力,将儿童小说的文段转化为可视化的故事书插图。
既然OpenAI在宣传上如此地自信,那么EVA也十分好奇,究竟DALL·E-3对比Midjourney,能有怎样的表现?
DALL·E-3 vs Midjourney对比测试
以下是国外内测网友针对这两款产品进行的相同提示词生成表现对比测试。
案例1️⃣
提示词:
“一幅插图,一个鳄梨坐在心理医生的椅子上,说着'我只是觉得内心空虚',中间有一个果核大小的洞。而治疗师,一把匙,正在匆匆记录着笔记。”
案例2️⃣
提示词:
“一幅插图,是一个由半透明玻璃制成的人类心脏,矗立在汹涌的海洋中的基座上。阳光穿透云层照亮了心脏,揭示出其中微小的宇宙。地平线上以粗体字刻着引言:“在你内心找到宇宙。”
案例3️⃣
提示词:
“一幅插图,一张充满活力的黄色香蕉形状的沙发坐在一个舒适的客厅中,它的曲线托起一堆五颜六色的靠垫。在木地板上,一块有图案的地毯增添了些许怪异的魅力,而一个盆栽植物坐落在角落里,朝向透过窗户射进来的阳光伸展。”
案例4️⃣
提示词:
“一幅细致入微的油画,描绘着一位老海船长,正在驾驶他的船穿越风暴。咸水溅在他的风霜之脸上,眼中充满了坚决的决心。上方漩涡般的恶劣云层可见,严峻的波浪威胁着将其淹没。”
案例5️⃣
提示词:
“一幅古老的植物插图,绘有精细的线条和一丝水彩的奇妙,描绘了一种奇特的百合与捕蝇草交叉的植物,其花瓣摆在那里,仿佛随时准备合上捕捉任何不经意的昆虫。”
案例6️⃣
提示词:
“一幅广袤的风景画,完全由各种肉类构成,展现在观众面前。嫩滑多汁的烤牛肉山丘、鸡腿树、培根河流和火腿巨石创造出一个超现实但令人垂涎的场景。天空装点着辣香肠太阳和萨拉米云朵。”
案例7️⃣
提示词:
“一幅富有表现力的油画,描绘了一个篮球运动员扣篮,呈现为一个星云的爆发。”
案例8️⃣
提示词:
“一部二维动画,展现了一个由拟人化的秋叶组成的民谣乐队,每个叶子都演奏着传统的蓝草乐器,在一个充满乡村氛围的森林背景中,柔和的收获月光洒在其中。”
总结:DALL·E-3对细节的刻画令人赞叹
通过以上这组提示词的PK对比,在过去我们总是认为Midjourney是那个更优秀的选手。但是一旦触摸到提示词不够贴合Midjourney“舒适圈”,就暴露了它的短板。
DALL·E-3针对随性与自然语言的提示词的语义理解和呈现上完爆Midjourney,相比之下,后者的表现力与精准度都打了折扣。
但是,DALL·E-3也并非没有问题,在画风与流派风格的表现上远没有Midjourney更具多样性。
这就好比:一个是苹果系统,一个是安卓系统,一个严谨而精准规范,一个风格多样且需要用户更强的掌控力。
各有各的的优势,最佳的工作流解决方案可能是,利用DALL·E-3生成符合文本描述的画面结构元素。然后利用Stable Diffusion的ControlNet模型来重绘风格。
如何获取DALL·E-3?
目前DALL·E-3正在内部封测当中。按官方的说法,DALL·E-3将于10月初向ChatGPT Plus与ChatGPT企业版客户提供。
独立版本的DALL·E-3页面,将会在今年秋季晚些时候上线。
此外,众所周知的缘故,微软与OpenAI为战略投资关系,因此最新版本的Bing Chat聊天机器人已经潜入DALL·E 3在线图像生成能力。更多的体验可以点击这篇文章了解:https://www.aieva.cn/review/1046.html