首页  >  测评  >  文章
2023-07-10 12:12

阿里免费AI绘图工具「通义万相」深度测评:无限量二次元老婆,Midjourney最强国产平替

AI绘画工具:通义万相

工具介绍:通义万相基于阿里研发的组合式生成模型Composer架构。其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果。可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D卡通和素描等风格图像。

工具链接:https://www.aieva.cn/sites/1220.html


家人们,最近几天AI圈真是太太太热闹了!

7月6日-9日,上海举办2023世界人工智能大会。因为ChatGPT横空出世,让这场一年一度的“AI庙会”在今年盛况空前。

这年头的科技公司啥都可以不干,就是不能说自家没做AI大模型。想必大家都知道Midjourney和Stability AI这两家AI绘图届的行业翘楚,事实上咱国产工具也没落后的。

阿里云在本届大会上祭出“通义大模型家族”全新重磅AI力作——“通义万相”,官方称之为:「一个不断进化的AI绘画创作模型」。

“通义万相”,顾名思义,基于阿里达摩院自研通义大模型之上的垂直领域大模型,命名紧随大哥“千问”和二哥“听悟”延续系列化。采用阿里自研的Cmposer组合式图像生成大模型开发。该模型通过拆解和重组图形对象的配色、构图布局、绘图风格等基本的图像设计元素来生成新的图像结果,具备高度可控和自由度极大等特性。

“通义万相”定位为类似于Midjourney的AI绘图专业设计在线平台,可辅助人类设计师进行图像艺术创作,可广泛应用于平面设计、电商页面装潢、游戏角色场景设计和周边文创设计等丰富的场景,将对当下的设计行业产生深刻变革。

目前,“通义万相”大模型提供文生图、相似图片模仿生成以及图像风格迁移三大能力,内测期间暂时为免费。

阿里的“通义万相”长啥样?

光从操作台的交互来看,可以设定的选项其实极少,对比Midjourney显然是入门门槛低了很多,基本“傻瓜式”。乍看之下只有一个醒目的提示词输入框(最大500 tokens)。

左侧为操作台数据控制区,右侧为AI图像生成区域。

“通义万相”按点数计费,内测期间每天提供50个基点,每次生成消耗1点。因为每次会生成4张图片,换句话说就是每天可以免费生成200张!

文生图:人类想象力与AI的激烈碰撞

“文生图”不稀罕,几乎各家大模型都具备这种“文本生成图像”的跨模态能力。“通义万相”的设定玩法会更加无需教学零门槛。

提示词输入框下方列出了7种目前支持的绘图风格,分别为:水彩、油画、国画、扁平插画(矢量插画)、二次元、素描、3D卡通。

生成尺寸方面提供方图、竖图与横图三种,家人们可以根据自己需要生成的图像风格选择合适的尺寸。一般来说,人像特写选择竖图的视觉冲击力更好,需要广角视角or场景纵深感更突出的话,则选择方图或者横图。

如果不懂得如何填写提示词,往下还可以随机生成一些阿里官方预设的提示词写法,帮助你举一反三。BTW,“通义万相”支持中英文双语提示词。

话不多说,来实战!

EVA很喜欢皮克斯工作室的动画风格,之前在Midjourney上体验过,好喜欢这种3D大头人偶的质感。

Midjourney生成结果

我将相同的提示词输入通义千问之后,生成的人偶品质完全不输Midjourney。至于场景的细节丰富度方面,建议家人们在提示词方面继续开拓一下。

此外,“通义万相”的交互还是蛮人性化的,如果觉得图像细节不满意,但对构图比较满意的话,还可以直接要求再次生成相似的图片。

图片生成的时候有“万相”的水印,下载之后是720P的高清图。但是失去提示词精准控制之后,这回笼“炼丹”的成果多少有点“失控”……

这几年特别流行赛博朋克元素,EVA也来尝试一个很多人玩过的赛博风格头像提示词。“通义万相”生成的图片真的好好康嗷嗷嗷!我都想马上用来换掉公众号的头像了!

EVA周末刚从故宫回来,对钟表馆的西洋钟表精致的雕琢手工印象深刻。在“通义万相”输入几个钟表解构图的提示词,马上生成了一幅融入中国古代皇家元素的西洋钟表的浮雕图。

中式剪纸艺术的图片风格也是信手拈来,十来秒的功夫就生成了,这样就更便于设计风景区的周边文创商品。

相信每个女生都有一个童话故事的幻想,让AI帮忙生成一个《小红帽》的故事场景,你别说,就是童话书插画的味道!

记得有一部关于人工智能的科幻片叫《终结者》,讲述AI控制了核武器让人类陷入灾难,尝试利用类似的核战后废土风格制作一个大都市的场景。

想要复刻一个《荒野大镖客》的西部小镇场景,也是轻而易举。

EVA追加提示词,我想在此基础上,融入《GTA5》洛圣都的车水马龙、人来人往的场面,时代感马上就转换为美国现代西部小城的景色。

此情此景,EVA感觉仿佛马上就能开车撞上路边醉酒蹒跚的崔佛。

上阵“父子兵”,钢铁侠与蜘蛛侠的感情大家都有目共睹。生成一个战衣解构感受一下。这“小蜘蛛”咋感觉像是吃多了呢?

几天前,美国拉斯维加斯的球形建筑落成,这座耗资23亿美元(折合166亿人民币)的超级新地标冲上热搜。

球体建筑的外立面全部为LED投影屏幕,是目前世界上最大的可编程LED球面屏。EVA尝试让“通义万相”也设计一座类似的建筑,外立面为可变化的星空屏,也很震撼。

新海诚的动画相信家人们看过不少,EVA尝试用“新海诚风格”生成“水中少女”图片,用来当电脑壁纸是足够了。

目前模仿新海诚风格在Midjourney社区很流行,而画师更喜欢用Stable Diffusion来控制画风会更稳定。“通义千问”在线生成的质感有点像新海诚风格,又不太像,还需要进一步调校。

接下来我们换成“宫崎骏风格”再输出一次试试,大家感觉像吗?

最后再来试一下同一串提示词在三种不同尺寸的场景输出的图片结果,这次EVA选择生成的是“美国90年代手绘漫画风格下的太空站”。

家人们可以从这组图感受一下不同尺寸的场景视觉冲击感的差异。然后我们接着往下体验新功能。

相似图生成:青出于蓝而不逊于蓝

这个能力,顾名思义,就是上传一张你喜欢的照片,然后让AI自己参考之后生成一张全新的风格和内容相似的图像。该功能主要考察大模型对于图像结构分析与模仿的能力。

这个功能对于原画师和工业设计师是相当利好。很多时候我们会看到一幅别人的好作品,但又不能像众泰那样拉皮尺测量,就可以通过相似图模仿来生成全新的设计方案,甚至还可能在与AI碰撞之间,激发出新鲜的灵感。

比如往“通义万相”投喂上边这幅狗狗的画像,AI帮忙生成类似风格的四幅画,生成结果甚至与参考图的狗狗品种都一致,狗链子细节也都没放过。尽管AI对于人类文字仍旧理解不能……

我尝试上传一张《塞尔达传说:王国之泪》的原画壁纸让AI模仿。

输出的结果是这样的。

真的很不错诶,可以说是完全抓住了任天堂作画的精髓,EVA甚至觉得从氛围感上比原作更突出史诗感与紧张感。

《原神》人气CP钟离和达达利亚的同人图,网上非常多,不过由AI生成的暂时还不多。EVA尝试让“通义万相”模仿一下。

可以说是……emmm,AI是真的一点都不含蓄,比原图还攻啊啊啊!

EVA把《王者荣耀》的李白角色原画喂进去试试。

得到了一个比腾讯天美原画师更用力的“暴走型李白”,发型服饰配饰武器都领悟到了,眼神充满了狠劲儿。大概是因为酒仙不喝酒,改“喝血”了。

下一个咱不试人物角色了,我们尝试投喂游戏《逆水寒》的场景看看能不能模仿出来。

对于非人物的描绘,“通义万相”很显然更是手到擒来,江南水乡的细节拿捏很精准,游戏设计行业真的要变天了。

最后再试一下FPS游戏《绝地求生》的场景,细节会比较多比较复杂,对AI结构图片的挑战比较大。

从生成的结果来看,基本把握住了人物的运动特征,以及战场硝烟弥漫的氛围。不过主角手上拿的是什么,RPG(火箭榴弹发射器)么?

最后我们尝试用一批“二次元老婆”生成“AI老婆”,想想都美!(左边是原图,右边是AI模仿图)

“通义万相”模仿二次元美女的能力还是不错的,尤其是时崎狂三投喂训练估计不少吧,细节拉满!当然AI画手崩坏的问题依然存在。

PS:在测试的时候,EVA也发现,并不是每一张图片都可以模仿生成的,并且当生成失败的时候依然会消耗点数。

风格迁移:比美图滤镜更强大

所谓风格迁移,就是指在不改变画作本身呈现信息的前提下,将一幅画的风格复用到另外一幅画上,使之成为新的作品。

这种风格迁移经常会出现在各种市场活动的品牌营销案例的宣传设计当中。比如苹果公司就是典型的自家Logo能玩出了花。

比如,我们上传一张风景照。但是我们想将梵高的名作《星空》的风格融入这张乡村风景。

将两张照片分别上传到“通义万相”就得了如下结果。

再试一张,比如我打算将这张海边的风景照,转换为素描质感。

风格迁移之后,就得到了一张海边沙滩的素描画。

从彩色到黑白容易,倒过来能行吗?能。

再比方说,我们现在有一张没有色彩的赫本黑白肖像照,然后EVA再上传一张卡通手绘画。

风格迁移后,从黑白照变成油画质感的赫本肖像照就诞生了。AI把握住了小女孩腮红的精髓,甚至还给赫本“换上”了长袖和袖套,女神变成小村姑。

最近网上开始流行“多巴胺配色”,所谓“多巴胺”其实就是鲜明、活泼的高饱和度配色,比如红、黄、绿、橙、蓝等。

EVA教你怎么做产品配色设计。我上传一张苹果电脑的照片,然后再上传一张“多巴胺配色”的色卡。

剩下就是灵感产生的时刻,等待AI糅合……

夏日清凉+猛男配色,感觉整个人突然就亢奋起来了呢!

最后还是请来我们的二次元萌妹子做个示范。以前我们调色会经常用到Adobe的Illustrator。现在有了“通义万相”,可以让它帮你创作更多可能。

瞬间化身“多巴胺少女”,充满一种很奇妙的艺术张力。

最后需要提醒的是,这种风格迁移的玩法,是支持两张图片调换主次位置的,点击上传图片框中间的↕上下箭头即可实现风格的逆向迁移。

“通义万相”的优缺点

作为一款仍处于内测的AI绘图工具产品,必然有其优点也会存在缺陷。EVA体验下来,基本总结如下:

优点:

  • 内测期间完全免费
  • 赠送生成张数对比竞品较多
  • 在线操作无需本地硬件部署
  • 服务器在国内免“魔法”,平均生成速度30秒
  • 交互简约,入门门槛极低
  • 支持大部分Midjourney提示词

缺点:

  • 生成品质很不错,但还不是顶尖
  • 图片模仿稳定性不足
  • 有时遇到素材集训练量不足,会生成失败
  • 有时账号会莫名其妙登出

如何获得阿里云的“通义万相”?

“通义万相”目前正在接受用户申请内测。关注本站公众号,并发送私信“万相”即可立即获得内测申请入口。

EVA申请内测资格小Tips:

记得将自己的详细使用需求尽量写清楚哟。写得越详细,越容易通过申请。比方说,假如你是原画师,就把你的工作内容、工作项目强度和工作性质给介绍清楚,审核专员是会人工阅览的唷。

一旦申请通过后,会收到来自阿里云官方的邮件及短信,就可以登陆“通义万相”平台使用了。

最后是费用提醒!

目前“通义万相”是完全免费使用的,官方连点数充值入口都还未建设好。一切第三方个人与组织邀请你参加付费体验活动,或者付费购买账号的行为,都可能涉嫌诈骗,请提高警惕!

10

相关文章