AI绘画工具Stable Diffusion XL(SDXL) 1.0首发测评:免费在线,百亿级参数,超短提示词一键出大片,Midjourney最强竞品!
AI绘画工具:Stable Diffusion XL(缩写SDXL)
工具介绍:Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。 其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像编辑等能力。它在图像生成质量上有了极大的提升,并且模型是开源的,图像可免费商用。
工具链接:https://www.aieva.cn/sites/1269.html
终于,新王上位!正式版Stable Diffusion在线图片生成工具上线!
当地时间7月26日深夜,全球知名的开源AI绘画工具开发商Stability AI官宣Stable Diffusion XL 1.0大模型(SDXL),终于摘掉了BETA的?帽子。并决定将服务器迁移至亚马逊云(AWS)上运行。
通常来说,我们对于Midjourney和Stable Diffusion两大AI绘画工具的刻板印象是:前者提供在线图片生成,订阅使用;后者则需要购置显卡本地部署硬件,无限续杯。
而Midjourney因为在线可用、便捷出图深受画师偏爱。今年4月局势突变,Stability AI借助收购过来的「ClipDrop」AI工具网站打造在线“文生图”工具,迎头挑战Midjourney。从发布至今,该网站已经生成超过3500万张图片。
随着产品运营的推进,SDXL“超大杯”绘画模型也从V0.9迭代到了今天的V1.0。
SDXL 1.0只需几句话,甚至几个单词,就能创建复杂、细致、精美的图像,几乎能够胜任所有人类能够想到的艺术绘画创作。
官方在更新日志中写道,SDXL 1.0现在可以生成更加鲜明准确的色彩,无论是光照效果、对比度和阴影质感都有了显著提升,肉眼难辨真假。
SDXL 1.0使用更简单,提示词门槛更低
还记得那些复杂的提示词(关键词)吗?
几个月前,家人们都还在努力地就像考取雅思托福那般背诵。如今咱们不再需要使用华丽的辞藻对画面进行描述,就能够更轻松地获得高质量的出片。
比如说,“杰作”(Masterpiece)这个提示词是许多人常加的,现在不需要了。
因为SDXL 1.0大模型的基础模型参数量已经达到了惊人的35亿,是初代的三到四倍,叠加66亿的优化模型参数量BUFF,对于生成图像的解析解构能力更强。
具体怎么说呢?比如现在AI大模型可以准确区分“The Red Square”(红场:莫斯科著名景点)和“A red square”(红色的正方形)。
像“8K”“超高清分辨率”这些画幅提示词也没必要了,因为现在Stable Diffusion XL 1.0能够按照1024×1024的最大分辨率默认输出图像,当然也支持其他常见的图片比例。
需要注意,SDXL工具是支持输入中文提示词的,但因为涉及到翻译精度的问题,EVA这边还是推荐大家使用英文提示词。
此外,使用中文提示词会造成AI系统默认判别用户来自中国,就会自动调用中式的训练素材,而Stable Diffusion模型训练比较多的中式元素是国风画作与汉服,亚裔面孔概率性会崩。
SDXL 1.0在线“文生图”效果怎么样?
事不宜迟,咱们来实战吧!
EVA输入提示词“可爱的小女孩,站在水中央,星空,多云的天空”。因为今天体验的用户实在太多的缘故,SDXL 1.0花了快2分钟才生成了四幅作品(平常平均在30秒),其中的两幅还是相当不错的,蛮有故事书插画的质感。
生成一个“芭比粉”配色的童话城堡,创意输出很稳定。EVA更喜欢右边这一幅图表达的氛围。
如果觉得四幅图都不太满意,你还可以点击后边的➕加号追加生成四张。
输入提示词“羊驼,芭比粉毛发,特写”,得到了两枚追赶今夏时尚顶流的“芭比草泥马”头像。
输入提示词“工作室内,一个白胡子老头正在制作木雕,木雕是字母”。SDXL 1.0就返回了这样一张亚裔老匠人正在工作的图像,光影的质感很逼真。但很显然,AI还是不擅长认字儿与画手指。
你甚至可以利用SDXL 1.0制作复杂的文字艺术,比如——
事实上,迭代多次后的SDXL 1.0大模型对于亚裔面孔的把控成长了许多。比如下边这组对比,EVA推测大概是Stability AI拿了不少日系美女的照片来训练。
我输入提示词“亚裔女子,红色耳坠,穿着红色的旗袍,特写”,你不说是AI生成,我以为是真实的人像写真。可能是因为穿着旗袍的缘故,感觉更像华裔。
因为训练参数量的增加,SDXL 1.0学会了更多人类摄影师的人像作品。生成黄昏下花丛里的人像景深“游客照”,易如反掌。
生成动物与人互动的融合场景,也更加逼真,除了狗狗的脚印?露出了Bug,但一般人应该留意不到。
SDXL 1.0提供了写真、梦幻、折纸、透视、数字渲染、漫画、动漫、电影、胶片、赛博朋克、像素风、扁平化、3D渲染、线条艺术等等十余种风格。
只需调整提示词输入框下方的风格选项,你甚至可以生成一只像素风格的柯基犬。在AI技术诞生以前,需要复杂的重新上色,简直是画师的美梦。
生成“3D动画,黄昏下迪士尼风格的猫咪,特写”,质感也非常棒。
来一点现实主义的人造建筑设计。比如下图是拉斯维加斯最近落成的超人气建筑——全球最大的单体球形外立面LED屏幕大楼MSG Sphere。EVA尝试让SDXL 1.0做一个复刻模仿设计。
这是SDXL 1.0设计的球形大楼,除了规模比较小之外,整体也还不错——
甚至还设计出了这样一栋超有科幻感的球型写字楼,不知道力学构造是否符合现实呢?请屏幕前的建筑大佬指点~
生成超现实主义的画作,比如魔幻题材、未来都市、赛博朋克等等,也难不倒SDXL 1.0。而这一切,在以前可是Midjourney的拿手好戏。
来一点怀旧主义的画作?
输入提示词“白天,堆满20世纪80年代老款计算机与植物花盆的房间”。AI给我输出了这样一幅图像,看起来仿佛真像实际存在这样一个房间,找不出明显破绽。
生成一个常见的AI绘画示范图——穿着未来机甲的女子。左图是V0.9版本生成的,右图是最新的V1.0版本生成的。是错觉吗?看起来女子的年龄成熟了不少。怎么,AI也会长年纪??
马斯克最近很突然地给Twitter换了一个新Logo——X。
有外媒报道称,经典“小蓝鸟”商标的品牌估值高达40亿美元,有点可惜了。咱就不按马老师的思路走,以“小蓝鸟”融合X字母,让SDXL 1.0设计一个新Logo试试——
看起来AI的设计还蛮有科技感与社交氛围的,现在的Twitter新Logo太单调。
生成一张虚构的“马斯克与扎克伯格对垒”的图片,虽然左边这位的发型、胡子是马斯克的风格,但看起来更像是两个“扎克伯格”PK。SDXL大模型还没能解决多人同框面孔同质化的问题。?
如果家人是游戏开发工程师,你还可以利用SDXL 1.0来生成游戏里边的场景贴图,比如这张模仿秘鲁印加文明的神庙,颇有《神秘海域》的味道。
甚至提供几个简单的单词,就可以生成各种游戏道具。
SDXL 1.0可以用来做产品工业设计吗?7月27日今天,恰好公布了2024巴黎奥运会使用的火炬。
有网友说,它长得像擀面杖,还有网友说长得像“法国武器”——法棍?,总之都没离开吃。让SDXL 1.0依照这个简约风格,在不改变材质的前提下帮我们重新设计一款——
相比之下,我还是更喜欢自己通过AI设计的这款,至少不会显得头重脚轻。?EVA不才,教法国人做火炬。
你甚至可以马上针对刚设计好的产品图进行在线抠图、画质增强,或者参考这幅图的构型进行重新生成。抠图过程非常丝滑~
让AI“幻想”巴黎埃菲尔铁塔下庆祝奥运会开幕的游行人群,也别有一番法兰西热情,乍看之下颇有真实现场感。
好了,生成次数与文章篇幅均有限,先试玩到这吧!
SDXL 1.0平台每天提供400张免费的生成次数,也就说支持提交生成100次/天,足够家人们玩上好一阵了。相较于最大的竞争对手Midjourney,Stability AI还是非常大方的。缺点是会生成带水印,不过搭配EVA前几天推荐的AI一件去水印工具,完全不是障碍。
如果你加入付费订阅的话,就可以拿到“VIP速通券”,免除与全球用户一起排队生图的困苦了。但事实上,迁移新的服务器之后,个人觉得免费生成的速度也不算太慢。
Stability AI在发布SDXL 1.0之前,将其与各款老模型进行了人气对比调查:发现相较于Stable Diffusion 1.5/2.1、SDXL 0.9等等老款模型版本,人们更喜欢SDXL 1.0生成的作品。
随着SDXL 1.0的上线,AI在线生图会越来越卷,对于画师盆友们无形中也是一个好消息。重点是ClipDrop网站无需“魔法”,自在畅游。