AI奇点网2023年7月27日报道丨“文生图”行业的当红炸子鸡Stability AI日前发布了Stable Diffusion XL 首个正式版 1.0,距离AI奇点网此前报道该 AI 工具推出 0.9 版本仅过了一个月,Stability AI 公司宣称,Stable Diffusion XL 1.0 是该公司迄今为止 "最先进" 的 AI 工具。
据悉,Stable Diffusion 是一个具备文字转图片/视频能力的生成模型,可以用几秒钟时间就生成高分辨率、具备真实性和/或“艺术性”的视觉结果。Stable Diffusion XL 1.0 版本在 GitHub 上以开源形式发布,与前代产品(Stable Diffusion XL 0.9 版本)相比,Stable Diffusion XL 1.0 生成的图片色彩“更鲜艳”、内容“更准确”,对比度、阴影和光照效果也更出众。
Stability AI 的应用机器学习主管 Joe Penna 在接受采访时表示,Stable Diffusion XL 1.0 版本包含 35 亿个参数,可以在“几秒钟内”生成多种长宽比的完整图像。
Penna 同时表示:“Stable Diffusion XL 1.0 是可定制的,用户可以自行微调生成的图片风格,只需要基本的自然语言提示,用户就可以使用该 AI 工具完成复杂的设计。”
据悉,Stable Diffusion XL 1.0 还在文本生成方面进行了改进。Penna 声称,许多竞品实际上无法在图片中生成可供阅读的文字,免去用户后期调整字体的麻烦。
此外,据 SiliconAngle 和 VentureBeat 报道,Stable Diffusion XL 1.0 也支持了 Adobe 此前在 Firefly 工具中提供的“重建图像的缺失部分”及“扩展现有图像”功能,用户可以使用描述来自由修改图片中的内容。
据AI奇点网调查,在之前的彭博科技峰会上,Stability AI首席执行官Emad Mostaque曾呼吁各国提供更多开放数据,以帮助改进AI模型,并指出“垃圾”数据导致该技术效果不佳。他称AI是我们一生中最大的经济现象,但该行业仍在解决道德问题,并确保更好的数据来训练AI模型。如今他的公司推出的Stable Diffusion XL 1.0,可以说是他们团队努力的证明。