年末盘点丨GPT-4横扫天下、Photoshop集成大模型、Pika惊艳登场…2023年「AI元年」行业都发生了这些大事!
2023年已经过去,这一年被不少科技博主称为「AI元年」。而今天,已经是2024年的第二天,也是全球打工人的第一个工作日。
来自Everypixel Journal的一份统计报告,以AI工具推出的时间线维度,为我们从头到尾梳理了2023年3月~12月AI行业值得关注的若干大事件。
这份报告将今年井喷的AI创作工具主要分为三大门类:文本生成、图像生成以及视频生成。
为啥要从3月开始看起?大概是这个月里,GPT-4、Bard先后发布,直接把大模型趋势推向更高潮。
这和Writerbuddy的数据也有所对应,2023年的3月~4月,光这一个月内,50大热门AI工具的总访问量增加了9亿,是调查期中AI工具日活增速最快的一个月。AI聊天机器人的能力也是从这时开始向各个维度延伸。
其中,谷歌的Bard使用多模态数据集训练而成。GPT-4发布后不断更新,扩展了插件、联网、支持语音、图像生成等功能。
另一边是Meta发布著名的开源大模型Llama 2,催生了大批“羊驼变种”,AI模型的开源社区也热闹了起来。
此外,开发者平台Stack Overflow推出OverflowAI,支持AI驱动搜索,开发者可在Visual Studio Code和Slack中轻松找到所需信息。
还有一款开源模型是Mistral AI推出的Mixtral 7B,Mixtral 7B也是开源基础模型里最强的那一档,可以越级挑战13B、34B。基于Mistral-7B微调的Zephyr-7B-beta也成为了多个评测排行榜前排唯一的7B模型。
另外,11月李开复的零一万物推出Yi-34B,在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT。
马斯克7月份成立的新公司xAI也发布了自家第一个大模型Grok,据说可以实时获取推特(X)平台的数据。
年末也很重磅,先是谷歌发布新模型Gemini,被称作是和ChatGPT性能最为接近的竞争者之一。
而后Mistral AI年末推出Mixtral 8x7B(70亿参数×8个专家模型),这是首个开源MoE大模型。MoE架构也就是传闻中GPT-4采用的方案,可以说这是开源大模型离GPT-4最近的一集。
2023年,图像生成领域竞争格外激烈。
3月份,Adobe Firefly大模型发布,Adobe Firefly被集成到最多人使用的绘图工具Photoshop中,艺术字文本创作的效果也是一大看点。
Midjourney推出V5版本,提高了图像生成效率、连贯性和分辨率 。最近的12月份,V6版本也问世,带来了5大升级,支持在图像上进行简单的文本单词生成。
不得不提的还有ChatGPT的绘图搭档DALL·E 3,DALL·E 3无需复杂提示工程,简化了图像生成,且还能根据用户反馈细化提示并进行图像调整。
图库网站Shutterstock也推出了AI功能,用户可使用AI生成新内容,也可对图库中的图片进行简单编辑、转换。
图片生成领域也已今时不同往日,下面是2007年文本-图像生成和2023年的效果对比:
视频生成效果在2023年发生显著变化。Pika在最初内测版推出的时候就引了50万用户,每周生成数百万视频。年末,Pika 1.0的升级使用户能够以3D动画、动漫、卡通、电影等各种风格创建编辑视频。
Meta这边还推出了Codec avatars,该模型专注于视频中的3D人脸生成。
Runway的Gen-2模型将视频效果一口气拉到了4K超逼真的高度,且做到这种效果只需简单一句话输入。
AI翻译配音工具HeyGen推出了AI视频创作工具,包含100+数字人素材和模板,还支持300+不同音色和40+语言。只需选形象、写文本、等输出三步,就能让霉霉很自然的开口说中文。
此外,Stability AI也推出了自家视频生成工具Stable Video Diffusion,不仅支持文本到视频、图像到视频生成,还支持物体从单一视角到多视角的转化。
总之,在AIGC的各个领域,都是竞争格外激烈的一年。
但行业中也发生了一些重大合作,值得关注。首先是行业领头羊之间的重大合作。
Stability AI & Init ML
Stability AI收购了图像处理应用ClipDrop背后的核心团队Init ML,将Stability AI整合到ClipDrop的生态系统中,促成了SDXL Turbo的开发。
Runway & Getty Images
Runway与Getty Images联手,推出了新的视频生成模型RGM,将Runway的AI功能与Getty Images的创意内容库相结合,改变了内容创作流程,使公司能够根据其品牌形象生成高质量的定制视频。
Snowflake & Neeva
数据仓库平台Snowflake收购了使用生成式AI工具来增强搜索体验的初创公司Neeva,Neeva最近关闭了无广告搜索引擎。
Shutterstock & OpenAI
Shutterstock和OpenAI已达成为期6年的合作伙伴关系,Shutterstock为OpenAI提供图像、视频、音乐库等高质量数据集。
整个人工智能行业也在2023年发生了一些里程碑事件。
最明显的就是法律方面——OpenAI等AI巨头都深陷维权争议,这也促成了AI方面立法脚步的推进。
比如欧洲议会、欧洲理事会和欧盟委员会三方就《人工智能法案》达成协议。该法案将成为全球首部人工智能领域的综合性监管法规。以及美国版权局明确了对AIGC生成的内容的司法立场:拒绝为AI生成的图像注册版权。同时全球各国也在积极出台治理AI方面的政策条款。
最后,报告还列出了一些行业热议事件。
其中3件都和OpenAI有关。分别是:
① 摩根大通、花旗集团等金融机构出于安全考虑限制员工使用ChatGPT;
② OpenAI低薪雇佣人工筛查ChatGPT敏感内容;
③ OpenAI的管理层与董事会之间发生的宫斗内讧。
另外,这份报告还关注了2023年索尼世界摄影大赛,首次出现评委将获奖颁给AI而非人类摄影师的事件,当时创作者拒绝领奖并宣布自己是AI生成图像,引发了关于AI创作方面的激烈讨论。
总之过去一年里,AI行业诞生了许多新事物,也发生了许多前所未有的大事件。通过它们可以更好理解2023,也能更好展望已经到来的2024。
近期文章
更多