年末盘点丨GPT-4横扫天下、Photoshop集成大模型、Pika惊艳登场…2023年「AI元年」行业都发生了这些大事！-AI奇点网

首页 > 资讯 > 文章

2024-01-02 16:19

年末盘点丨GPT-4横扫天下、Photoshop集成大模型、Pika惊艳登场…2023年「AI元年」行业都发生了这些大事！

2023年已经过去，这一年被不少科技博主称为「AI元年」。而今天，已经是2024年的第二天，也是全球打工人的第一个工作日。

来自Everypixel Journal的一份统计报告，以AI工具推出的时间线维度，为我们从头到尾梳理了2023年3月~12月AI行业值得关注的若干大事件。

这份报告将今年井喷的AI创作工具主要分为三大门类：文本生成、图像生成以及视频生成。

文本生成工具

为啥要从3月开始看起？大概是这个月里，GPT-4、Bard先后发布，直接把大模型趋势推向更高潮。

这和Writerbuddy的数据也有所对应，2023年的3月~4月，光这一个月内，50大热门AI工具的总访问量增加了9亿，是调查期中AI工具日活增速最快的一个月。AI聊天机器人的能力也是从这时开始向各个维度延伸。

其中，谷歌的Bard使用多模态数据集训练而成。GPT-4发布后不断更新，扩展了插件、联网、支持语音、图像生成等功能。

另一边是Meta发布著名的开源大模型Llama 2，催生了大批“羊驼变种”，AI模型的开源社区也热闹了起来。

此外，开发者平台Stack Overflow推出OverflowAI，支持AI驱动搜索，开发者可在Visual Studio Code和Slack中轻松找到所需信息。

还有一款开源模型是Mistral AI推出的Mixtral 7B，Mixtral 7B也是开源基础模型里最强的那一档，可以越级挑战13B、34B。基于Mistral-7B微调的Zephyr-7B-beta也成为了多个评测排行榜前排唯一的7B模型。

另外，11月李开复的零一万物推出Yi-34B，在Alpaca经认证的模型类别中，以94.08%的胜率，超越LLaMA2 Chat 70B、Claude 2、ChatGPT。

马斯克7月份成立的新公司xAI也发布了自家第一个大模型Grok，据说可以实时获取推特（X）平台的数据。

年末也很重磅，先是谷歌发布新模型Gemini，被称作是和ChatGPT性能最为接近的竞争者之一。

而后Mistral AI年末推出Mixtral 8x7B（70亿参数×8个专家模型），这是首个开源MoE大模型。MoE架构也就是传闻中GPT-4采用的方案，可以说这是开源大模型离GPT-4最近的一集。

图像生成工具

2023年，图像生成领域竞争格外激烈。

3月份，Adobe Firefly大模型发布，Adobe Firefly被集成到最多人使用的绘图工具Photoshop中，艺术字文本创作的效果也是一大看点。

Midjourney推出V5版本，提高了图像生成效率、连贯性和分辨率。最近的12月份，V6版本也问世，带来了5大升级，支持在图像上进行简单的文本单词生成。

不得不提的还有ChatGPT的绘图搭档DALL·E 3，DALL·E 3无需复杂提示工程，简化了图像生成，且还能根据用户反馈细化提示并进行图像调整。

图库网站Shutterstock也推出了AI功能，用户可使用AI生成新内容，也可对图库中的图片进行简单编辑、转换。

图片生成领域也已今时不同往日，下面是2007年文本-图像生成和2023年的效果对比：

视频生成工具

视频生成效果在2023年发生显著变化。Pika在最初内测版推出的时候就引了50万用户，每周生成数百万视频。年末，Pika 1.0的升级使用户能够以3D动画、动漫、卡通、电影等各种风格创建编辑视频。

Meta这边还推出了Codec avatars，该模型专注于视频中的3D人脸生成。

Runway的Gen-2模型将视频效果一口气拉到了4K超逼真的高度，且做到这种效果只需简单一句话输入。

AI翻译配音工具HeyGen推出了AI视频创作工具，包含100+数字人素材和模板，还支持300+不同音色和40+语言。只需选形象、写文本、等输出三步，就能让霉霉很自然的开口说中文。

此外，Stability AI也推出了自家视频生成工具Stable Video Diffusion，不仅支持文本到视频、图像到视频生成，还支持物体从单一视角到多视角的转化。

总之，在AIGC的各个领域，都是竞争格外激烈的一年。

但行业中也发生了一些重大合作，值得关注。首先是行业领头羊之间的重大合作。

Stability AI & Init ML

Stability AI收购了图像处理应用ClipDrop背后的核心团队Init ML，将Stability AI整合到ClipDrop的生态系统中，促成了SDXL Turbo的开发。

Runway & Getty Images

Runway与Getty Images联手，推出了新的视频生成模型RGM，将Runway的AI功能与Getty Images的创意内容库相结合，改变了内容创作流程，使公司能够根据其品牌形象生成高质量的定制视频。

Snowflake & Neeva

数据仓库平台Snowflake收购了使用生成式AI工具来增强搜索体验的初创公司Neeva，Neeva最近关闭了无广告搜索引擎。

Shutterstock & OpenAI

Shutterstock和OpenAI已达成为期6年的合作伙伴关系，Shutterstock为OpenAI提供图像、视频、音乐库等高质量数据集。

整个人工智能行业也在2023年发生了一些里程碑事件。

最明显的就是法律方面——OpenAI等AI巨头都深陷维权争议，这也促成了AI方面立法脚步的推进。

比如欧洲议会、欧洲理事会和欧盟委员会三方就《人工智能法案》达成协议。该法案将成为全球首部人工智能领域的综合性监管法规。以及美国版权局明确了对AIGC生成的内容的司法立场：拒绝为AI生成的图像注册版权。同时全球各国也在积极出台治理AI方面的政策条款。

最后，报告还列出了一些行业热议事件。

其中3件都和OpenAI有关。分别是：

① 摩根大通、花旗集团等金融机构出于安全考虑限制员工使用ChatGPT；

② OpenAI低薪雇佣人工筛查ChatGPT敏感内容；

③ OpenAI的管理层与董事会之间发生的宫斗内讧。

另外，这份报告还关注了2023年索尼世界摄影大赛，首次出现评委将获奖颁给AI而非人类摄影师的事件，当时创作者拒绝领奖并宣布自己是AI生成图像，引发了关于AI创作方面的激烈讨论。

总之过去一年里，AI行业诞生了许多新事物，也发生了许多前所未有的大事件。通过它们可以更好理解2023，也能更好展望已经到来的2024。

2

查看相关话题： #AI工具 #AI大模型 #AI文本生成 #AI图像生成 #AI视频生成

相关文章

知名AI科技媒体

作者已发布 131 篇文章

近期文章

更多

OpenAI满血版o1剧透：数学代码能力再破天花板，已开启测试评估

OpenAI满血版o1剧透：数学代码能力再破天花板，已开启测试评估

「国产Sora」最新升级！《沙丘》级大片视效，人人都能免费体验

「国产Sora」最新升级！《沙丘》级大片视效，人人都能免费体验

我们用豆包视频大模型，生成了AI版的《红楼梦》MV

我们用豆包视频大模型，生成了AI版的《红楼梦》MV

三星新一代旗舰手机Galaxy S24遭到沃尔玛「意外」提前上架：主打AI翻译功能，搭载高通骁龙8 Gen 3处理器

上一篇

最新研究发现任务污染可能导致GPT-4「降智」丨美图视觉大模型获得网信办备案丨360上线“数字老周”AI数字人

下一篇