智谱AI正在研发对标OpenAI Sora的国产文生视频大模型，预计年内发布-AI奇点网

首页 > 资讯 > 文章

2024-05-06 11:46

智谱AI正在研发对标OpenAI Sora的国产文生视频大模型，预计年内发布

以下文章节选自丨钛媒体

5月6日消息，钛媒体AGI获悉，估值超200亿的国内 AI 大模型独角兽公司「智谱AI」正在研发对标美国Sora的高质量文生视频模型，预计最快年内发布。

“文生视频目前处于一个快速发展的阶段，预计今年将是文生视频大模型的爆发期。国内公司在文生视频技术方面的客户需求非常多样，从电影拍摄到短视频、游戏制作等。智谱也将通过使用更高质量的数据和更大的参数，开发高质量的文生视频产品。”一位智谱 AI 内部人士表示。

智谱 AI 是国内最早入局大模型赛道的公司之一，也是目前国内头部大模型厂商代表之一。钛媒体AGI了解到，对于智谱AI 当前的综合能力水平，内部人士称“性能接近海外顶级模型”。

智谱 AI 内部人士坦言，对标Sora的文生视频模型发展突破的关键主要包括技术路线选择、训练所用的高质量视频素材语料两个方面。

“技术路线上，Transformer与Diffusion的结合架构如何在效率和效果上进行优化，如何解决连续帧之间的抖动问题，如何在满足高分辨率的同时实现高一致性的长序列生成，如何获取高质量数据泛化到更多更细节的真实场景，都是技术上需要解决和通过大量实验试错的问题；数据集方面，此前 Sora 被评价模型对摄影术语（跟拍、平移、镜头切换）的理解有限，所生成的视频后期还需要对视频素材进行超分处理。公司会注重更全面的优质数据版权与使用。”上述人士称。

2023年3月，智谱AI推出千亿开源基座对话模型ChatGLM系列，并在过去一年内完成4次升级，于2024年1月推出GLM4系列。

同时，基于全自研基座大模型的能力，智谱AI亦已构建了AIGC模型产品矩阵，包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

“最新基座大模型GLM-4，整体性能相比上一代大幅提升，逼近 GPT-4。如果做一个比较量化的对比，我们当时对标的对象是GPT-4，其性能的对比可以在很多方面上做到 95%左右。在比如中文对齐的任务下，我们甚至可以略微超过它。根据最新的海外伯克利Arena Hard 基准测试,GLM排名仅次于GPT-4 Turbo 和Claude 3 Opus，在国内外模型中均处于领先地位。”智谱内部人士称。

张鹏在今年3月透露，截至2023年底，智谱 AI 已拥有超2000家生态合作伙伴、超1000个大模型规模化应用，另有200多家企业跟智谱AI进行了深度共创，覆盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的多个头部企业。

智谱ChatGLM-6B开源大模型目前全球累计下载量已经超过了1300万，GitHub Star星数达到5万，整个量级超过了Meta Llama两个版本的总和。智谱AI已获得全球最受欢迎的开源机构的第五名，是全球唯一一家上榜的中国机构和组织，“力压了包括OpenAI、谷歌，还有微软”。

截至目前，智谱AI估值超过200亿元人民币，是国内AI领域独角兽唯一超过了10亿美元的企业。截止目前，智谱AI以产业型投资方式，已经投资、入股超过13家 AI 产业链初创公司。