OpenAI发布文生视频模型Sora震撼全球丨谷歌发布Gemini V1.5版本丨芯片设计公司ARM股价一周飙升93%
AI奇点网2024年2月18日报道丨AI资讯早报
当地时间2月16日,OpenAI突然秘而不宣地发布了文生视频大模型Sora。这是一个AI视频生成的大模型,能够根据文本指令或静态图像生成长达1分钟视频的扩散模型,是目前世界范围内已经公开的视频模型可以支持生成长度最长的大模型。
而且视频中还包含精细复杂的场景、生动的角色表情以及复杂的镜头运动——相比于其他视频生成模型,Sora 在生成时长、连贯性等方面都有显著的优势。
在训练中,Sora应用了Diffusion-Transformer技术作为基础,将视频打包成一个个连续的时空包(patch)模块,结合语言与视频应对的报幕员系统,通过大量视频素材训练使其能力远超对手。在这一过程中,视频生成涌现出了三维一致性和极强的连贯性等能力。
全球科技大佬都对这款全新的模型印象深刻,马斯克对此评价道:人类应该“认赌服输”,但通过AI技术增强的人类将创造出最好的作品。
当地时间2月16日,在上周宣布Bard更名Gemini后,谷歌发布Gemini大模型矩阵的最新力作——Gemini 1.5.并将上下文窗口长度扩展到100万个tokens。这意味着Gemini 1.5 Pro可一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。
Gemini 1.5 Pro达到了与1.0 Ultra相当的质量,同时使用了更少的计算。它能对不同的模式执行高度复杂的理解和推理任务,包括视频。例如,当给定巴斯特·基顿44分钟的无声电影时,该模型可以准确地分析各种情节点和事件,甚至可以推理出电影中容易被遗漏的小细节。
Gemini 1.5 Pro还展示了令人印象深刻的“情境学习”技能,可以从长时间提示的信息中学习新技能,而无需额外的微调。
2月13日,全球知名的半导体芯片设计公司ARM股价上涨29%。自本月8日公布第一季度财报以来,ARM股价已累计上涨 93%。自去年9月首次公开募股以来,ARM股价几乎翻了三倍,周一收于148.97美元,市值接近1530亿美元,仅比英特尔市值低300多亿美元。
上周,ARM表示其最新指令集的授权费用可以提高一倍,该指令集占公司 15% 的专利使用费收入。这表明 ARM可以扩大其利润率,并从新芯片中赚取更多利润。该公司还表示,由于人工智能的需求,其正在开拓云服务器和汽车等新市场。
截至2月16日美股收盘,英伟达市值继续快速成长,已经来到了1.8万亿美元,以微弱的优势超过谷歌母公司Alphabet和亚马逊,成为全球市值第四高的公司,仅次于微软、苹果公司和沙特阿美。
就在AI浪潮兴起前的2022年10月,英伟达市值还不到3000亿美元,远远落后于亚马逊和Alphabet当时超过1万亿美元的市值。在聊天机器人ChatGPT横空出世点燃AI浪潮后,市场对英伟达AI芯片的需求激增。英伟达股价去年上涨了两倍有余,然而该公司堪称疯狂的涨势远未结束。2024年刚进入第二个月,英伟达股价今年迄今为止已上涨了近50%,市值增加了约6000亿美元,超过了它在2023年最后七个月的市值增幅。
据外媒消息,近日OpenAI已完成一轮员工售股交易,使其估值飙升至800亿美元以上。在短短不到10个月内,这家人工智能初创企业估值增长了近两倍。该公司CEO奥特曼在完成一轮员工售股的同时,适时放出了Sora视频生成模型的消息,让业界颇为震动。
OpenAI此次售股交易由风险投资公司Thrive Capital牵头,采取要约收购的形式进行。这意味着员工可以将手中的公司股份变现,而无需通过传统的融资方式为公司运营筹集资金。
此外,奥特曼还在积极争取美国联邦政府的资金支持,以推动一家大规模的AI半导体合资企业的成立。据彭博社上月报道,他的目标是筹集数十亿美元资金,以大幅提升全球尖端计算芯片的产能,从而避免他担忧的人工智能大规模部署和该领域持续发展的潜在障碍。