Stable Diffusion 3发布丨“AI算力之王”英伟达股票暴涨16%创纪录丨多元化争议,谷歌暂停Gemini生成人像
AI奇点网2024年2月23日报道丨AI资讯早报
在SDXL推出半年后,新一代的图像生成模型Stable Diffusion 3 终于发布了。2月22日,AI创业公司Stability AI发布了 Stable Diffusion 3 早期预览版。这款模型目前还没开放测试。
本次更新重点:
值得一提的是,这一版本在文字渲染、多主题提示和图像质量等方面都有重大突破。这一版本的发布标志着人工智能生成模型的又一次进步,极大地提升了生成图像和视频的质量和真实感。
在技术方面,Stable Diffusion3采用了扩散型Transformer架构和Flow Matching技术,这些技术的结合为模型带来了更高的稳定性和生成能力。通过结合了这些先进技术,Stable Diffusion 3在生成图像和视频时表现出色。
由于2月21日发布的第四季度财报业绩利好,业绩展望远超分析师预期,AI算力大厂英伟达的股价在2月22日当天交易日上涨16.4%,市值暴增2770亿美元,单日新增也创下了股票市场单日新增市值的历史最高记录,接近一个贵州茅台的市值。
英伟达市值一天之内增加2770亿美元,为美股纳斯达克市场史上最大的单日增长,目前该公司的总市值逼近2万亿美元,为微软、苹果之后第三高。该公司 2023 年第四季度营收221亿美元,同比增长265%;净利润122.85亿美元,同比增长769%。英伟达CEO黄仁勋表示,人工智能已触及技术的“临界点”。
近日有网友反馈,谷歌的最新大模型Gemini上线后,有用户在生成一些历史题材的内容时。Gemini会返回一些不符合历史真实原则的图像。比如当用户需要输出一个“二战时期的纳粹军官”形象时,居然会出现黑人或者亚裔的纳粹士兵形象,完全违背历史事实。
人工智能技术相关的研究人士推测,谷歌在针对人像生成时,算法决策上,对于种族的多元化呈现优先级排在了最前边。
当地时间2月22日,谷歌发布公告称,目前正在努力解决Gemini模型图像生成功能最近出现的问题。在此过程中,谷歌将暂停人物图像的生成,并在不久后重新发布改进版本。
当地时间2月22日,马斯克在推特(X)平台上发文预告,人工智能初创公司xAI将在两周后发布Grok V1.5版本的AI聊天机器人。据悉,新版本将带来一系列功能,其中包括备受期待的“Grok分析”按钮。马斯克表示:“Grok AI目前还远非完美,但会迅速改进。V1.5版本两周后发布。”
据悉,新版本的Grok AI将带来一系列的新功能,其中包括备受期待的“Grok分析”按钮。此按钮能够自动总结整个对话线程和回复,帮助用户轻松理解复杂的对话。此外,Grok V1.5还将能够辅助用户创建帖子,让内容创作变得更加高效。
OpenAI近日发布了文本生成视频模型Sora,根据基于用户提供的提示词,生成逼真的视频。当地时间2月22日,有国外Reddit社区网友反馈,根据他们测试得到的信息,Sora 生成 1 分钟视频的时间,需要渲染超过 1 个小时。
该爆料者表示,OpenAI的研究人员主要展示了预设的提示词示例,不允许公众随意使用自定义的提示词,最长的演示生成视频为17秒。估算如果要生成1分钟的有效视频片段,可能需要渲染1个多小时。
有网友评论,这可能就是为何OpenAI CEO奥特曼需要推出「7万亿美元的AI算力计划」。还有网友表示:“制作 90 分钟的电影,拍摄时通常需要超过 90 小时。如果你计算一下传统的动画制作工时,Sora的渲染时间也就很高效了”。
日前,关于OpenAI团队一线员工与阿里云通义千问的研究员的工作日常作息时间表在网上流出,一时引发了网友们对于「996」勤勉内卷的热议。
具体可以点击下方卡片查看本站的详细报道:
中国什么时候能搞出OpenAI的Sora?ChatGPT项目成员与阿里通义千问一线码农作息时间对比
为什么是OpenAI率先打造出Sora?而不是别人。这些全球最顶尖的人才在OpenAI是怎么开展日常工作的?对于我们普通人有什么参考意义?
根据两家公司的员工自述的爆料,无论是OpenAI的ChatGPT项目组,还是阿里达摩院的人工智能团队,员工都会从早上9点忙碌到至少晚上10点后。而阿里的员工甚至会出现在凌晨叫醒同事讨论新想法的情况。这让社会各界对于「内卷」再次引发了新的讨论。
对于网友关注的「996」工作情况,阿里云方面辟谣称:“假的,绝对不可能有这样的事。”