马斯克xAI发布多模态大模型Grok-1.5V丨英特尔中国特供版AI芯片算力缩水92%丨周鸿祎预测未来几年AGI到来
AI奇点网2024年4月15日报道丨AI资讯早报
马斯克近期可谓大动作连连!刚刚宣布推出开源Grok-1.0大模型,并且发布新一代Grok-1.5版本,马斯克旗下的大模型创企xAI就再次发布了一款多模态大模型Grok-1.5V,也是该公司首个多模态具备视觉能力的大模型,直接对标OpenAI的GPT-4V。
作为对标OpenAI的大语言模型的竞争对手,如今除了文本功能外,Grok AI现在还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。
xAI重点展示了Grok-1.5V的7个示例,包括:将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、为生活日常问题答疑解惑、解决代码问题。
至此,xAI正式加入前沿多模态大模型的竞赛。与GPT-4V、Claude 3 Sonnet、Claude 3 Opus、Gemini Pro 1.5相比,Grok-1.5V的表现不相上下,在一些基准测试中略胜一筹。
据外媒报道,英特尔计划面向中国市场推出“特供版”AI加速芯片Gaudi 3,包括HL-328和HL-388两种形态。
英特尔公开了第三代 AI 加速器——Gaudi 3的性能参数,基于英特尔自研的5nm制程工艺,专门用于深度学习和大型生成式 AI 模型。Gaudi 3具有先进的制造工艺,带宽是上一代的 1.5倍,BF16 性能提升 4 倍,而网络运算能力则提升了 2 倍。该产品预计将配备高达 128GB 的 HBM3e 内存,在 AI 学习和训练方面表现卓越。
因为受到美国商务部的出口管制规则限制,针对中国大陆市场的特供版AI算力芯片的性能需大幅降低至150 TFLOPS以下,预计性能将降低约92%。同时,TDP也将相应减少,与英伟达此前针对中国市场推出的AI加速卡GPU H20性能相近,但在HBM容量及带宽上可能处于劣势。
InstantID 原团队推出了风格迁移的新方法 InstantStyle,与人脸 ID 不同,它是一个通用的图像风格注入框架,采用两种简单但非常有效的技术,来实现风格和内容与参考图像的有效分离。
InstantStyle的创新之处在于:
【特征相减】利用CLIP模型的特性,通过特征相减的方式去除图像特征中的内容信息,从而减少参考图片内容对生成图片的影响。这种方法的优势在于,内容信息相对容易通过文本描述提取,因此可以通过CLIP的文本编码器提取内容特征,用于解耦风格和内容。
【仅风格层注入】InstantStyle方法仅在特定的风格层完成特征注入,这样做可以隐式地实现风格和内容的解耦。研究发现,在UNet的mid block附近,存在两个特定的层,分别控制风格和空间布局,这为风格化图像生成提供了新的视角。
360公司创始人周鸿祎在哈佛中国论坛上发表演讲,幽默解释了公司名称360的含义,称其代表“250+110”,暗指公司在免费杀毒行业的“二”精神。他还分享了自己对于AI信仰的看法,认为大模型的突破是真正的人工智能,预测未来几年内AGI将到来,并强调所有行业都值得用AI再造一遍。
周鸿祎鼓励创业者关注专业级大模型的机会,并认为中国在AI领域有巨大潜力。
2023年受惠于生成式AI技术的飞跃式发展,英伟达的AI运算GPU受到了全球范围内客户的广泛抢购。这也令英伟达的股价一跃成为了世界前三的科技股。为了解决泼天富贵带来的利益红利,英伟达CEO黄仁勋制定了复杂的薪酬结构,希望借助高额的股权奖励牢牢绑定核心的员工。
英伟达高管团队在2023财年未获得现金奖励,但通过复杂的股权奖励计划仍获得显著收益。黄仁勋获得近5亿美元股权奖励,其他高管最少也有1480万美元收益。公司采用SY PSUs和MY PSUs两种股权奖励,强化了对高管和关键员工的绑定,减少了人才流失的风险。