当地时间12月6日周三,谷歌正式向公众发布新一代大语言模型Gemini,号称谷歌迄今为止“最大、也最全能的AI模型”,有高级推理能力,回答难题时“考虑得更仔细”。有别于其他公司LLM竞品的是,谷歌强调Gemeni是最灵活的模型,因为它用不同大小的版本,可以适用于各种生成式AI应用。
Gemini总共有三个版本:面对高度复杂任务的Gemini Ultra;用于一般多任务处理的Gemini Pro,以及应用于用户设备端侧的Gemini Nano。
Gemini Nano已经可以应用于谷歌的Pixel 8系列智能手机;Gemini Pro即日起支持AI聊天机器人Bard,下周面向云客户;最强大版Gemini Ultra明年推行,同时也可以支持Bard。
在32项行业大模型基准指标测试中,Gemini有30种“遥遥领先”GPT-4;Gemini为原生多模态模型,支持文本和图像的服务,速度更快、效率更高,在谷歌更高性能云芯片TPU v5p训练,谷歌搜索明年融入Gemini功能。
“谷歌运行了32个完善的基准测试来比较Gemini和GPT-4,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”谷歌DeepMind首席执行官德米斯·哈萨比斯表示:“我认为我们在32项基准中的30项中大幅领先。”
最新的演示里,Gemini能听能说能看,还能教人类说中文。在谷歌角度看爱,Gemini Pro版本对标GPT-3.5版本,而明年发布的Gemini Ultra则对标GPT-4。