谷歌Gemini_最新AI大模型开发框架_模型训练

当地时间12月6日周三，谷歌正式向公众发布新一代大语言模型Gemini，号称谷歌迄今为止“最大、也最全能的AI模型”，有高级推理能力，回答难题时“考虑得更仔细”。有别于其他公司LLM竞品的是，谷歌强调Gemeni是最灵活的模型，因为它用不同大小的版本，可以适用于各种生成式AI应用。

Gemini总共有三个版本：面对高度复杂任务的Gemini Ultra；用于一般多任务处理的Gemini Pro，以及应用于用户设备端侧的Gemini Nano。

Gemini Nano已经可以应用于谷歌的Pixel 8系列智能手机；Gemini Pro即日起支持AI聊天机器人Bard，下周面向云客户；最强大版Gemini Ultra明年推行，同时也可以支持Bard。

在32项行业大模型基准指标测试中，Gemini有30种“遥遥领先”GPT-4；Gemini为原生多模态模型，支持文本和图像的服务，速度更快、效率更高，在谷歌更高性能云芯片TPU v5p训练，谷歌搜索明年融入Gemini功能。

“谷歌运行了32个完善的基准测试来比较Gemini和GPT-4，从广泛的整体测试（如多任务语言理解基准测试）到比较两个模型生成Python代码的能力。”谷歌DeepMind首席执行官德米斯·哈萨比斯表示：“我认为我们在32项基准中的30项中大幅领先。”

最新的演示里，Gemini能听能说能看，还能教人类说中文。在谷歌角度看爱，Gemini Pro版本对标GPT-3.5版本，而明年发布的Gemini Ultra则对标GPT-4。

相关工具推荐

阿里达摩院联合CCF开源发展委员会共同推出的AI模型社区，旨在降低AI应用的门槛，让AI模型的使用更加便捷和普及，上线超过300+开源AI模型。

通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手

面向企业提供一站式大模型开发及服务运行平台，提供丰富的大模型能力和工具，助力企业实现数字化转型。

Google的一个部门，致力于人工智能的研究和开发，大众可以从这个网站学到关于人工智能的最新知识。

百度自主研发的产业级人工智能深度学习平台，集核心框架、基础模型库、端到端开发套件、丰富的工具组件、星河社区于一体。

Auto-GPT是一个基于GPT-4的开源AI自动化机器人工具，结合了GPT-4语言模型的能力。可以访问互联网，具有长期/短期记忆，并且可以自主地实现你设定的任何目标，而无需人工提示每一步操作。