李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问
AI奇点网2024年11月13日报道丨AI资讯早报
11月12日,2024 百度世界大会在上海召开,今年的大会主题是“应用来了”。百度CEO李彦宏在会上表示,文心大模型最新的日均调用量已经来到 15 亿,较半年前 2 亿的调用量增长了 7.5 倍,对比去年同期增长了约 30 倍,远超内部的预期。
11月12日,百度举行 2024 年度的百度世界大会上,百度CEO李彦宏在会上发布了一项检索增强的文生图技术(iRAG)。文心 iRAG 旨在解决大模型在图片生成上的幻觉问题,通过结合百度搜索的亿级图片资源和基础模型能力,生成超真实的图片。
幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是 RAG,即检索增强。
李彦宏表示,过去 24 个月的大模型行业,最大的变化是“基本消除幻觉”,回答问题的准确性大大地提升了。
“让 AI 从一本正经的胡说八道变得可用,可被信赖。”他说。
不过,目前基于大语言模型开发的文生图应用存在仍然比较严重的幻觉,让生成的图片“一眼假”,极大地影响了 AI 的实用性。
针对上述问题,百度开发了检索增强的文生图技术 iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏在现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心 iRAG 技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现明显的错误或变形的幻觉问题。
11月12日,百度在 2024 百度世界大会上,正式发布旗下的人工智能终端设备——小度 AI 眼镜。在发布会上,称该产品为「全球首款搭载中文大模型的原生 AI 眼镜」。
据官方介绍,小度 AI 眼镜具备第一视角的拍摄功能,可以边走边向AI提问、卡路里识别、识物百科搜索、视听对话翻译、智能备忘录等功能。
具体配置方面,该眼镜的重量仅为 45 克,比其他竞品都轻一点。搭载 16MP 超广角摄像头,支持 AI 防抖算法。标称待机续航 56 小时,支持超 5 小时连续聆听,可 30 分钟充满电。搭载四麦克风阵列识别声音,采用开放式防漏音扬声器设计。
11月12日,阿里云通义团队对外宣布,开源最新版本的代码生成模型 Qwen2.5-Coder 系列。
这一系列包括 0.5B、1.5B、3B、7B、14B 和 32B 共 6 种不同尺寸的模型,每个尺寸都提供了 Base 和 Instruct 两种模型,以适应不同的应用场景和需求。这些模型在代码生成、推理和修复等核心任务上展现出业界领先的性能。
其中,32B 尺寸的旗舰模型 Qwen2.5-Coder-32B-Instruct 在多个代码生成基准评测中刷新了开源模型的记录,并在某些方面超越了闭源模型 GPT-4o,实现了开源模型对闭源模型的反超。
Qwen2.5-Coder 基于 Qwen2.5 基础大模型训练而来,通过大量数据投喂,显著提升了 AI 编程的性能和效率,即便是编程初学者也能够轻松创建自己的网站、数据图表、个人简历和小型游戏等复杂的应用开发工作。
当地时间11月10日,在解散近 50 年后,披头士乐队凭借人工智能技术的力量,再次获得了“音乐节的奥斯卡”格莱美奖的提名。
该乐队在去年通过AI修复技术,成功复刻歌曲《Now And Then》并入围了年度最佳唱片奖(Record of the Year)的角逐。该曲将与碧昂斯的《Texas Hold 'Em》,萨布丽娜·卡彭特的《Espresso》,Charli XCX 的《360》,Billie Eilish 的《Birds of a Father》,肯德里克·拉玛的《Not Like Us》,查佩尔·罗恩的《Good Luck, Babe!》,以及泰勒·斯威夫特联合Post Malone创作的《Fortnight》等歌曲展开竞争。
除此之外,《Now And Then》还获得了最佳摇滚乐表演奖(Best Rock Performance)的提名,与黑键乐队的《Beautiful People (Stay High)》,绿日乐队 的《The American Dream Is Killing Me》,IDLES 乐队的《Gift Horse》,珍珠果酱乐队 (Pearl Jam) 的《Dark Matter》以及圣文森特的《Broken Man》共同角逐这一奖项。
据了解,《Now And Then》由已于 1980 年去世的乐队主唱约翰·列侬创作,并使用了其 1970 年录制的原始人声,并通过人工智能技术进行了修复和增强。