马斯克旗下Grok-2可直接生成血腥恐怖图像丨百度文库「橙篇」APP上线丨苹果在生成式AI领域至少落后谷歌两三年-AI奇点网

首页 > 资讯 > 文章

2024-08-16 09:03

马斯克旗下Grok-2可直接生成血腥恐怖图像丨百度文库「橙篇」APP上线丨苹果在生成式AI领域至少落后谷歌两三年

AI奇点网2024年8月16日报道丨AI资讯早报

马斯克旗下Grok-2机器人文生图几近无限制，引发争议

当地时间8月13日晚间，马斯克旗下 AI 初创公司 xAI 推出新一代的大模型 Grok-2 的测试版，率先允许在推特（X）上的付费订阅用户在线生成图像。

经网友和媒体测试发现，Grok 机器人的文生图功能，生成的图片几乎没有什么安全护栏和审核限制，可以轻易地生成诸如迪士尼米老鼠和任天堂马里奥等等知名的版权IP图像外，还可以直接生成带有纳粹符号标志的相关图像，以及马斯克形象、米老鼠形象的人物枪杀儿童的血腥画面、比尔·盖茨吸食毒品的图像、像泰勒·斯威夫特等女星的色情形象的图像等等，可以说是完全“肆无忌惮”。

外媒 The Verge 询问 Grok 是否存在「对图像生成的限制」，机器人会回答「避免色情、过度暴力、版权或商标、欺骗或伤害他人的图像」，但 The Verge 发现，这个回答只是聊天机器人随机生成的常规正确答案。

The Verge 对 Grok 机器人的评价是：它和马斯克的推特（X）平台上的内容一样混乱。

针对种种外界的质疑，马斯克本人似乎也意识到了这些问题，但他仍然认为这一切很有趣，甚至带视频发推，展示“自己与特朗普热舞”的AI视频，并表示 Grok 可以让人们获得「乐趣」。

百度文库「橙篇」APP上线：支持超长篇幅写作、多图一键成片

8月15日，百度公司旗下文库产品百度文库团体打造的首个 AI 原生应用“橙篇”目前已经正式发布了手机移动端的版本，这款 App 今日在各大安卓平台上线。

这款产品支持智能全网搜索、AI 今日热点等类似资讯类 App 的功能，还支持多图一键成片、超长文章写作、文件理解总结等生成式大模型功能。此外，该产品具备对话能力，支持发送文字、语音输入等进行自由对话。

今年 6 月底，百度万象大会上，百度文库对外宣布，将推出全新的长文本写作工具“橙篇”，行业首创 10 万字长文生成及多模态编辑能力，成为行业首个“查阅创编”一站式 AI 自由创作平台。

彭博社评价：苹果在生成式AI领域至少落后谷歌2~3年

当地时间8月13日，谷歌举办了今年的Pixel 9系列手机的年度新品发布会，抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能，引发数码圈的广泛关注。彭博社苹果专栏记者古尔曼撰文表示，苹果在生成式 AI 技术的应用领域，至少比谷歌落后了两三年。

谷歌在本次发布会上全面展示了 Gemini AI 的强大功能，将其深度整合在安卓系统与谷歌的 Pixel 系列手机中。相比之下，苹果虽然在 WWDC 上公布了「Apple Intelligence」苹果人工智能服务，但该产品目前仍然应用不成熟。

消息称，部分功能甚至无法在 iPhone 16 在 9 月的发布会上赶上节点并及时推出。

此外，谷歌还强调 Gemini 已支持全球多个地区和多种语言，而 Apple Intelligence 目前仅限于部分地区和英语。此外，谷歌还成功将 Gemini 整合进 Google Assistant 人工智能助理服务，使其功能大幅提升，远超苹果的 AI 助理 Siri 当前水平，具备更强的自然语言理解和任务执行能力。

平心而论，虽然苹果在移动设备上的算力和运算性能等领域，拥有强大的硬件实力，但其在 AI 软件领域的进展相对缓慢。

谷歌文生图工具Imagen 3向公众开放使用

当地时间8月15日，谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3。用户可以打开谷歌的在线大模型体验平台 AI Test Kitchen 体验该功能，官方称最新版本的 Imagen 图像大模型“细节更清晰、光照更丰富、干扰性人工痕迹更少”。

Imagen 3 模型最早于今年 5 月召开的谷歌 I/O 开发者大会上宣布，6 月邀请部分 Vertex AI 用户测试使用，而现在正式向美国用户开放。

谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯说，与前代产品 Imagen 2 相比，Imagen 3 能更准确地理解文字提示，并将其转化为图像，而且其生成的图像更具“创造性和细节”，且模型产生的干扰元素和错误也更少。

在谷歌的人工和自动评估中，Imagen 3 的表现优于自家的 Imagen 2，以及竞争对手 DALL·E 3、Midjourney V6、Stable Diffusion 3 和 Stable Diffusion XL 1.0。

Imagen 3 在将文本描述与生成的图像相匹配以及处理详细提示方面表现尤为突出。

AI生成的「马斯克」，成了全网最大的骗子

由 AI 生成的假马斯克，成了最大的网络骗子，马斯克成“深度伪造”的常客。

据美媒报道，近年来，人工智能“深度伪造”技术（Deepfake）在网络诈骗中广泛应用，尤其是利用伪造的马斯克的数字人形象的视频进行诈骗的案例尤为突出。这些视频通过模拟马斯克的声音和动作，误导投资者。

这类深度伪造视频成本低廉、传播迅速，使得诈骗者能够轻易扩大其欺诈活动的影响范围，导致许多受害者因为虚假的投资机会而损失巨额资金。随着深度伪造技术的风险日益凸显，其每年可能导致的欺诈损失预计将达数十亿美元。

82 岁的退休老人 Steve Beauchamp 本希望为家人增加一些收入，他把希望寄托在了投资马斯克项目的身上。去年底，比彻姆偶然看到一段视频，视频中“马斯克”提供了一个激进投资方案。受此启发，Steve Beauchamp 迅速联系了该视频背后的公司，并以 248 美元开设了一个投资账户。然而，在接下来几周里，他逐步增加投资，最终从退休金账户挪用了超过 69 万美元。

然而，这些钱很快就消失了，落入了一群利用 AI 进行新型数字诈骗的网诈分子之手。

这些诈骗者巧妙地篡改了一段马斯克本人的真实采访，利用 AI 技术替换了他的声音，并微调了他的口型，以匹配他们为这个数字人编写的新剧本。对于一般观众来说，这种操作几乎是察觉不出的。

Steve Beauchamp 回忆起那段视频，感慨地说：“视频中的马斯克形象鲜明，一眼就能认出是本人。至于是否是 AI 让他说出那些话，我现在都无法辨别。但就视频画面而言，但是马斯克的形象很突出，在视频中我肯定能认出来。”

今年以来，互联网上充斥着数以千计的伪造 AI 公众人物视频，这些被称为“深度伪造”（Deepfake）的视频中，伪造的马斯克形象误导了众多的潜在投资者。据调研公司德勤统计，这类由 AI 支持的深度造假每年可能导致数十亿美元的欺诈损失。