苹果iOS 19将强化Siri语音交互功能丨谷歌为Gemini发布威胁言论表示道歉丨ChatGPT网页端上线高级语音模式
AI奇点网2024年11月25日报道丨AI资讯早报
据彭博社苹果专栏报道,苹果公司将在明年推出的 iOS 19 中大幅强化 Siri 与用户的互动能力。
报道指出,此次的升级将使 Siri 语音助手更接近于现在的 ChatGPT 的产品形态,让其能够无需通过第三方平台就能「处理更复杂的请求」。该功能最早要到 2026 年春季才会推出,这意味着该功能将作为 iOS 19.4 版本更新的一部分发布。
根据消息人士透露,苹果公司将在后续的大模型产品升级上依赖于内部自研的大语言模型,并在对 Siri 进行真正的改造方面取得了进展。该公司正在内部积极运行和测试这项新服务,内部将其称为「LLM Siri」。
另外,据 MacRumors 报道,在 iOS 18.4 中,Siri 将获得屏幕感知、更深入的每个应用程序控制以及一些其他增强功能,但它仍然不会直接提供成熟的类似 ChatGPT 的对话功能。
近日,据外媒报道称,美国密歇根州的大学生维德海·雷迪在使用Google的AI聊天机器人Gemini讨论社会老龄化问题时,Gemini AI突然发表了侮辱性和威胁性的言论,并声称该名用户是“社会的累赘”,并要求用户“请去死”。
Gemini用户维德海·雷迪和他的姐姐苏梅达·雷迪对AI的这种反应感到震惊和恐慌,并将聊天记录分享到了Reddit,引发了公众关注。
谷歌方面迅速对此事作出回应,表示Gemini AI配有安全过滤器以防止不当讨论,但是因为不可控的原因,承认这次的回答违反了AI回复护栏的规定,承诺采取措施避免未来发生类似情况。
该报道指出,大语言模型有时会提供不合理或不相关的回答,这是AI技术的一个普遍问题。AI的输出严重依赖于训练数据和提示词,如果训练数据中包含负面或极端内容,AI可能会复制这些内容。
尽管AI技术取得了进步,但它们仍然存在认知缺陷,无法真正理解语言的含义,只是模仿说话的样子。
当地时间11月20日,OpenAI 首席产品官 Kevin Weil 通过推特(X)平台发布消息,OpenAI 高级语音模式(Advanced Voice)将在本周内上线 ChatGPT 网页版,面向付费用户开启。
ChatGPT 高级语音模式此前仅限于移动客户端,依托最新的 GPT-4o 模型,具备原生音频处理能力,能够用自然语言与用户互动。它甚至可以感知语调和语速等非语言信号,在回应时模仿情绪,从而显得更加生动真实。
目前高级语音模式仅限于 ChatGPT Plus 订阅付费计划的用户,点击提示窗口右下角的语音图标,即可在网页版上启动高级语音模式。
11月22日,2024 年世界互联网大会乌镇峰会举行,在互联网企业家分论坛上,B站董事长陈睿以《兴趣是最好的老师》为主题发表演讲。
陈睿表示,B站形成了超过 7000 个兴趣圈层,不管多冷门的知识系统,多小众的兴趣爱好,都可以在B站找到同好,尤其是在 AI 方面更为领先。陈睿透露,B站作为「中国 AI 心智最强的社区」,每个月有超过 8000 万用户在站内观看相关内容。
截止2024 年当前,B站的 AIGC 相关内容的视频观看量突破 300 亿次,超九成的 AI 厂商都选择在B站和用户沟通。
当地时间11月23日,据《韩国先驱报》报道,OpenAI 正与三星洽谈合作,并希望在 Galaxy 手机中搭载多项 AI 功能,以拓展三星旗下产品的 AI 服务能力。
报道援引知情人士的话称,在双方的讨论中提及了 OpenAI 和苹果最近达成的一项协议,OpenAI 的技术为「苹果智能」Apple Intelligence 功能提供了支持,OpenAI 方面认为三星 Galaxy 系列手机也可以搭载该公司的生成式 AI 服务。
11月23日,英伟达创始人兼 CEO 黄仁勋作客香港科技大学,并被校方授予了工程学荣誉博士学位。
当天,他现身学位颁授典礼现场穿戴博士帽,并发表了重要的个人演讲,谈及了人工智能的变革和展望,以及对毕业生的寄语。
在学位颁发典礼上,黄仁勋还与校董会主席沈向洋展开了一场深刻对话。
黄仁勋提到,三种机器人有望实现大规模生产,而且几乎仅限于这三种,历史上出现过的其他类型的机器人都很难实现大规模量产。这三种机器人分别是:汽车,因为我们在过去 150 到 200 年间构建了一个适应汽车的世界;其次是无人机,因为天空几乎没有限制;当然,产量最大的将是人形机器人,因为我们为自己构建了一个世界。