Kimi上线探索版,单次精度500页丨快手推出Pyramid Flow开源文生视频模型丨特斯拉无人驾驶Cybercab惊艳亮相
通用人工智能创业公司——月之暗面当日正式发布可自主海量搜索解决复杂问题的Kimi探索版。Kimi 探索版具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。
Kimi探索版的搜索量是普通版的10倍,一次搜索即可精读超过500个页面。在内部性能评估测试中,Kimi的性能评估团队结合1000多个来自用户的真实长难问题,对比了国内外所有的主流AI助手和搜索类产品,包括付费和专业版本,Kimi探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少30%。
“如果Kimi搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。”Kimi探索版产品负责人表示。
Kimi 探索版已逐步分批上线 Web 端(kimi.ai),预计下周一前至全量用户。收到更新的用户,只需打开对话框左下角的「探索版」开关,或者直接在对话框中输入斜杠“ / ”,就可以唤醒 Kimi 探索版,让 Kimi 与你一起探索更复杂问题的答案。
为了确保更多人可以用起来,Kimi 探索版目前每人每天可以使用 5 次。除了网页版之外,Kimi 智能助手的手机APP也将在近期上线该功能。
由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。
Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。
Pyramid-Flow仅通过文本就能生成最多10秒、1280x768分辨率和24帧视频,在光影效果、运动动作一致性、视频质量、文本语义还原、色彩搭配等方面非常优秀,生成的视频很棒。
值得一提的是,Pyramid-Flow使用A100 GPU在开源数据集上仅训练了20.700小时,其能耗和生成效率比市面上同类开源视频模型好很多,对于没有大量算力的中小企业和个人开发者来说帮助很大。
附上 Pyramid Flow 的核心特点如下:
高效生成:Pyramid Flow 采用新技术,通过统一 AI 模型分阶段生成视频,大多数阶段为低分辨率,只有最后阶段为全分辨率。这种“金字塔流匹配”方法保持了视频的高视觉质量前提下,大幅降低了计算成本,tokens 数量是传统 diffusion 模型的四分之一。
快速推理:在推理过程中,该模型可以在 56 秒内生成一个 5 秒、384p 的视频,速度媲美许多全序列 diffusion 模型,甚至更快。
开源和商业使用:Pyramid-Flow 在 MIT 许可证下发布,允许广泛的使用,包括商业应用、修改和再分发,吸引了希望将模型集成到专有系统中的开发者和公司。