首页  >  资讯  >  文章
2023-10-20 09:08

首个AI中文模型产品测评基准SuperCLUE发布丨DALL·E 3上线ChatGPT丨Midjourney发布动漫生成APP

AI奇点网2023年10月20日报道丨AI资讯早报

斯坦福大学推出大模型透明度测评:GPT-4仅排第三

今天,斯坦福大学基础模型研究中心(CRFM)联合斯坦福以人为本AI研究所(HAI)、麻省理工学院媒体实验室、普林斯顿大学信息技术中心共同发布了2023基础模型透明度指数(Foundation Model Transparency Index,FMTI),并对10个主流基础模型进行了透明度评级。

评级结果表明,即使是得分最高的Meta Llama2也仅在满分100分中获得54分,OpenAI的GPT-4获得48分,排名第三。10个基础模型的平均得分仅为37分。

Midjourney发布动漫风格AI绘图生成器Niji-Journey APP

当地时间10月16日,Midjourney创始人David Holz介绍称,Midjourney与日本游戏公司Sizigi Studios的工程师合作发行了一款Android和iOS应用Niji-Journey,主要提供使用Midjourney动漫风格设置的图像。

该应用程序需要付费才能使用,支持20次免费试用,全年一次性支付96美元,或者每月支付10美元。现有的Midjourney用户可以使用他们的Discord凭据登录,而无需支付更多费用。

首个AI中文模型产品测评基准SuperCLUE发布

据CLUE中文语言理解测评基准评委会发文称,中文通用大模型综合性测评基准(SuperCLUE)宣布推出面向AI智能产品的中文测评基准服务SuperCLUE-Agent。这是一个聚焦于Agent能力的多维度基准测试,包括3大核心能力、10大基础任务,可以用于评估大语言模型在核心Agent能力上的表现,包括工具使用、任务规划和长短期记忆能力。

经过针对16款支持中文的大语言模型的测评,SuperCLUE发现:在Agent的核心基础能力中文任务上,GPT-4模型大幅领先;同时,代表性国内模型,包括开源和闭源模型,已经较为接近GPT-3.5水平。

测评体系、代表性示例、榜单地址:

www.cluebenchmarks.com/superclue_agent.html

https://github.com/CLUEbenchmark/SuperCLUE-Agent

OpenAI在ChatGPT全面接入DALL·E 3绘图模型

OpenAI当地时间本周四宣布,将向 ChatGPT Plus 和企业版客户推出DALL·E 3的服务,并且直接在ChatGPT聊天对话窗口即可完成图像生成。

DALL·E 3 在9月底首次发布,OpenAI 展示了新版本在 DALL·E 2 的基础上如何进行改进。用户在ChatGPT内直接输入任意长度的文字描述,从一句话到一段话都可以,用于描述他们想要的图像生成作品,然后 DALL·E 3 就会在几秒钟内生成图片。

图片

OpenAI 本周早些时候还宣布,ChatGPT联网通信功能也正式上线,所有 Plus 和企业订阅用户都可以正式使用微软 Bing 搜索进行互联网通信浏览。

OpenAI CEO:不会参与智能手机行业竞争

AI奇点网从外媒Business Insider获悉,OpenAI CEO奥特曼在最近《华尔街日报》举办的一次活动上表示:“我没有兴趣尝试与智能手机竞争——它的功能非常出色。”

奥特曼被曝光正与前苹果设计师Jony Ive共同推出一项OpenAI的新产品,但是他拒绝透露产品的形态。奥特曼表示,现在还只是模糊的初步想法。不过他确定OpenAI不会推出智能手机,并且认为,AI并不会挑战目前的手机行业格局。

稍早的时候,英国《金融时报》曾爆料称,OpenAI正与苹果前设计师Jony Ive、日本软银进行接触,拟成立一家合资企业打造“AI领域的iPhone产品”。

10
查看相关话题: #OpenAI #chatgpt #GPT-4 #DALL·E 3

相关文章