Stability AI发布开源AI音频生成大模型Stable Audio Open：支持一句话生成鼓点、乐器等音效，需授权商用-AI奇点网

首页 > 资讯 > 文章

2024-06-07 11:53

Stability AI发布开源AI音频生成大模型Stable Audio Open：支持一句话生成鼓点、乐器等音效，需授权商用

AI奇点网6月7日报道丨当地时间6月5日，Stability AI 对外发布了 Stable Audio Open 1.0，这是其音频领域的新一款生成 AI 大模型。尽管Stability AI最近负面不断，但是该公司依然在推动新产品的推出，的确可圈可点。

Stable Audio Open 继续沿袭 Stability AI 一贯的开源路线，这是一款文本转音频模型，可生成长达47秒的样本和音效。用户可以创建鼓点、乐器重复乐段、环境声音、拟音和制作元素。该模型支持音频样本的音频变化和风格转换。

虽然 Stability AI 以稳定扩散文本到图像生成的 AI 绘画技术而闻名，但是他们的工程师发现，扩散模型可以应用在其他媒介形态的内容生成。

Stable Diffusion开发商Stability AI推出文本生成音频工具Stable Audio：根据提示词自动生成90秒音乐

Stability AI对外推出了一款全新的AIGC生成式工具：Stable Audio。该工具可以基于用户输入的文本内容提示词，自动生成对应风格的音乐、音频文件。

该公司在2023年首次推出了 Stable Audio，这是一种文本到音频的生成 AI 工具。最近发布的 Stable Audio 2.0 则提高了生成音频的清晰度和长度。

与完整版 Stable Audio 可用于生成长达 3 分钟的商用级音频不同，Stable Audio Open 的应用场景更为局限，只能生成较短的音效片段，而非完整的一首歌曲。

顾名思义，Stable Audio Open 听起来虽然是开源模型，但是它仍然需要获得 Stability AI 的非商业研究社区协议的授权许可。

Stability AI 音频研究主管 Zach Evans 表示：“我们推出 Stable Audio Open 的目标，是让音频研究人员和制作人能够亲身体验我们的生成音频模型之一，以加速这些令人难以置信的新工具的研究、采用和实际创造性使用。”

你可以在Hugging Face社区进行试玩：

查看相关话题： #Stability AI #AI音乐 #AI音频生成

一打杂的

作者已发布 423 篇文章

近期文章

OpenAI明年将推出计算机控制智能体Operator丨小米成立AI平台部，酝酿智能眼镜丨传闻苹果正在研发AI智能家居中控

李彦宏：文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布，搭载大模型边走边问

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

微软推出首个AI天气预报系统Aurora，比传统的数值天气预报模型快5000倍

网页产品设计工具Figma集成GPT-4o能力，支持一键全自动生成网页前端设计