Riffusion 是一款稳定扩散的实时音乐和音频生成库,完全免费且开源。用户只需提供音乐描述,AI即可生成相应风格的音乐。该项目是由Seth Forsgren 和 Hayk Martiros共同推出的。Riffusion 的工作原理基于 Stable Diffusion 模型,这是一个文本生成图像模型。通过微调频谱图,Riffusion 可以将频谱图像转换为高保真度的音频,频谱图是音频的视觉表示,展示了不同频率随时间的振幅。