【新智元导读】以后的爆款歌曲可能要被AI承包了!最近,AI初创公司Suno震撼推出V3音乐生成模型,惊艳了全世界。只需几秒,即可生成2分钟动听的音频。网友纷纷表示:音乐的ChatGPT时刻来临!
最近,AI初创公司Suno AI重磅推出了第一款可制作「广播级」的音乐生成模型——V3,一时间在网上掀起轩然大波。
为了激发人们的创作灵感,Suno v3还新增了更丰富的音乐风格和流派选项,比如古典音乐、爵士乐、Hiphop、电子等新潮曲风。
在Suno主页中,有一个AI生成歌曲的排行榜,其中排名第一的是C-A-P-Y-B-A-R-A、第二首是Cyberpunk Starter,第三首是中文版的「水调歌头」。
有人表示,「简直离了大谱!Suno AI V3的效果感觉秒杀一唱作歌手了,以后还会有原创吗」?
而此前,就连好莱坞大导Tyler Perry直言,自己在看完Sora制作的视频后,直接搁置了自己影视工作室8亿美元的扩建计划!
国外网友做了一个AI工具大联动,Midjourney生图、Runway让其动起来,最后再让Suno配乐。
开发者Leeoxiang用「将近酒」生成了一首歌,并感慨道,「要是有这么好听的《将近酒》小时候背唐诗就不会这么痛苦了」。
Perplexity AI的首席执行官表示,这是下一个AI独角兽。持怀疑态度的人会说这是个加油站。客观事实是惊人的迭代速度、声音和音质,以及看到我自己越来越多地使用Suno而不是Spotify的习惯。
网友Yangyi总结了Suno从9月30秒音频生成到现在的2分钟,半年的时间AI发生了翻天覆地的变化。
官方宣称,不少知名的艺术家已经在使用Suno了,但Suno的核心用户群依然还是没有任何音乐制作经验的普通人。
而且伴随着v3版本的推出,他们还发布了AI音乐水印系统,每段由平台生成的音乐都添加了人声无法识别的水印,从而在未来能够保护用户在Suno的创作,也能打击抄袭,防止将Suno产生的音乐进行滥用。
其中Shulman和Martin Camacho都是业余的音乐爱好者,在Kensho上班时他们就经常一起即兴演奏乐曲。
在Kensho工作期间,四人的主要任务是开发一种AI语音转录技术,用来转录上市公司的财报电话会议。
后来他们发现,在AI文生图和文本生成领域发生的变革,在音频领域好像没有引起什么波澜,于是他们想自己在这个方向做点事情。
一开始,他们做了个叫Bark的文本转语音程序。但当他们对早期Bark用户进行调查时,发现用户真正想要的是音乐生成工具。
Suno目前只有12名员工,不过现在他们正在扩大规模,在现有的临时办公位置上他们正在加盖办公室。
他是创始团队在Kensho时的机器学习团队主管,在创立Suno之前,他还是一名MIT斯隆管理学院的兼职讲师。
对于Suno,他希望以后,全世界有10亿人能通过它来制作自己的音乐。在他看来,现在能够制作音乐的人比想要消费音乐的人少太多了,这实在是一个非常不平衡的情况。
按照Shulman的说法,因为高质量音频的采样率通常为44khz或48Khz,这意味着「每秒48000个token」。
所以,在去年,即便是见证了大语言模型和文生图的爆发式增长,很多AI研究人员认为,对于声音领域,这样的产品的初现,也许还要好多年的时间。
Shulman说他们找到了很多新的方法和技巧才走到今天,未来他们还需要更多直观的方法让用户通过任何想要的方式来生成歌曲和音乐。
他和Shullman有着几乎一模一样的履历,也是哈佛大学的物理学博士博士毕业,曾经在Kensho和MIT斯隆管理学院任职。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。