Suno写歌:AI制造的“喧哗与骚动”

青岛日报 2024年04月08日

  □青岛日报/观海新闻记者 米荆玉

  忽如一夜春风来,人人都是周杰伦。

  3月底至4月初,Suno、Stable audio、天工等国内外多款“AI写歌神器”相继上新、升级。尤其Suno V3发布后,朋友圈纷纷晒出个人创作的单曲,从职业歌手、乐评人到不识五线谱的普通人,大家写歌的热情集体点燃。歌手小柯使用AI重写了《因为爱情》,而搞笑者将连花清瘟胶囊说明书投喂给Suno,创作的新歌歌词不知所云、旋律差强人意。相较于新媒体平台上的口水歌、神曲,Suno给了普通人写歌的机会,将自己的创作摔在当红歌手的脸上。

  相较于之前引发轰动的ChatGPT、Sora等AI工具,Suno V3的操作性更加简单,而且,视听效果更加直接:最快4秒钟,Suno就能为使用者生成两首歌。从文字处理、视频生成到音乐制作,人工智能的跃升制造了一波又一波话题:我们已经看到Suno能做什么,也大致了解它的当下技术水准。问题是,Suno会给音乐行业带来哪些冲击?它的终极目的又是什么?为此,我们采访了歌手、音乐人、音乐公司创始人和人工智能使用者,尝试寻找隐藏在热闹背后的终极思考。

  AI创作,瞬间实现

  4月1日,著名音乐人杨樾创作了一首纪念张国荣主题粤语歌《三七二一》。相较于当天众多歌迷的自创单曲,这首歌引出了一个问题:大家都是用同一款AI工具,写同一主题的歌曲,旋律看似随机生成。

  为什么这首歌比其他作品听觉上更加出众?

  《三七二一》花了杨樾一小时写歌、修改,7个小时制作MV。杨樾表示:“Suno V3允许创作者确定风格和氛围,比如说,这首歌是流行曲风或者重金属,懂音乐的人会对风格更加细分。我写这首歌时先限定了粤语,氛围是悲伤的,歌词创作非常重要。很多人的歌词与音乐风格不匹配,基本上是硬搭。我明确知道要写一首粤语流行歌,歌词不要太高雅,符合谭咏麟、梅艳芳时期的风格,而且要注意歌词里的粤语发音。Suno理解了上世纪90年代香港经典流行音乐风格,写出来也确实是那个味道。这首歌如果写成说唱、重金属会非常难听。”

  作为音乐圈最早使用AI创作的探索者之一,杨樾认为,创作者的审美决定了音乐AI作品的上限。“你得知道什么音乐更好听,这其实是一个特别高的门槛。这首歌我一共生成了6个版本,不是每个版本都好听。我所在的AI创作者群里,一些IT从业者屡屡发布AI音乐作品,但他们缺乏基本的音乐审美,认可的很多作品实际上太普通了。”

  毋庸讳言,Suno V3的出现大大降低了写歌门槛。它的界面清晰简明:使用者上传歌词后,只需要选择器乐、曲风,它就能一次生成两首歌曲备选,每首两分钟。刚上线时,这个过程大约40秒,如今已经缩短至4秒左右,如此神速让普通人产生“写歌不过如此”的错觉。付费版Suno每个月可以产出2000首歌,这超越了绝大多数专业歌手的终生创作量。

  AI工具让写歌变得如同探囊取物,专业音乐人对人工智能的反应大相径庭。民谣歌手蒋明正在忙于新专辑的制作。他自认为是AI科技的坚定相信者,然而,目前Suno的水准并未达标,“电脑工程师成为第一批用AI写歌的人,目前写出来的歌大多数是套路。比如说,我现在输入一段歌词,限定民谣、摇滚、流行等曲风,生成的旋律走向和律动全都是套路,短视频平台拉低了当下的音乐水准,拉低到了功能化、自动化、机械化的层面,AI写歌正好达到了模拟无脑人类的初步形态。”

  十三月唱片老板、“民谣在路上”创始人卢中强以“恐惧”来形容自己对AI写歌的反应,“我的弟弟是高校的声学专家,他一直在给我补充AI领域的知识。国内之前曾推出过类似的软件,然而,Suno是一个变革型产品,它的应用范围和创作质量对行业影响力太大了。比如说,音乐行业里背景音乐创作、游戏音乐和部分要求没那么高的影视音乐都会被AI取代。尤其华语音乐的同质化特别高,整个创作和制作门槛不高,一年几千万首歌上线,Suno能秒杀当下99%的音乐产品。”

  剖开Suno,探寻“灵魂”

  一键写歌,Suno是如何做到的?

  目前披露的资料显示,Suno的运行基于模拟人声、模拟音乐旋律、自动语音识别三个大模型,采用广泛上下文的真实音频训练,音频分解、重构后产生丝滑效果。从另一个侧面看,如果给予的音频样本不够,Suno也无法做出令人信服的作品。卢中强介绍,在民族音乐、古典音乐以及情感表达程式复杂的戏曲音乐等领域,Suno现阶段还处在“小白”阶段,“然而,随着人工智能通过迁移学习法加速学习,个性化的音乐迟早也会被Suno攻陷。”

  赢风音乐创始人苟瀚中同样在持续关注Suno的进化。“小柯刚刚发布了《因为爱情》的Suno版本,AI工具给出了两个版本,你会发现:首先,AI分不清段落,不会按照文字段落分配旋律;其次,它在旋律方面没有起承转合,旋律性比较平稳,不像是一首标准的歌曲。可以说,AI还处在学习阶段。”苟瀚中认为,“理论上能做到”与“现实中能实现”是两回事,“在不重复的前提下,人类能写的八小节旋律总共有13的64次方,理论上可以通过AI写完所有的旋律,以后,全世界无论谁写歌都属于侵权,因为已经被AI抢先写完了——这种事可能吗?”

  杨樾被圈内公认为最擅长将人工智能与艺术创作结合的音乐人;他最早一首AI创作单曲《Digital Dawn》3月底出炉,这首重金属单曲集齐了当下主流AI工具:歌词由ChatGPT创作,作曲编曲演奏演唱由Suno生成,底图用著名AI绘图工具Midjourney创作,MV是用AI视频生成引擎Kaiber完成。杨樾在单曲完成的一瞬间有些失落,“我突然第一次感觉到,一部分音乐人真的是要丢掉工作了。还有一些在吃老本的老音乐人也是,以后没有老本可吃了。”不到半个月,新兴音乐人已经开始沿用杨樾的模式进行创作,顶多在动画MV的拍摄时采用Runway或Pika。

  在自己的新专辑里,蒋明尝试将一部分工作交给AI完成。“我的新歌文案写起来太矫情,就用AI写了一天文案,然而,它把我们灌输的词汇不停地排练中,出来的文案没有灵魂,深入不下去,没有人类的深层次情感。”在蒋明的视野内,已经有先行者利用AI赚取儿童音乐教育的红利了,“他们用了自己训练的AI系统,输入关键词就能马上生成歌词、谱子跟和弦,小朋友自己就能写歌了——家长要求不高,歌曲朗朗上口就行。”

  话剧导演谭浩介绍,在沪上音乐剧创作大赛中,组委会已经明确提出“需注明旋律是否由AI创作”的要求,可见AI对音乐创作的侵蚀已经愈加深入。4月4日发布的Stable audio 2.0版将音乐生成的时长提升到3分钟,音乐风格涵盖了摇滚、爵士、电子、流行、乡村音乐等二十多种,显然要跟Suno一争短长,对于借用人工智能创作的音乐人来说更是如虎添翼。杨樾总结,当下音乐圈对AI写歌工具分为四种人:“第一类人完全蔑视、完全拒绝;第二类人有点茫然,不拒绝也没行动,继续观望,这也是大多数人的态度;第三类人非常兴奋,试探性地接触,积极拥抱,提出了各种合作方式,希望把AI作品当作Demo或者当作素材;第四种人也是我高度怀疑的一类人,他们已经用AI创作,但嘴上不说也不承认。你会突然发现他们的创作有很大的长进 ,创作数量猛增,显得创作力特别旺盛。”

  实际上,第一类人的抗拒态度已经落实为行动:超过200名国际音乐人向AI开发者发出警告,抗议未经允许使用音乐家的作品来进行大规模训练,通过制作AI“模仿品”、AI“声音”来稀释版税池。著名作曲家董颖达也认为,AI音乐的商业化需要管束,“AI音乐不是电脑作曲,它不是凭空来的,是建立在所有创作人作品上的重新建模,而这些被引用的内容是别人的,谁授权的这个权利?授权给了谁?”随着AI生成音乐深入发展,它迟早会跟AI生成文字、AI生成视频遇到同样的成长烦恼。

  大势袭来,何以自处

  Suno大势袭来,音乐人如何应对?

  苟瀚中近年来忙于通过视频平台推广音乐新人、音乐作品。在他看来,AI音乐工具的应用空间非常广阔,“它很可能应用于声音采样的工作,就像汽车导航用林志玲的声音采样一样。像是周深、那英等声音非常有特色的歌手找音乐人写歌,以往是音乐人写完了之后把Demo发给歌手,现在有了AI,可以用AI采样歌手的声音来演唱,这样歌手就能直观感受到这首歌演绎的细节和感受。另一方面,普通人可以用AI写歌,然后用他喜欢的歌手演绎出来——挂上周杰伦的声音,就好像为周杰伦写歌一样荣耀。”

  杨樾也认为,现阶段Suno的能力不足以产生颠覆效应,“它还是一个工具,相当于一个录音棚里多了一个采样工具,多了一个效果器或者多了一个乐手。职业音乐人用AI写歌不是用来直接发表,而是把旋律和编曲扒出来,重新写一个版本,经过重新编曲后完成创作。”作为AI工具领域的“全才”,杨樾正在将音乐、视频的创作全面结合,“我从去年开始用AI做MV。不管是音乐人还是视频人,当下时代对于通才的要求越来越高,一个人要横跨多个领域的知识和技能才能展开工作。在剧本预览领域,AI可以用较低的成本将一部电影拍出‘预览版’,投资人可以大致判断这个片子的前景,在可视化剧本阶段就发现问题、提出意见。”

  在卢中强看来,背景音乐、游戏音乐、影视剧音乐将会受到Suno较大冲击,尤其是“洗歌”行业所受冲击更大。“洗歌工作室模式化生产热门歌曲,从歌词、旋律、和声与编曲全方位模仿,量产后在平台上跑流量,一旦出现热门单曲就加大投入,用高流量单曲换取版权收益,这种模式会被Suno打得溃不成军。对于个性化创作、经典化创作的音乐人来说,Suno现在的算法还达不到那么高的共情模式,冲击较小。”

  如此成功的AI生产音乐工具,需要耗费大量的算力维持,却以免费的方式邀请音乐人测试,Suno未来会通过版权来创造效益吗?杨樾认为,AI平台并不在意歌曲版权收益,而是致力于让尽可能多的人使用它、训练它。“Suno公司只有十几个人,使用音乐史上几百万首歌开展训练,这只是第一步。下一阶段是找人训练,训练越多,人性越强,它渴望十亿级的用户,这样它的进化速度就飞起来了。整体而言,AI一定朝着取代人类的方向发展,当AI具备了思想和自我提升、自我训练的能力后,它就是AGI(通用人工智能)了。”

  “人工智能的学习目的不是商业,人工智能就是未来的石油和金矿。”作为音乐人、制作人的卢中强,在Suno面前调整了未来的发展方向,“我们在音乐内容方面不激进了,我们做了很多内容,但变现太难了。目前,我们更多关注音乐文旅解决方案,做剧场、做音乐节,把凸显国潮民乐的‘新乐府’做好,毕竟‘新乐府’的制作内容、方法体系和方法论是Suno无法伤害的。”