用Veo 3+Suno做了个AI Rapper,吊打音乐节上的流量明星
机器之心报道
编辑:杨文
太疯狂了!AI生成的嘻哈歌手唱Rap以假乱真,网友直呼「看不出破绽」。
来来来,眼尖的朋友请告诉我,下面这个嘻哈歌手唱 rap 的视频到底是真实的,还是 AI 生成的?
我可以 100% 肯定地说,此为 AI 的手笔。你猜对了吗?
三天前,X 博主 @blizaine 使用 Google Flow Veo3 和 Suno 4.5 制作了这一视频。画面和开场声音是 Veo3 生成的,歌曲和歌词则用 了 Suno 4.5。
由于效果过于逼真,网友直呼「太疯狂」,甚至还让摇滚老炮回想起了当年的舞台时光。
看样子,Veo 3 刚揭开流量明星的遮羞布,这下子又要让歌手瑟瑟发抖了。
循着这个方向在 X 上逛了一圈,发现不少网友热衷于用 Veo 3 生成演唱会视频,而且一个比一个自然。
比如这个另类摇滚迷幻乐队在一家小酒吧的演出片段。主唱站在麦克风前,边弹吉他边演唱成名曲中的副歌部分,情绪饱满但不激烈;贝斯手、吉他手和鼓手沉醉其中,身体随节奏摇摆着,几乎找不出什么 bug。
Prompt: Mid 90s footage of an alternative rock shoegaze band playing in a small dive bar. The band consists of a lead singer guitarist, a bassist, a drummer, and another guitarist. They are singing the soaring chorus of their biggest hit.
再比如,下面这个妆容怪诞的钢琴家演奏动作自然流畅,手指与琴键接触的力度、节奏与画面中的旋律同步,口型也对得严丝合缝。身后交响乐团不同乐器组的演奏姿态各具特色,指挥家起伏的手势也不机械重复。
更妙的是,Veo 3 还能找准时机切换镜头,细节之丰富几可乱真。
Prompt: Early 2000s footage of an australian goth pianist making a whimsical song about God in front of an orchestra.
还有这个混乱的摇滚音乐会,三名乐队成员完全失控:主唱挥舞着鼓槌冲着观众嘶吼,吉他手头发凌乱猛拨琴弦,身后的鼓手则疯狂击打鼓面。唯一的瑕疵就是那莫名飞起的镲,说实话有点出戏。
Prompt:A chaotic grunge rock concert circa 1995 captured on an old VHS camcorder from someone in the audience. The band members are acting erratically, throwing guitars and smashing drums.
接下来,我们也来复刻一个,看看 AI 能否拯救犹如一潭死水的华语乐坛。
这第一步就是生成音乐。
前段时间一个名为「梁正尚能饭」的博主火了。他凭借「粤语 + 古诗 + 摇滚」的独特风格,创作出《将进酒》《木兰辞》《王维说》《春归何处》等音乐作品,在各大平台播放量超百万。
视频来自博主「梁正尚能饭」
我们就用 Suno3.5 和豆包尝试一下。
Suno 算是资深的 AI 音乐生成模型,当初一问世就被外界称为「音乐界的 ChatGPT」,经过一年多的技术迭代,Suno 已更新至 4.5 版本。
那么我们为何选择 Suno3.5 而不是最新的 4.5 版本?原因只有一个:抠。4.5 版本要花钱升级会员,3.5 版本可免费体验,只需点击「Create」,上传歌词输入风格,它就能秒出 2 首歌。
Suno 版的《木兰辞》有嘻哈那个味了,不过咬字会在粤语和普通话之间来回横跳,女声吟唱部分还会掺杂明显的电音,听起来不是很自然。
与 Suno 的专精不同,豆包就像一个啥都能装的菜篮子,涵盖 AI 搜索、视频生成、音乐生成、AI 编程等 15 项功能。它的音乐生成功能可直接套模版,或让 AI 自动写歌词,或自己输入歌词,再选择音乐风格、情绪、音色即可。
相比于 Suno,豆包的咬字更清晰,尤其是「鞍鞯」、「辔头」等生僻字,豆包都能读准,但旋律相对来说比较单一。
豆包还有一个优势,就是可以直接通过对话的方式,让它润色歌词以更好地配合嘻哈音乐风格。
经过改编后的《木兰辞》听起来就顺耳多了:
第二步就是用 Flow 中的 Veo3 生成画面和开场白。
Flow 是谷歌打造的一站式 AI 电影制作平台,用户可以通过输入文本提示或上传图像,让 Flow 生成完整的电影场景或短片,同时它内置一整套视频制作工具,包括摄像机控制、场景构建器和素材管理器等。
Flow 链接:https://labs.google/flow/about
要想生成以假乱真的演唱会效果,提示词是关键。经过多次调试,我们搞了个像样的:
A high-energy hip-hop concert scene. A stunningly handsome Chinese hip-hop artist, early 20s, wearing a stylish streetwear outfit — oversized jacket, graphic tee, chunky sneakers, silver chains, and a snapback cap. He has sharp facial features, confident expression, and a charismatic stage presence. The confident Chinese hip-hop artist stands center stage , holding a microphone. As the intro music plays, he looks directly into the camera and says, "What's up, everyone? Long time no see, haha." The camera then pans smoothly from the rapper to the excited audience — people are cheering, waving their hands, and jumping to the beat. Then the camera moves behind the rapper as he turns to face the crowd and begins his rap performance. The atmosphere is electric, with lights flashing and the crowd fully engaged.
来看看实际生成效果:
由于 flow 每次只能生成 8 秒视频,要想延长时长,只需点击「Add to scene」,选择「Extending」,再输入提示词:The hip-hop artist is facing the audience while rapping, with their back to the camera, and the crowd is waving and dancing to the rhythm.
多次重复此操作,就能得到一段自然流畅的嘻哈歌手演唱会视频。
最后,再用剪映将视频和音乐片段拼合在一起,大功告成!
上最终视频效果:
感兴趣的朋友也去试试吧!
网址:用Veo 3+Suno做了个AI Rapper,吊打音乐节上的流量明星 https://m.mxgxt.com/news/view/1431905
相关内容
我们用 Suno AI 写歌并制作 MV,半小时打造个人单曲AI音乐半年观(上)
Veo
音乐风暴袭来!国内首位AI说唱歌手「柒月」Suno AI单曲惊喜首发
人人都能用AI做音乐,但不是人人都能靠AI音乐赚到钱
虚拟歌手「柒月」首张Suno AI单曲上线,携手MULT打造全新皮肤
更精准的用 Suno 模仿指定曲子,这个音乐分析工具或许能帮
AI分析音乐旋律节奏和歌词
国产AI音乐大模型的“三足鼎立”
国产AI再次“封神”!Mureka拿下全球AI音乐顶流宝座