什么是 AI Stem Splitter
想象一下:你是一位音乐制作人,听到一首歌里的鼓 loop 特别带感,想把它用到自己的作品里,可试了好几个分离工具,出来的音轨总是带着人声残响,鼓点也糊成一团。或者你是个 DJ,在准备一场演出时急需一段干净的 acapella,翻遍全网也找不到合适的资源。又或者你只是个卡拉OK爱好者,想唱某首歌却怎么也找不到伴奏版本。
这些场景的共通痛点是什么?想从一首完整的歌曲里拿到干净的单个音轨,但市面上的工具要么质量差,要么操作复杂。
AI Stem Splitter 就是为解决这个问题而生的。它是一款基于 Web 的 AI 音频分离工具,不需要安装任何软件,打开浏览器上传歌曲,就能在 60 秒内将一首歌分成 6 个独立音轨:人声、鼓、贝斯、吉他、钢琴和 Other。背后的引擎是 Meta AI 开发的 htdemucs 混合变压器模型——这个模型在 2022 年 Sony Music Demixing Challenge 中拿下了冠军,是目前学术界和工业界公认最先进的音源分离模型之一。
换句话说,你用的技术和顶级录音室、研究机构用的是同一个。
- 一键分离 6 个独立音轨(人声、鼓、贝斯、吉他、钢琴、Other),远超大多数免费工具的 4 轨限制
- 基于 Meta AI 的 htdemucs 冠军模型,学术级分离质量
- GPU 加速,处理速度 < 60 秒,比实时播放还快
- 注册即送 10 分钟免费额度,无需信用卡
- 支持 YouTube、SoundCloud、Bandcamp URL 直接处理,省去下载步骤
AI Stem Splitter 的核心能力
了解产品能做什么很简单,但更重要的是——这些功能对你的创作流程意味着什么? 下面我们用「您可以用它来…」的方式,看看每个能力在实际工作中的应用价值。
AI 六轨分离
您可以用它来从任何歌曲中提取干净的鼓 loop、贝斯线、吉他 riff 或钢琴和弦,然后直接拖入 DAW 进行 remix 或采样创作。
大多数免费工具只能分离出人声、鼓、贝斯和 Other 这 4 轨,而你需要的钢琴或吉他往往被混在 Other 里,质量大打折扣。AI Stem Splitter 的 6 轨分离不仅多出吉他和钢琴两条轨道,而且每条轨道的分离质量都更高——人声频率更干净,鼓和贝斯之间的串扰也更少。
AI 人声移除与卡拉OK制作
您可以用它来一键生成任意歌曲的卡拉OK伴奏,或者提取出干净的纯人声用于 remix。
无论是歌手想练习新歌、DJ 需要 acapella 做 mashup,还是内容创作者想为视频配背景音乐,这个功能都能在几十秒内完成。分离质量串扰极低,出来的伴奏几乎听不到人声残影。
YouTube/SoundCloud URL 处理
您可以用它来直接粘贴 YouTube、SoundCloud 或 Bandcamp 的链接,自动抓取音频进行分离,完全不用先下载再转换。
这个功能可以节省大量时间,尤其适合快速试听和处理在线音乐源。最长支持 30 分钟的音频,覆盖绝大多数歌曲和混音带。
BPM & 调性检测
您可以用它来在上传歌曲的同时自动获取它的 BPM 和音乐调性,并附带 Camelot 谐波混音标记(1A-12B),一键就能复制到你的 DAW 里。
对于 DJ 来说,这意味着从上传到知道怎么混音,只需要几秒钟。不再需要手动分析每首歌的调性,省下的时间可以用在真正重要的创意编排上。
波形预览与试听
您可以用它来在下载之前先在线试听每个分离轨道的效果,支持静音、独奏和多轨波形同步滚动。
想确认人声轨够不够干净?想听鼓轨的低频表现?直接在浏览器里点一下就行。确认满意再下载,避免浪费积分反复处理。
极速处理与多格式导出
您可以用它来以最快速度完成音频分离——GPU 加速让大部分歌曲的处理时间控制在 60 秒以内。上传支持 MP3、WAV、FLAC、M4A、AAC、OGG、WEBM 七种格式,最大 50MB;下载可选 WAV(无损母带级)、MP3(紧凑)、FLAC(录音室级),适配不同使用场景。
谁在使用 AI Stem Splitter
不是每个人都需要全部的 6 轨分离能力。看看下面这些场景,哪一个更像你的日常?
场景 1:音乐制作人提取采样
假如您是音乐制作人,正在制作一首新的 beat,脑海中有一个来自某首歌的鼓 loop 或贝斯线,但市面上找不到干净的采样包。
AI Stem Splitter 帮您做的事很简单:上传歌曲 → 模型自动分离 6 轨 → 预览试听确认质量 → 下载需要的单轨音频 → 直接拖入 Ableton Live 或 FL Studio。整个过程不到两分钟,你就可以拿到录音室级的干净音轨,用于 remix、采样和再创作。
如果你只需要检测 BPM 和调性,使用 Key Finder 的文件模式即可——这个分析在浏览器端本地完成,音频文件不会上传到任何服务器,完全不用担心隐私问题。
场景 2:DJ 制作 mashup 与 acapella
当您的团队需要准备一场演出,需要快速拿到不同歌曲的纯人声轨来做 mashup,但找不到现成的 acapella 资源。
上传歌曲或粘贴 YouTube 链接 → 提取纯人声轨 → 使用 DJ Mode 的 Camelot 标记进行谐波混音 → 一键导出 Rekordbox XML 直接导入 DJ 设备。从想法到演出就绪,只需要几分钟。
场景 3:卡拉OK爱好者制作伴奏
假如您是卡拉OK爱好者,每次去 KTV 都发现想唱的歌没有伴奏版本,或者网上找的伴奏质量太差。
上传原曲 → 一键 AI 人声移除 → 下载无人声伴奏。免费赠送的 10 分钟额度就能处理大约 2-3 首完整歌曲,足够你先把近期想唱的歌都准备好。而且积分永不过期,不用担心用不完浪费。
场景 4:音乐教学与练习
当您的团队需要帮助学生学习一首新歌,但学生总听不清贝斯线或者吉他 solo 的具体细节。
分离出吉他或贝斯轨让学生单独播放练习,或者静音鼓轨让学生配合伴奏自由 jam。逐轨学习的方式可以大幅提升练习效率——学生可以先把注意力集中在最难的段落上,再慢慢合入其他轨道。
快速开始
AI Stem Splitter 的上手体验,可能比你想象的还要简单:
第一步:注册账号
访问 AI Stem Splitter 官网,注册账号。完成后,系统会自动赠送 10 分钟免费处理额度,大约相当于 2-3 首完整歌曲。整个过程不需要绑定信用卡,零门槛开始使用。
免费赠送的 10 分钟额度永不过期。你可以今天用 2 分钟处理一首歌试水,剩下的额度留着下个月再用,完全不用担心浪费。
第二步:上传或粘贴链接
你两种方式可以选择:
- 上传文件:支持 MP3、WAV、FLAC、M4A、AAC、OGG、WEBM 格式,文件最大 50MB
- 粘贴 URL:直接粘贴 YouTube、SoundCloud 或 Bandcamp 的链接,系统会自动抓取音频,最长支持 30 分钟的音轨
第三步:一键分离
点击分离按钮,htdemucs 模型会在 60 秒内完成处理。你可以在浏览器内直接预览和试听每个分离轨道的效果——支持静音、独奏、波形同步滚动,确认质量满意后再下载。
第四步:下载导出
下载格式有三种选择:
- WAV:无损母带级,适合导入 DAW 做专业编辑
- MP3:紧凑格式,适合日常使用或导入剪辑工具
- FLAC:录音室级压缩格式,音质与 WAV 相当但体积更小
别忘了免费工具
不需要注册也能使用的免费工具值得一试:
- Key Finder:检测 BPM 和调性,附带 Camelot 标记,文件模式在浏览器本地运行,音频不上传服务器
- Pitch Changer:调整音高(-12 到 +12 半音),保持速度不变,适合歌手调整翻唱调性
- TikTok Voice Generator:支持 41 种声音、7 种语言,免费版限制 300 字符,适合短视频配音
AI Stem Splitter 的定价方案
我们相信 用多少付多少,不该被订阅绑死。AI Stem Splitter 采用按用量付费的分钟包模式,积分永不过期,你不需要每月担心要不要续费。
免费试用
| 额度 | 说明 |
|---|---|
| 10 分钟(≈ 3 首歌曲) | 注册即送,无需信用卡,积分永不过期 |
先免费试几首歌,感受一下分离质量,再决定是否购买分钟包。
按量付费分钟包
| 额度 | 价格 | 单价 | 适合人群 |
|---|---|---|---|
| 50 分钟(≈ 16 首) | $6.99 | $0.14/分钟 | 偶尔分离几首歌练手或娱乐 |
| 150 分钟(≈ 50 首) | $15 | $0.10/分钟 | 定期使用的创作人,性价比最优 🏆 最受欢迎 |
| 500 分钟(≈ 166 首) | $39.99 | $0.08/分钟 | 高频使用的专业用户,每周都有分离需求 |
我们建议:如果你只是偶尔做一两首卡拉OK伴奏,50 分钟包就够了;如果是经常做 remix 的制作人或每周有演出准备的 DJ,150 分钟包是最划算的选择;如果你是每天都要处理音频的专业用户,500 分钟包的单分钟成本最低。
计费方式说明
- 按音频实际时长(秒)计费,不浪费一分钱
- 积分永不过期,用不完的额度放着也不会消失
- 处理失败的作业会自动退款(退回 credits)
- Key Finder、Pitch Changer、TikTok Voice Generator 等免费工具无需消耗积分
常见问题
AI Stem Splitter 是否免费?
有 10 分钟免费处理额度(约 2-3 首完整歌曲),注册即送,无需信用卡。免费额度永不过期。之后可以选择购买分钟包($6.99/50 分钟起)。Key Finder、Pitch Changer、TikTok Voice Generator 等工具完全免费,无需消耗积分。
能分离出哪些音轨?
6 个独立音轨:人声(Vocals)、鼓(Drums)、贝斯(Bass)、吉他(Guitar)、钢琴(Piano)和其他(Other)。大多数同类免费工具仅支持 4 轨分离,而且多出的吉他和钢琴轨道分离质量很高,不会混在 Other 里糊在一起。
处理需要多长时间?
大部分歌曲在 60 秒以内完成处理。得益于 GPU 加速,处理速度比实时播放还快——一首 4 分钟的歌曲通常只需要 30-50 秒就能完成 6 轨全部分离。
支持哪些音频格式?
上传支持:MP3、WAV、FLAC、M4A、AAC、OGG、WEBM,最大 50MB。下载支持:WAV(无损母带级)、MP3(紧凑格式)、FLAC(录音室级)。基本覆盖了日常使用和专业创作的所有格式需求。
可以从 YouTube/SoundCloud 直接处理吗?
可以。直接粘贴 YouTube、SoundCloud 或 Bandcamp 的链接,系统会自动抓取音频并完成 6 轨分离。不需要先下载再转换,也不需要装任何插件。最长支持 30 分钟的音频,覆盖绝大多数歌曲和混音带。
分离后的音轨可以商用吗?
是否可商用取决于你是否拥有原始音频的版权。AI 音轨分离不会改变版权所有权——它只是帮你把一首歌拆开,不代表你可以随意使用别人的作品。如果你拥有原曲的版权,或者获取了合法授权,那分离后的音轨当然可以商用。请确保在使用第三方音乐时有合法权限。
我的音频文件会被保存或分享吗?
我们认真对待你的隐私。Key Finder 的文件模式直接在浏览器端本地运行,音频不会上传到任何服务器。URL 模式在获取音频并完成分析后立即丢弃数据,不存储。TikTok Voice Generator 的脚本仅用于生成音频,不会用于模型训练或出售给第三方。不过,生成的音频链接可以通过 URL 分享,所以建议避免在敏感内容中使用。
什么是 htdemucs?
htdemucs 是 Meta AI(Facebook AI Research)在 2022 年发布的混合变压器架构模型,由 Rouard 等人开发。简单来说,它是一种专门用于音频分离的深度学习模型,结合了传统 U-Net 架构和现代 Transformer 的优点。该模型赢得了 2022 年 Sony Music Demixing Challenge 冠军,被顶级录音室和研究人员广泛使用,是目前最先进的音源分离技术之一。
AI Stem Splitter
AI驱动的六轨音频分离工具
评论