最近做了一个很小的在线音频工具:AI Vocal Remover。
最开始关注的是一个很具体的点:去人声这件事本身不只是在等模型处理完,用户真正要判断的是分离出来的结果值不值得保存。
所以现在这版没有往重型音频工作台方向做,而是先把一条短路径走顺:
- 上传一个本地音频文件。
- 等 AI 做 vocal separation。
- 预览 vocal 和 instrumental 两个 stem。
- 听完以后判断结果是否可用。
- 下载需要的 MP3 输出。
我刻意把 「预览」 放在中间,而不是直接把下载按钮当成最终答案。因为练歌、剪辑、remix sketch 这些场景里,大家关心的 stem 不一样:有人更在意伴奏够不够干净,有人更在意人声能不能单独听清。
当前的边界也很明确:分离质量会受曲目、混音、源音频质量以及模型和第三方处理服务影响;用户也应该只上传自己有权处理的音频。我不想把它包装成 「完美去人声」 或者 「所有歌曲都能处理得很好」 的工具。
现在最想验证的是:这条 「上传 -> 分离 -> 预览 -> 下载 MP3」 的路径,对第一次打开页面的人来说是否足够清楚。
页面在这里:
https://ai-vocal-remover.com/
想听听大家建议:
- 对这类小工具来说,把 vocal / instrumental 预览放在下载前,是否能降低试错成本?
- 第一屏应该更强调 「能做什么」,还是更早说明 「分离效果会因音源而变化」?










