细思极恐 5秒克隆你的声音!
Mocking Bird 是开发者 @babysor 开源的比较火的 AI 拟声开源项目,目前在 GitHub 已经获得了 32K 的 Star,它能在 5 秒内克隆你的声音并生成任意语音内容,支持中文普通话。
1#
功能特性
图片 支持中文普通话拟声,并且在多个中文数据集进行了测试
图片 支持在 Windows、Linux、Mac 操作系统使用
图片 基于 B/S 架构交互,简单收集声音,生成拟声
图片 详细的部署教程、训练教程、使用教程
2#
部署教程
如何部署在该项目的 Readme 写的很详细,相对比较简单,按说明把 Python 环境、PyTorch、多媒体处理组件 FFmpeg 装好,剩下的就用把依赖库都装了,就差不多完成了。
部署成功后,可以在浏览器访问 8080 端口来体验 Mocking Bird。
首先输入生成语音的中文话术,然后录制一段你的声音,使用 synthesizer 或者其它模型进行训练一下,就能合成一段语音了。
简单的这几步,你会发现离以假乱真的效果还有距离。这时候就要运行开发者提供的 demo_toolbox.py 工具箱,进行调参以达到满意的效果。
3#
项目地址
开源地址:https://github.com/babysor/MockingBird
Demo视频:https://www.bilibili.com/video/BV17Q4y1B7mY
发表评论: