Whisper AI提词处理器
电脑版发表于:2024/8/13 21:38
Whisper AI提词处理器
Whisper简介
Whisper 是一种通用语音识别模型。
它基于大量多样化音频数据集进行训练,同时也是一种可以执行多语言语音识别、语音翻译和语言识别的多任务模型。
安装与应用Whisper
安装前提需要安装ffmpeg
。
choco install ffmpeg
开始安装Whisper
pip install -U openai-whisper
最好在安装之前开启代理进行安装。
set HTTP_PROXY=socks5://127.0.0.1:10808
set HTTPS_PROXY=socks5://127.0.0.1:10808
安装完成后我们可以通过whisper --help
命令查看帮助。
这里的参数有很多,我们只需要使用到几个。
我这里以389479.mp3
为例子。
# 提取389479.mp3中的歌词,使用的是 small.en模型
whisper 389479.mp3 --model small.en
我们发现会报错。
我在官网找到[Colab 示例],点进去。
https://github.com/openai/whisper
然后我们执行一下这一个
然后将我们的mp3文件进行上传。
添加我们的代码进行执行。
!whisper 389479.mp3 --model small.en
我们可以看到转换成功了,将每一句歌词都分析了出来,并且保存为各种模式的文本文件。
但问题是它有下载模型,它的模型在哪儿呢?
它的模型在~/.cache/whisper/
,我们将它复制到当前目录。
然后我们把模型进行下载。
保存到一个指定的目录中,然后在本地通过--model_dir
参数指定模型路径。
再次执行,同样可以在本地进行题词了。
whisper 389479.mp3 --model_dir D:\ai\music\MusicBot\MusicBot.ChatGPT\musicfile\model --model small.en
Whisper的模型列表
请根据自己的电脑配置进行选择,然后在https://huggingface.co/
进行选择