OpenAI 的 Whisper 模型及其衍生品，包括 Distil-Whisper、Whisper.cpp、Faster-Whisper 和 FunASR，正在改变语音识别领域。

admin 发表于 2024-8-17 06:51:07

OpenAI 的 Whisper 模型及其衍生品，包括 Distil-Whisper、Whisper.cpp、Faster-Whisper 和 FunASR，正在改变语音识别领域。

最近一直在尝试使用OpenAI的Whisper ASR模型，它已更新至large-v3版本。尝试过本地部署，但原版模型效率较低，所以也尝试了一些衍生模型，包括distil-whisper、whisper.cpp和faster-whisper。
distil-whisper模型基于原版进行蒸馏，虽然参数量级更小，但效果一般，主要支持英文，实用性较低。 whisper.cpp则使用C++重构，速度提升显著，但对环境要求较为严格，部署过程中遇到一些报错。
最终发现faster-whisper最适合科研和开发使用，它在原版基础上进行了改进，性能和精度都有大幅提升。例如，根据作者给出的对比图，faster-whisper在速度和精度上都优于其他模型。

页: [1]

一元网络论坛's Archiver

OpenAI 的 Whisper 模型及其衍生品，包括 Distil-Whisper、Whisper.cpp、Faster-Whisper 和 FunASR，正在改变语音识别领域。