一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 67|回复: 0

OpenAI 的 Whisper 模型及其衍生品,包括 Distil-Whisper、Whisper.cpp、Faster-Whisper 和 FunASR,正在改变语音识别领域。

[复制链接]

1万

主题

1万

帖子

5万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
57799
发表于 2024-8-17 06:51:07 | 显示全部楼层 |阅读模式
最近一直在尝试使用OpenAI的Whisper ASR模型,它已更新至large-v3版本。 尝试过本地部署,但原版模型效率较低,所以也尝试了一些衍生模型,包括distil-whisper、whisper.cpp和faster-whisper。
distil-whisper模型基于原版进行蒸馏,虽然参数量级更小,但效果一般,主要支持英文,实用性较低。 whisper.cpp则使用C++重构,速度提升显著,但对环境要求较为严格,部署过程中遇到一些报错。
最终发现faster-whisper最适合科研和开发使用,它在原版基础上进行了改进,性能和精度都有大幅提升。 例如,根据作者给出的对比图,faster-whisper在速度和精度上都优于其他模型。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-9-22 05:34 , Processed in 0.065500 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表