vget v0.12.1 上线AI语音转文字功能,支持大模型识别

vget v0.12.1 版本正式发布,引入革命性的AI语音转文字功能。该功能基于Whisper大模型,支持tiny到large-v3多种模型,推荐使用whisper-large-v3-turbo以平衡速度和准确率。用户可通过命令行或Docker Web界面轻松转写音频/视频文件,支持MP3、MP4等多种格式,输出带时间戳的文本或字幕。结合OpenAI API,可实现内容自动总结,极大提升播客、视频等内容的处理效率。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册