vget v0.12.1 版本正式发布,引入革命性的AI语音转文字功能。该功能基于Whisper大模型,支持tiny到large-v3多种模型,推荐使用whisper-large-v3-turbo以平衡速度和准确率。用户可通过命令行或Docker Web界面轻松转写音频/视频文件,支持MP3、MP4等多种格式,输出带时间戳的文本或字幕。结合OpenAI API,可实现内容自动总结,极大提升播客、视频等内容的处理效率。
原文链接:V2EX 分享发现
vget v0.12.1 版本正式发布,引入革命性的AI语音转文字功能。该功能基于Whisper大模型,支持tiny到large-v3多种模型,推荐使用whisper-large-v3-turbo以平衡速度和准确率。用户可通过命令行或Docker Web界面轻松转写音频/视频文件,支持MP3、MP4等多种格式,输出带时间戳的文本或字幕。结合OpenAI API,可实现内容自动总结,极大提升播客、视频等内容的处理效率。
原文链接:V2EX 分享发现
评论前必须登录!
立即登录 注册