告别语音转写“翻车”:开源工具ByeType利用大模型搞定技术术语识别

针对传统语音输入无法准确识别技术术语(如PostgreSQL、Kubernetes)的痛点,开发者推出了开源工具ByeType。该工具摒弃了传统的ASR纠错模式,直接利用多模态大模型处理音频。用户可通过Markdown配置自定义词汇表(如同事名、项目代号)和转换规则,实现人名、术语的精准校正及口水词的自动过滤。工具支持macOS、Windows及iOS快捷指令,兼容Gemini、DeepSeek等API,为程序员和重度文字工作者提供了高效的语音输入方案。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册