针对传统语音输入无法准确识别技术术语(如PostgreSQL、Kubernetes)的痛点,开发者推出了开源工具ByeType。该工具摒弃了传统的ASR纠错模式,直接利用多模态大模型处理音频。用户可通过Markdown配置自定义词汇表(如同事名、项目代号)和转换规则,实现人名、术语的精准校正及口水词的自动过滤。工具支持macOS、Windows及iOS快捷指令,兼容Gemini、DeepSeek等API,为程序员和重度文字工作者提供了高效的语音输入方案。
原文链接:Linux.do
针对传统语音输入无法准确识别技术术语(如PostgreSQL、Kubernetes)的痛点,开发者推出了开源工具ByeType。该工具摒弃了传统的ASR纠错模式,直接利用多模态大模型处理音频。用户可通过Markdown配置自定义词汇表(如同事名、项目代号)和转换规则,实现人名、术语的精准校正及口水词的自动过滤。工具支持macOS、Windows及iOS快捷指令,兼容Gemini、DeepSeek等API,为程序员和重度文字工作者提供了高效的语音输入方案。
原文链接:Linux.do
评论前必须登录!
立即登录 注册