小米 MIMO 新计费解析：Credits 额度暴涨背后，实际可用 Token 或缩水 75%

分类：前沿阅读() 评论(0)

近日，小米 MIMO 平台推出了新的 Token Plan 套餐，宣传语称实现了“加量不加价”，Credits 用量提升至 5-8 倍，并对已用额度进行了全量重置。然而，这一表面上的“福利”在实际使用中引发了开发者的质疑。用户发现，尽管新版 Pro 套餐的 Credits 额度从旧版的 700M 激增至 38B，但实际 Token 消耗速度异常快。经过详细的计费规则对比分析发现，问题的核心在于新旧版兑换 Token 的汇率发生了巨大变化。旧版 Pro 调用 V2.5-Pro 模型时消耗倍率为 2x，约可使用 350M Tokens。而在新版规则下，不同类型的 Token 扣费标准差异极大：缓存输入仅扣除 2.5 Credits/token，但未缓存输入高达 300 Credits/token，输出更是高达 600 Credits/token。若按照常见的 1:1 输入输出比例（未缓存）计算，平均每 Token 需消耗 450 Credits。这意味着 38B 的巨额 Credits 实际仅能兑换约 84.4M Tokens。与旧版相比，在缓存命中率不高的场景下，新版套餐的实际可用 Token 数量不仅没有随 Credits 涨幅同步增加，反而缩水了约 76%。此外，针对 Claude Code 等开发工具，由于 Prompt 拼接机制导致难以命中缓存，实际开发体验可能远不如旧版套餐。

事件分析

此次小米 MIMO 计费调整反映了 AI API 聚合平台在模型成本上涨压力下的定价策略转型。通过引入“Credits”这一中间货币单位，并大幅调整针对不同缓存状态的 Token 兑换汇率，平台实际上是在引导用户优化使用习惯以降低其自身的后端推理成本。从技术层面看，新版计费极度依赖缓存命中，高达 120 倍的缓存与非缓存输入价差，迫使开发者必须尽可能复用上下文。然而，对于 Claude Code 等高频、动态交互的开发场景，前置 Prompt 和动态生成的特性决定了其天然难以命中缓存，这导致开发者极易陷入“高额度、低耐用”的陷阱。这种“数字通胀”式的营销手法，虽然提升了账面数字的吸引力，但也增加了开发者评估实际成本的计算复杂度，提醒业界在选择 API 供应商时需透过面值看本质，关注具体的单Token成本而非虚标的积分数量。

💡 核心观点：通过虚增 Credits 面值并拉大非缓存计费倍率，实则是将模型成本压力转嫁给开发者，高额度并非高性价比。

原文链接：Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。了解一下 ›

抢沙发

评论前必须登录！

立即登录注册

易安作者

长期关注 AI Agent、软件工程、自动化工作流与个人生产力系统。喜欢把复杂技术拆成普通人也能上手的实践教程,也记录自己在工具链、编程、内容创作和知识管理上的真实折腾。

分享 AI 工具、Agent 工作流与提示词工程的实战经验
记录从想法到产品、从代码到上线的完整实践过程
关注普通人如何用 AI 放大能力,而不是被工具牵着走

阅读作者的全部文章 ›

文章目录

前沿哨所

彻底变革 JS 并发：Bun 提交 WebKit 补丁，引入共享内存多线程机制

Bun 的创始人 Jarred Sumner 提交了一个极具野心的实验性 PR，旨在为 JavaScriptCore 引入“共享内存线程”机制，彻底改变 JavaScript 的并发模型。目前的 Web Workers 模型依赖隔离的堆内存、结构化克隆和消息传递，性能开销大且编程复杂。该提案允许开发者在不同核心上直接共享对象，无需序列化或 postMessage，实现了类似 Java、C# 或 Go 的多线程编程范式。PR 引入了 new Thread(fn)、Lock、Condition 等同步原语，并扩展了 Atomics 以支持普通对象属性。目前该功能已移除全局解释器锁（GIL），通过了大量测试用例，但在单线程性能回归控制和复杂性维护上仍面临挑战，可能不会合并到上游 WebKit，但仅作为 Bun 的特性也足以引发行业震动。

事件分析

此项提案直击 JavaScript 在高性能计算场景下的核心痛点。传统 Web Workers 模型因数据隔离导致的序列化成本，使其难以应对复杂的图遍历、解析器或服务器端共享缓存等重负载任务。Bun 方案通过 TID 标记的“分段蝴蝶”对象模型和写时复制策略，试图在保持内存安全（无数据竞争导致的堆损坏）的前提下，实现真正的内存共享。这不仅是对 JavaScriptCore 对象模型、垃圾回收机制和 JIT 编译器的底层重构，也是 JS 运行时向传统系统级语言并发模型的一次激进靠拢。若能成功落地，将极大提升 Bun 在服务端和高密度计算场景下的竞争力，但也给引擎的长期维护带来了巨大的复杂度挑战。

💡 核心观点：JavaScript 终于撕下“单线程”的标签，Bun 试图通过共享内存机制将其推向与 Go、Java 同等的高性能并发竞技场。

原文链接：Hacker News

7小时前
每日亿级Token消耗引热议：开发者质疑AI编程的边际效用与成本

针对当下大模型在软件开发领域的深度渗透，Linux.do 社区引发了一场关于高频 AI 工具使用场景的实质性探讨。话题核心在于：对于普通开发者或研发团队而言，每日消耗上亿级别的大模型 Token（如 Claude、GPT-4 等）是否具有实际价值。发帖者指出，除了常规的日志审查、文档审查及代码库审查等辅助性工作外，核心开发环节的实际消耗并不高。更关键的是，当前的 AI 生成内容（无论是代码还是文档）尚无法达到“直接可用”的标准，必须依赖人工进行二次仔细审查。这种“人机协同”模式导致的结果是：人工环节不仅不能省略，反而因为需要核查 AI 的输出增加了工作量。讨论者进一步表示，并非所有项目都有足够庞大体量来支撑如此巨大的 AI 算力消耗，盲目维持高额订阅服务可能造成资源浪费。这一现象折射出开发社区正从初期的“技术尝鲜”转向对“成本收益”的理性评估。

事件分析

从技术演进的角度看，此次讨论揭示了当前 AI 辅助编程面临的“边际效用递减”问题。虽然大模型在处理文本和代码片段上表现出色，但软件工程的系统性和安全性要求极高，导致 AI 目前更多扮演的是“初稿生成器”而非“最终决策者”。开发者对日志和代码的二次审查实际上是必须的兜底策略，这限制了纯 Token 消耗带来的直接生产力提升。这表明，单纯依靠堆砌 Token 并不能线性提高研发效率，未来的开发工具链可能需要从单纯的“生成式”向更智能的“验证与修正”进化，或者通过本地化部署大模型来降低长尾场景下的调用成本。企业级应用中，如何量化 AI 工具的实际产出比，将成为技术采购和研发流程优化的关键考量。

💡 核心观点：高Token消耗并不等于高生产力，当前AI编程仍处于“人机协同”的辅助阶段，成本控制与准确性审查构成了落地的双重瓶颈。

原文链接：Linux.do

7小时前
Gemini CLI 现访问受限：网页端可用但命令行报错 403 无效许可

近日，在知名技术社区 Linux.do 上出现了一则关于 Google Gemini 服务访问异常的讨论，引发了部分开发者的关注。据反馈，部分持有 Gemini Pro 订阅的用户遇到了一种奇怪的“权限割裂”现象：他们的账号在官方网页端能够正常登录并使用全套模型功能，没有任何问题；但在切换到终端环境，使用命令行界面（CLI）工具调用模型服务时，却遭到了系统的拦截。系统返回了具体的错误代码 #3501，提示用户“没有该产品的有效许可证”，并建议联系管理员或更新版本。这一报错信息与常规的网络访问 denied 不同，直接指向了产品授权层面的问题。话题在短时间内引发了多位参与者的共鸣，大家正在排查这是否属于 Google 服务端的一次策略调整，即开始限制非官方客户端或第三方封装工具通过常规凭证访问付费模型。这种不同端点（Web 端与 CLI 端）之间的认证差异，给习惯使用命令行进行高效交互的开发者和极客带来了困扰，也暴露了当前基于云端 AI 服务在客户端鉴权管理上的复杂性。

事件分析

技术视角下，该事件凸显了非官方 AI 客户端与厂商服务端鉴权机制之间的博弈。CLI 工具通常通过封装 Web 接口或调用 API Key 实现，而此次报错信息明确指向“许可证”而非单纯的 API 权限不足，暗示 Google 可能正在服务端部署更严格的指纹识别或 Token 校验逻辑，以区分官方浏览器流量与脚本化流量。这可能是为了防止滥用，或是为了将高阶模型的调用强制收束至官方 Web 界面或封闭的 SDK 生态中。对于依赖 CLI 进行自动化流程的开发者而言，这预示着基于非官方协议的“野生”接入方式正面临极高的维护风险与封禁可能。

💡 核心观点：网页端与命令行接口的权限割裂，标志着 Google 正收紧对非官方渠道的调用管控，开发者需警惕第三方工具的可用性风险。

原文链接：Linux.do

7小时前
两百年技术演进图谱：从蒸汽机到 AI，解读技术采用的 S 型曲线

该项目名为“S-CURVES”，是一份详尽的技术采用指南，涵盖了从1825年至2026年长达两个世纪的技术普及数据。项目的核心在于揭示了一个普遍规律：无论技术如何更迭，其被大众采用和普及的路径始终呈现出相似的“S型曲线”形态。通过汇集包括“我们的数据世界”、美国人口普查局、皮尤研究中心以及主要财经媒体档案等权威信源，该项目构建了一个可视化的数据库，用于对比不同时代技术的生命周期。内容展示了从早期的蒸汽机、电力、电话，到现代的互联网、智能手机，以及当前热门的人工智能和自动驾驶等前沿技术的渗透率变化。项目不仅回顾了历史数据，还包含对2026年的预测。通过引用经过事实核查的名言和数据，它帮助观察者区分技术炒作与实质性普及。对于关注科技、AI及前沿技术的读者而言，这一可视化图谱提供了一个宏观视角，有助于理解当前新兴技术（如大模型、自动驾驶）正处于S型曲线的哪个阶段，是处于早期的缓慢增长、爆发式的快速增长，还是后期的市场饱和期。

事件分析

从产业视角来看，该可视化项目最大的价值在于为当前的技术炒作周期提供了历史维度的量化参照。尤其是对于目前炙手可热的AI和自动驾驶领域，S型曲线理论提醒行业关注渗透率的关键拐点。历史数据显示，电力和电话的普及耗时半个世纪，而移动互联的普及速度显著加快。对比之下，生成式AI目前的爆发速度虽然惊人，但仍需警惕从“早期采用者”向“早期大众”跨越时的“鸿沟期”。技术落地不仅需要算法突破，更依赖于基础设施（如算力网络、能源供给）的配合，这往往决定了曲线爬升的斜率。通过对比1825年以来的技术采纳规律，可以看出资本的投入与技术的实际回报之间存在时滞，这对于判断当前AI产业的成熟度具有重要的参考意义。

💡 核心观点：历史证明技术普及皆呈S型，当前AI正从爆发期向大众应用跨越，能否跨过“鸿沟”取决于基础设施与成本的极致优化。

原文链接：Hacker News

8小时前
DeepSeek接入VSCode的兼容性迷局：方舟CodingPlan实测与路由技术探讨

随着GPT Plus订阅额度缩减及成本考量，一位开发者尝试将DeepSeek的API服务接入到VSCode的Codex插件中以替代原有的OpenAI服务。该开发者此前使用了名为CodexSwitch的开源项目作为路由转换工具，试图将OpenAI格式的请求转发给DeepSeek。在实测过程中发现，虽然基础的代码生成对话能够进行，但在处理涉及`5.4-mini`等特定模型命名请求以及`codex-auto-review`（代码自动审查）等IDE内置的深度代理功能时，DeepSeek API会返回400错误，显示出非标准API接口与现有AI编程工具之间的兼容性断层。鉴于GPT额度不足且不打算续费，该开发者计划转向字节跳动的“方舟CodingPlan”套餐，该套餐声称支持原生OpenAI Response格式。目前社区讨论的重点在于：利用CCS（Cursor Compatible Server）协议或新版本的原生替换方案，能否彻底解决IDE工具中非标请求的路由失败问题，以及方舟CodingPlan套餐的真实购买可用性。这一案例折射出当前大模型“平替”方案在落地AI编程场景时面临的具体技术挑战。

事件分析

本事件聚焦于AI编程工具生态中的API兼容性问题，揭示了当前“平替”大模型落地时的技术痛点。虽然许多第三方模型宣称兼容OpenAI接口，但这通常仅限于基础Completion和Chat接口。而主流AI编程工具（如Cursor、Codex）为了实现代码审查、上下文感知等功能，会调用大量未公开或非标准的API参数（如Specific Model Capabilities、Agent Routing指令）。这导致简单的API格式转换路由器无法支撑复杂的IDE工作流。方舟CodingPlan等新兴服务的出现，旨在通过提供原生兼容层来填补这一空白，但其对深度Agent交互的支持程度仍需市场验证。这表明，大模型厂商若想真正切入AI编程开发者市场，仅提供基础模型能力是不够的，必须针对IDE生态的特定协议进行深度适配与优化。

💡 核心观点：AI编程工具的“平替”不能仅停留在基础API对齐，针对IDE深度Agent交互（如自动审查、Ref光标功能）的非标协议兼容性才是决定开发者体验的关键。

原文链接：Linux.do

8小时前
极致无障碍体验：开发者开源纯 SwiftUI 构建的 iOS 版 Hacker News 阅读器 Ember

近日，一位名为 sylwester 的开发者在 GitHub 上开源了一款名为 Ember 的原生 iOS Hacker News 阅读器应用。该项目基于 SwiftUI 框架构建，且不依赖任何第三方库，旨在提供极致的阅读体验与无障碍辅助功能。Ember 最大的技术亮点在于对评论区的重构，它摒弃了传统的 WebView 渲染，而是将评论解析为原生文本组件。这使得链接、斜体、代码块等元素能像系统原生组件一样响应操作，文本选择流畅，且支持评论线程的即时折叠。在数据获取层面，应用利用 Algolia API 单次请求获取完整的评论树，相比逐级遍历 Firebase API，大幅提升了加载效率。在无障碍设计方面，Ember 做到了行业标杆级别：不仅遵循“不以颜色为唯一信息载体”的原则，通过形状和图标辅助展示状态，还完整支持 VoiceOver 屏幕朗读、Dynamic Type 动态字体及减弱动态效果设置。应用甚至能自动检测设备的无障碍偏好并在首次启动时自动匹配配置。此外，Ember 包含 Top/New/Best 等全功能分类、搜索、收藏及主题切换，且完全通过公共 API 交互，不设账号、不进行任何数据追踪，充分尊重用户隐私。

事件分析

Ember 项目展示了现代移动应用开发中“原生优先”与“无障碍设计”的最佳实践。在移动端开发领域，WebView 虽然开发成本低，但在文本交互与系统级功能支持上始终存在局限。Ember 通过 SwiftUI 证明了原生渲染在处理复杂排版（如嵌套评论、代码块）时能提供更流畅的交互体验，尤其是对文本选择和手势响应的优化。同时，该项目对 Algolia API 的应用也揭示了第三方索引接口在处理树形结构数据时往往比官方接口更具效率。从社会价值来看，Ember 为 iOS 开发者提供了一个极具参考价值的无障碍开发范例。随着技术普及，视障用户对高质量 App 的需求日益增长，Ember 这种从底层逻辑（如颜色盲友好、语音朗读优化）出发的设计理念，体现了科技产品包容性的重要趋势，其开源代码将对整个社区的 iOS 应用质量提升产生积极影响。

💡 核心观点：极客精神不仅在于构建功能，更在于通过原生技术重塑无障碍标准，Ember 证明了 SwiftUI 在实现高性能与包容性设计上的巨大潜力。

原文链接：Hacker News

8小时前

小米 MIMO 新计费解析：Credits 额度暴涨背后，实际可用 Token 或缩水 75%

事件分析

相关推荐

抢沙发

评论前必须登录！

置顶推荐

前沿哨所

彻底变革 JS 并发：Bun 提交 WebKit 补丁，引入共享内存多线程机制

事件分析

每日亿级Token消耗引热议：开发者质疑AI编程的边际效用与成本

事件分析

Gemini CLI 现访问受限：网页端可用但命令行报错 403 无效许可

事件分析

两百年技术演进图谱：从蒸汽机到 AI，解读技术采用的 S 型曲线

事件分析

DeepSeek接入VSCode的兼容性迷局：方舟CodingPlan实测与路由技术探讨

事件分析

极致无障碍体验：开发者开源纯 SwiftUI 构建的 iOS 版 Hacker News 阅读器 Ember

事件分析

最新文章

热门专题

热门标签

网站统计

事件分析

相关推荐

抢沙发

评论前必须登录！

置顶推荐

前沿哨所

彻底变革 JS 并发：Bun 提交 WebKit 补丁，引入共享内存多线程机制

事件分析

每日亿级Token消耗引热议：开发者质疑AI编程的边际效用与成本

事件分析

Gemini CLI 现访问受限：网页端可用但命令行报错 403 无效许可

事件分析

两百年技术演进图谱：从蒸汽机到 AI，解读技术采用的 S 型曲线

事件分析

DeepSeek接入VSCode的兼容性迷局：方舟CodingPlan实测与路由技术探讨

事件分析

极致无障碍体验：开发者开源纯 SwiftUI 构建的 iOS 版 Hacker News 阅读器 Ember

事件分析

最新文章

热门专题

热门标签

网站统计

code80.ai · 多模型 API 统一接入