实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

📅 2026-06-11 16:00 | ✍️ xibeilang | 💬 暂无评论

📅 2026年06月11日 · 来源：量子位 · 🐺 狼眼新闻

小米刚刚展示了一个1T参数大模型，实测吞吐量飙到每秒1000+ Tokens，这意味着什么？相当于你写个“生成一个贪吃蛇游戏”的提示，七秒后代码就交到你手上。这背后是小米自研的MoE架构和高效显存管理，让1T模型跑出小模型的速度。但别急着喊“颠覆”——1T模型推理成本依然高企，小米目前只敢在内部工具链上试水，离C端普及还有距离。对普通人来说，这预示着手机厂商正把AI从“语音助手”升级为“随身程序员”，但你的钱包可能要先瘦一圈。