乐其日报 第 6 期|06月10日:小米大模型破千速度与AI编程免费革命
今日AI圈发生了两件大事:一件是小米MiMo-V2.5-Pro推理速度首次突破1000 tokens/s,万亿参数旗舰模型只需8张GPU就能跑起来;另一件是开源工具Goose免费替代月费200美元的Claude Code,AI编程工具价格战正式打响。再加上阿里成立Token Foundry事业部、DeepSeek自建GW级数据中心、微信AI开发者内测启动……这一天的AI新闻,每一条都在告诉我们:AI正在从「星期」变成「日常」。
1. [国内] 小米MiMo-V2.5-Pro UltraSpeed突破1000 tokens/s
雷军宣布小米万亿参数旗舰模型MiMo-V2.5-Pro的UltraSpeed模式实现输出速度首次突破1000 tokens/s,仅需8张GPU。3倍价格10倍速度,国产大模型的工程优化能力已跻身世界前列。
小乐观点:万亿参数模型的推理速度突破千元大关,意味着中小企业部署旗舰模型的硬件门槛大幅下降。大模型正从「奢侈品」变成「日用品」,应用层的竞争才是下半场的主战场。
2. [国内] 阿里成立Token Foundry事业部,CEO吴泳铭亲自挂帅
阿里巴巴合并通义大模型事业部和未来生活实验室,成立Token Foundry事业部,集团CEO吴泳铭直接负责。周靖人出任首席科学家,牵头成立AI未来研究院。
小乐观点:CEO亲自挂帅,说明阿里已经把大模型从「实验室项目」升级为「集团战略」。Token Foundry这个名字本身就说明了问题——今后的大模型就是工业品,要按工业标准来做。
3. [国内] DeepSeek自建GW级数据中心,从买算力转向自建算力
DeepSeek发布招聘信息,寻求从MW到GW级数据中心的规划与建设人才。从依赖外部算力到自建超大规模基础设施,DeepSeek正在构建AI大模型的全栈能力。
小乐观点:DeepSeek这步棋不简单。从买算力到自建算力,说明它对自己的模型迭代速度和算力需求有长期规划。GW级数据中心是什么概念?相当于一座小型发电站的能耗。这个量级,说明DeepSeek的野心远不止模型本身。
4. [国内] 微信AI开发者内测正式启动,14亿用户入口向AI Agent开放
微信正式发布《关于开发者接入微信AI生态的指引》,获内测资格的开发者可授权微信AI读取、操作小程序,帮助用户唤起小程序服务。14亿用户池正式向AI Agent开放。
小乐观点:微信AI开发者内测是本周最重要的生态事件之一。14亿用户的入口打开,意味着AI Agent的分发渠道将发生质变。小程序开发者和AI应用公司都应该密切关注这个入口。
5. [国内] 安纳智芯完成数亿元融资,攻关AI自主可控模拟计算芯片
成立仅半年的北京安纳智芯科技完成数亿元融资,经纬创投领投。公司专注高精度现代模拟计算芯片研发,这类芯片在AI推理场景中能效比远超传统数字芯片。
小乐观点:模拟计算芯片是国产AI算力自主可控的重要拼图。不跟NVIDIA的数字芯片正面刚,而是在模拟计算赛道差异化竞争,这是聪明的路。半年融数亿,资本对这条赛道的信心很足。
6. [国内] 美团AI浏览器Tabbit V1.0发布,10+顶级模型核心功能永久免费
美团GN06团队发布AI浏览器Tabbit V1.0,集成10多个顶级模型,核心功能永久免费。100天12个版本迭代后正式上线,浏览器作为AI入口的战略价值被重新定义。
小乐观点:浏览器+大模型=新入口,这个逻辑很通顺。但美团敢说「永久免费」,说明它的变现路径不在工具本身,而在于用户数据和服务分发。AI浏览器赛道刚刚开始,值得持续关注。
7. [国内] 4B参数端侧部署:国产团队做出卡帕西预言的「认知模型」
国产团队明日新程推出Nextie,仅4B参数即可在端侧部署,实现了Andrej Karpathy预言的「认知模型」概念。小参数+端侧运行,正在成为大模型普惠化的关键路线。
小乐观点:4B参数跑在手机上,这才是真正的AI普惠。不用联网、不用云端、隐私安全,这个方向对企业级应用意义重大。卡帕西的预言被国产团队先做出来,说明国产AI创业者的执行力真的很强。
8. [国际] Google 25年来首次重新设计搜索框,AI搜索时代全面到来
Google对搜索框进行了25年来首次重大界面改版,标志着搜索交互从「输入关键词」向「AI对话式交互」的根本转变。传统SEO逻辑正在被GEO(生成式引擎优化)所替代。
小乐观点:Google搜索框的改版看似小事,实际是大事。它意味着所有依赖搜索流量的企业都需要重新思考被发现的方式。GEO(生成式引擎优化)不是未来,而是现在。乐其科技正在帮客户做这件事。
9. [国际] Anthropic Fable 5:AI一键生成可玩视频游戏
Anthropic发布Claude Fable 5,可一键生成可玩的视频游戏,成为vibe coding领域的新爆款。游戏开发门槛被进一步降低,非程序员也能通过自然语言创造交互式内容。
小乐观点:AI创作正从文本走向多模态交互。从写文章到做网页再到做游戏,每一步都在拉低创作门槛。对我们这些做AI应用的公司来说,客户提出的「能不能做个小游戏」将来可能真的能「一键生成」。
10. [国际] Goose免费替代Claude Code,AI编程工具走向开源普惠
Claude Code月费200美元,而开源工具Goose提供同类功能完全免费。AI编程工具市场正经历从高价订阅到开源普惠的价格战,对中小企业和独立开发者是重大利好。
关注山东乐其信息科技有限公司,每日获取 AI 与科技前沿资讯。
乐其日报,每天为你精选最值得关注的 AI 动态。
本文所有内容均整理自互联网公开资讯,仅供学习交流使用,不代表本站观点。如有侵权请联系我们删除。
- AITNT News、TechCrunch、36氪、MIT Technology Review 等公开信息源
