大厂AI内卷新姿势:Token造成新“PPT”
文 | 强调Next
企业降本增效省下来的钱可能在被无效的Token烧掉。
据报路,微软起头收缩Claude Code的内部授权。The Verge披露,微软Experiences + Devices团队将于6月底关停大部家世三方Claude Code授权席位,全面切换至自家GitHub Copilot CLI,主题诉求之一就是缓解AI成本压力。Uber的情况更为严格,其CTO Praveen Neppalli Naga公开坦言,公司2026年整年的AI预算,仅用四个月就已根基透支。
Meta走的是另一条路,并且方向齐全相反。Meta内部上线Token亏损排行榜,对高用量员工授予“Token传奇”“缓存魔法师”等荣誉,甚至将用量与查核挂钩、尝试末位裁减。这套机造落地仅30天,Meta全员Token总亏损量从6万亿暴涨至73.7万亿,增幅超12倍,AI亏损彻底失控。
有的公司在踩刹车,有的在才淄门,但面对的问题是一样的。行业至今没有一套成熟、不变、可落地的AI价值衡量尺度,因而单一易统计的Token亏损量,就成了唯一硬性指标。
百度CEO李彦宏就在两周前的大会上指出,Token好统计,但不蹬宗现实产出。
一个员工跑了更多Agent、塞进更长高低文、让模型反复试错,账单会急剧变大,业务了局却不定同步改善。
01.Token KPI:一场造作浪费的查核尝试
以最大化Token亏损为指标的工作方式(“Tokenmaxxing”),自去年底起头在硅谷舒展,此刻已传导至国内。阿里、腾讯、字节等大厂技术团队,分歧水平地将 Token使用量纳入转正和提升参考。
当查核与Token用量深度绑定,职场大局主义迅速向AI工作场景舒展。据《财经》报路,不少员工为达标,刻意让AI Agent批量读取上万行代码、堆砌数万字文件数据,单纯靠“堆工作量”刷高Token亏损,并无现实工作产出。这并非个例,公开数据显示,全球企业级AI利用中,近半数Token亏损都属于无效浪费。
Meta的73.7万亿Token,到底有几多真正转化成了有效产出?这刚好是所有 Token KPI造度的主题缝隙。
与硅谷企业的成本焦虑分歧,国内头部大厂正通过高额Token补助,全力降低员工AI使用门槛。
从分歧渠路披露的信息来看,各家企业福利政策各有侧沉:腾讯为主题研发配了年度22.8万元的Token专属套餐,另加每月1000美元表部工具报销;字节对内盛开AI工具不限量使用,员工业余履历AI可报销50%,技术岗上限1000美元/年;百度给技术岗配文心一言无限量使用权,表加最高800美元/年的表部Token补助;360索性直接给全员充了1亿Token。
AI工具已经不是一个办公软件插件,而是在造成新的出产资料。从前企业给员工配电脑、软件账号、云盘和报销额度;此刻,研发、设计、产品、运营都可能必要模型挪用额度。尤其在代码天生、Agent工作流、视频天生、知识检索这些场景里,Token就是干活的燃料。
问题在于,燃料发出去了,油耗怎么算,好多公司还没想明显。
02.吞金的Agent,算不清的变量账
Uber的内部数据,精准露出了企业AI成本失控的主题思造缝隙。目前其95%的工程师常态化使用AI编码工具,单人每月AI挪用成本达500至2000美元,70%的代码提交由AI天生,AI Agent每周可实现1800次代码调换,有关工作量占比从不及1%攀升至8%。
从业务落地视角看,这是AI渗入率的大幅提升,但对企业财政部门而言,这意味着刚性可控的IT成本系统彻底被突破。
成本失控的本原,在于AI Agent的高亏损个性。Gartner指出,实现一致工作量,Agent的Token亏损是传统谈天机械人的5至30倍。高盛更是预测,到2030年,全球Token亏损量将达到每月约120 quadrillion(约12亿亿),是2026年水平的24倍,驱动力正是企业端Agent的规;渴。
传统SaaS按席位计费,IT部门能够在采购时锁定整年支出上限。
AI工具的成本结构与此底子不兼容。Token账单随使用行为动态增长,而财政部门不足汗青数据成立基准,IT部门没有成熟工具进行实时追踪与成本分摊,业务部门推广使用时也没有同步成立成本归因机造。
不是AI没用,而是企业FinOps系统齐全没跟上AI的消费速度。因而微软和Uber垂危踩下刹车。
03.员工在薅羊毛,业务在画饼
国内公司的近况,和硅谷略有分歧。硅谷的焦虑在于用量跑得太快、账单超支;而国内大厂更现实的狼狈是:钱花出去了,员工用得却不够深,现实业务价值看不清。
从C端数据来看,国内AI利用热度空前高涨。量子位智库2026年行业汇报显示,今年4月国内AI利用Web端月接见量突破9亿次,APP端月下载量超2.4亿、日活达6.7亿,同比增幅223%。QuestMobile数据同步印证,截至2026年3月,国内AI原生APP月活达4.4亿,豆包、千问、DeepSeek稳居行业前三。
火热的C端数据,并未同步转化为企业端的出产力增量。
埃森哲《2025中国企业数字化转型指数》数据显示,国内46%的企业已启动AI适配与落地,但仅9%的企业实现了显著的业务价值突破。绝大无数企业的AI落地,仍停顿在浅层试用、盲目推广、摸索场景的低级阶段。
内容创作、客服问答、代码辅助等浅层场景,AI落地门槛低、见效快;但在主题研发、供给链治理、财政风控、组织协一致关键业务环节,AI落地的适配难度、合规门槛和落地成本都大幅提升。
大厂全员发放Token补助的主张是靠资金让利降低AI试错成本,强行推动全员融入AI工作流。这套打法有肯定的合理性:只有足够的使用密度,能力倒逼企业筛选出适配业务的真实场景,同时造就员工的AI使用习惯。
但问题是,只激励使用不成立价值怀抱,福利就会造成账单压力,同时衍生出卷“PPT”、卷“文档”式的伪AI工作方式。
AI对职场的渗入速度,远超预期。据Cognizant 2026年汇报测算,美国93%的岗位都将分歧水平受到AI冲击,这一行业预判比此前预估提前了整整6年。
重要岗位AI渗入在出现全面发作态势。数据显示,2023年治理、金融运营、行政支持类岗位的AI露出度仅14%-21%,如今已飙升至60%-68%;律师岗位AI露出度从9%跃升至63%,就连CEO岗位的AI理论露出度也突破60%。汇报同时强调,理论渗入不代阐发实代替,责任问责、行业监管、人类主观判断,仍是造约AI全面落地的主题壁垒。
这意味着,AI会持续进入更多岗位,Token亏损也会从研发部门扩散到更广的组织层面。企业真正要面对的是若何判断一笔Token花得值不值。
04.挤掉Token泡沫:从“用量崇拜”转向“效能怀抱”
Token自身不是问题,企业想要搭建成熟的AI出产力系统,必然必要充足的Token投入作为支持。行业乱象的主题症结,从来不是“Token用太多”,而是“把Token用量当成唯一指标”。
Meta的Token排行榜机造,看似激活了全员AI使用周到,肯定水平上推动了员工尝试新型AI工具,但无律例避主题缝隙:Token亏损总量,与员工的业务产出毫无直接关联。
而微软、Uber的成本;灿≈,单纯一刀切缩减Token额度,只是治标不治本,反而可能误伤真正高效的AI办公场景。
李彦宏尝试给出答案,他提出了DAA的概想:Daily Active Agent,他主张用逐日活跃Agent数量来衡量AI的现实渗入水平,而不是Token亏损总量。这个方向不能说没路理,但具体推算方式也有待美满,终于一个活跃的Agent也不定真正跑通业务流程。
企业的主题转型方向,是摒弃Token崇拜、成立AI效能思想。
查核研发AI工作质量,沉点要看AI代码的归并通过率、缺点率、返工率和项目交付周期,而非挪用频次;
查核客服场景,主题关注问题一次解决率、人为收受率与用户中意度;
营销内容场景,侧沉产出效能、转化成效与合规风险把控;
针对AI Agent工作流,则必要沉点排查无效沉试、冗余高低文、不合理模型挪用等浪费行为。
这套精密化的成本与价值治理系统,主题逻辑是要精准分辨有效AI挪用与无效资源亏损,斩断纯堆量的浪费行为。
随着AI深度落地,Token将成为与电费、云服务、人力成本并列的主题出产开支。硅谷企业在为盲目扩量补课,国内企业在靠补助遍及AI使用。
从Token到DAA,是从“烧了几多”走向“跑了几多”,算是往前迈了一步。但“值几多」剽个问题,还没人真正给出答案。
文章点评
未查问到任何数据!
颁发评论
◎欢迎参加会商,请在这里颁发您的见解、互换您的概想。