近期,科技领域关于“token工厂”与“token运营”的讨论热度持续攀升,成为行业关注焦点。这一新兴概念正引发科技企业战略布局的深刻调整,其背后的商业模式与竞争逻辑值得深入剖析。
从商业模式来看,token工厂与token运营呈现截然不同的特征。token工厂采用重资产模式,需自建或租用算力基础设施,如同传统实体工厂般承担token生产职能;而token运营则走轻资产路线,通过聚合平台或分发方角色提供技术服务,对算力持有量要求较低。这种差异直接体现在收入结构上:算力租赁依赖固定五年期租金,收入弹性有限;而token工厂与运营的收入与token消耗量线性挂钩,随着AI推理需求爆发,其增长潜力显著优于前者。
在收益分配机制方面,token工厂与模型公司形成紧密的利益绑定。双方按token调用量进行分成,典型比例为70:30,但具体比例会因模型属性调整。例如,强势闭源模型可能将分成改为60:40,而算力紧张的模型方(如智谱)甚至愿意让出80%的收益。这种模式使token工厂收入与模型公司表现正相关,同时因边际成本较低而具备高盈利弹性。
大型科技企业纷纷从算力租赁转向token工厂领域,背后存在多重驱动因素。合规风险是首要考量:英伟达高端显卡受美国出口管制,若集中部署于大厂机房可能引发合规隐患,而通过第三方托管可有效降低风险。运营效率方面,大厂无需自建运维体系,可将平台搭建、优化等环节外包,实现“轻装上阵”。更关键的是,这种转型推动资本支出向运营支出转化,缓解了科技巨头持续攀升的资本开支压力——数据显示,海外四大科技企业2026年资本开支已占经营性现金流的90%以上。
盈利能力对比显示,token工厂毛利率可达50%左右,这一数据得到润建股份电话会议及海外Fireworks、Together AI等企业的验证,远超算力租赁行业水平。其核心竞争要素并非算力规模,而是“每瓦产出token”的效率。通过推理优化技术(包括量化、算子重写、KV cache优化、云调度等),企业可显著降低延迟、提升资源利用率并降低成本。例如,Nebius收购AGAI团队后,将延迟降低40-60%,利用率翻倍,成本降幅达40-50%。
行业观察人士指出,当前市场对这一领域的态度呈现分化:部分谨慎者开始担忧宏观风险,而早期获益者仍坚持积极布局。与此同时,技术探索方向日益多元,SpaceX的航天创新、机器人技术突破、mircoLED与玻璃基板显示技术、M10芯片研发、柔性叠层光伏等前沿领域,均成为企业寻求新增长点的试验场。这种技术路线的分散化,既反映了行业对单一赛道风险的规避,也预示着科技竞争正进入多维博弈的新阶段。






