作者 | 铅笔道 黄小贵
编辑 | 铅笔道 祝枝杉
封面图 | ChatGPT创作
最新消息,AI数据独角兽Databricks又在找钱了。
这一次,它想要的估值最高可能达到1750亿美元(约合人民币1.26万亿元)。
随着SpaceX上市,OpenAI、Anthropic秘密递交招股书,Databricks可能是最后一头在一级市场上活跃的巨型AI独角兽企业。
Databricks是一家帮助企业管理数据的AI公司,2月份刚融资50亿美元,目前估值1340亿美元(约合人民币9648亿元)。
让企业私有数据"值钱"
Databricks的故事,是从伯克利实验室里的一段代码开始的。
2013年,几位来自加州大学伯克利AMPLab的研究人员创办了Databricks。他们最核心的技术资产,是Apache Spark,能让成百上千台服务器同时处理海量数据的软件引擎。
Apache Spark与Databricks的关系 来源:公开资料
如果把数据比作矿石,Spark就是挖矿机;Databricks则是建了一整座现代化矿场。
互联网公司、银行、零售商、汽车公司每天都会产生海量数据。用户点击、交易记录、库存变化、传感器信号、日志文件、客户画像、广告投放结果,全都堆在系统里。问题是,数据越多,越难处理。Databricks帮助企业挖掘数据的价值。
AI爆发以后,这个位置突然变得极其重要。
因为大模型本身并不理解一家公司的具体业务。它不知道一家零售商今天哪个区域库存不足,也不知道一家银行哪些交易异常,更不知道一家车企哪批电池测试数据出了问题。模型要真正为企业工作,就必须接入企业内部数据。
但企业内部数据往往是混乱的。
有的数据在云上,有的数据在本地服务器。有的数据在数据仓库,有的数据在业务系统。有的数据是结构化表格,有的数据是客服录音、合同文本、图片和日志。更麻烦的是,不是所有数据都能随便给AI用。金融、医疗、制造、零售行业都有严格的权限、安全和合规要求。
这正是Databricks的机会。
它可以告诉企业:你不用把所有数据重新搬一遍,也不用从零搭建AI基础设施。你可以在一个统一平台上管理数据、训练模型、部署AI应用、建立治理规则,让AI真正用上公司自己的数据。
AI时代最贵的东西,不一定是模型本身,而是模型和真实业务之间的连接层。Databricks正在做的,就是这层连接。
年入54亿美元
Databricks的赚钱方式,和传统软件公司不太一样。
传统软件更像卖许可证。企业买一套系统,按年付费,员工能用就行。Databricks更像云计算公司。客户不是简单买一个软件账号,而是在它的平台上处理数据、训练模型、运行AI应用、调用计算资源。用得越多,账单越高。
Databricks数据智能平台 来源:Databricks官网
这也是Databricks最有吸引力的地方。
一家企业一开始可能只是用它做数据分析。比如,把销售、库存、订单、用户行为数据放到平台上,做报表、查趋势、预测需求。后来,企业开始训练机器学习模型。再后来,AI时代到来,企业又想基于自己的内部数据开发AI助手、AI Agent、智能客服、风险控制系统。每增加一个场景,Databricks的使用量都会增加。
所以,Databricks卖的不是一次性软件,而是一套"企业数据和AI基础设施"。
它的收入增长,有两个来源。
第一,是新客户增加。越来越多大企业要整理数据、建设AI能力,就会采购Databricks。
第二,是老客户越用越多。这一点更关键。Databricks披露的净收入留存率超过140%,意思是同一批老客户去年花100美元,今年可能花到140美元以上。对投资人来说,这是非常漂亮的指标。因为它说明客户不是试用一下就停,而是越用越深、越用越贵。
这背后有很强的商业逻辑。
企业的数据一旦接入Databricks,就不只是放了几张表进去,而是把数据管道、权限管理、分析模型、AI应用开发流程都搭在上面。销售部门在用,财务部门在用,客服部门在用,研发部门也在用。随着数据越来越多,AI应用越来越多,迁移成本也越来越高。
这就形成了很强的客户粘性。
投资人持续给Databricks高估值,一个重要原因是,它已经证明自己不仅会讲AI故事,而且真的赚到了钱。
公司披露,目前年收入规模已经超过54亿美元。更关键的是,很多客户第一次购买后,花的钱会越来越多。因为企业的数据、AI模型和业务系统一旦接入Databricks,后续会不断增加新的使用场景。
例如,一家零售企业最开始可能只是用它分析销售数据。后来开始训练AI模型、部署智能客服、开发AI助手,每增加一个新功能,就会产生更多费用。
这意味着Databricks不是靠不停寻找新客户赚钱,而是老客户自己就在不断增加支出。
目前,Databricks年消费超过100万美元的客户已经超过800家,年消费超过1000万美元的客户超过70家。对于一家企业软件公司来说,这说明它已经进入了许多大公司的核心系统,而不只是一个可有可无的小工具。
这也是投资人最喜欢的商业模式:客户离不开,收入持续增长,而且随着AI普及,还有更大的增长空间。
做企业的AI大总管
过去,企业买Databricks,主要是为了处理数据。
比如,一家零售公司想知道哪些门店卖得好,哪些商品库存积压,哪些客户可能流失。它可以把销售、库存、会员、物流数据放进Databricks,再让数据团队做分析。
这还是传统数据平台的生意。
但AI出现后,Databricks的目标变了。它不只想帮企业"看懂数据",还想帮企业"用AI调动数据"。
"看懂数据",主要是数据分析师、工程师、业务负责人在用。它解决的是报表、预测、分析问题。
"用AI调动数据",则意味着每个普通员工都可以直接和公司数据对话。销售人员可以问:这个客户过去买过什么?客服人员可以问:这个用户的订单为什么延迟?财务人员可以问:哪些费用异常?供应链人员可以问:哪个仓库可能缺货?
Databricks官网:Your data. Your AI. Your future. 来源:Databricks官网
过去,这些问题要找数据团队写SQL、拉报表、建看板。未来,Databricks希望AI代理直接完成。
这就是它推出Genie One、Agent Bricks等产品的原因。Databricks不是要做一个普通聊天机器人,而是要做一种能接入企业真实数据、理解业务语境、帮助员工做决策的AI助手。
换句话说,OpenAI、Anthropic做的是通用大模型。Databricks想做的是企业内部的"懂业务的AI"。
大模型再强,如果不能接入企业内部数据,就只是一个外部工具。AI代理再先进,如果没有权限管理、数据治理、成本控制和安全体系,也很难进入核心业务。Databricks想把这些环节都包起来。变成企业AI的统一操作层。
它可以向上做AI助手,让员工直接和公司数据对话。
它可以向下做数据库,把业务系统和AI系统连接起来。
它可以横向进入营销、安全、客服、开发者工具等场景。
它还可以做AI成本管理。随着企业大量使用AI代理,账单会变得越来越难预测。一个员工、一个代理、一个自动化流程,都可能在后台不断调用模型,最后产生巨额费用。Databricks推出AI支出控制工具,本质上也是想成为企业AI预算的"总闸门"。
这很像云计算早期。一开始,企业只是把服务器搬到云上。后来,云厂商不只卖服务器,还卖数据库、数据仓库、AI服务、安全服务、开发工具、成本管理工具。客户用得越多,越难离开。
Databricks也想走这条路。