拆解 Palantir 的 Ontology——FDE 真正值钱的东西不是写代码，是给数据穿上业务的衣服

作者：Oli芬

4 次浏览

1 次

2026-6-29

编辑推荐:

本文主要介绍了 Palantir 的 Ontology——FDE 真正值钱的东西不是写代码，是给数据穿上业务的衣服。希望对你的学习有帮助。
本文来自于微信公众号互联互说，由火龙果软件Alice编辑，推荐。

拆解 Palantir 的 Ontology——FDE 真正值钱的东西不是写代码，是给数据穿上业务的衣服

你的 ERP 系统里有几百张表。你每月花几十万养着数据团队。但你做决策的时候，还是要靠微信群里的 Excel 文件。
这不是你的问题。这是整个行业的问题——数据库存的是"表（Tables）"，而人做决策时，脑子里想的是"实体（Objects）"。
有一个被严重低估的角色，专门在填补这个鸿沟。这篇文章不说概念，只拆机制。

一、一个尴尬的现实

先做一个思想实验。

你是工厂的生产总监。今天一早，装配线来报：一批紧固件在海关被扣了，预计晚两天到货。

你的第一反应不是"查 SQL 数据库"，而是快速在脑子里过了一遍：

• "这批紧固件用在哪儿？"
• "3号线和5号线的工位上还有多少库存？"
• "如果从7号线的备件里临时拆借，来得及补吗？"
• "哪个订单的优先级最高？"

看到了吗？你在脑子里思考的，全是业务实体：零件、工位、产线、订单、优先级。

但现在转头去看你花了几千万建的数据中台。它在告诉你什么？

它告诉你：Table_A part_id = 'FX-2024-0382'、Table_B order_id = 'ORD-20260615'、join 条件：5 张表关联。

你把"FX-2024-0382"这个字符串看了十秒钟，脑子里才反应过来：哦，这就是那批被海关卡住的紧固件。

问题出在哪？

出在数据中台存的是"表"，而人做决策时想的是"实体"。这两个世界之间存在一个语义断层。很多企业花了大价钱建数据中台，最终发现还是没法辅助决策，原因就在这里——你没有把表翻译成业务能听懂的语言。

这个断层的存在，是整个现代企业数据建设的阿喀琉斯之踵。

而 Palantir 的 FDE 团队，花了二十年时间，专门在做一件事：填上这个断层。

他们的武器，叫 Ontology（本体）。

二、Ontology 不是什么高深概念，它就是"给数据穿上业务的衣服"

先给一个最朴素的定义：

Ontology = 用业务能听懂的话，把数据库里的表重新说一遍。

传统数据库里存的是：

part_id	sku_code	category_id	supplier_id
FX-001	6mm-304	03	SUPP-47

经过 Ontology 翻译之后，在业务界面上显示的是：

品名： 6mm 304不锈钢紧固件

状态：已到港

用于： A350-900 机翼装配

目前所在：上海洋山港 3号保税仓

关联工单： WO-20260614-003（今日到期）

后者才是人决策时需要的"信息"。前者只是"数据"。

Ontology 做的工作，就是把表结构转换成管理层可以理解的对象、属性和关联，并在此基础上赋予可执行的操作。

三、Ontology 构建三步法

下面以大型客机总装线为例，拆解 FDE 如何从零构建一个 Ontology。

第一步：定义实体（Objects）

FDE 进场第一天，不会去打开数据库看表结构。他干的第一件事是：坐在车间里，听业务员怎么说。

他会听到这样的话：

• "A350 的机翼装配今天进度怎么样？"
• "3号工位那批紧固件到了没有？"
• "老张，你那个批次的质检报告出了吗？"

这个 FDE 脑子在做的，就是提取出这个工厂的"实体词汇表"：飞机机尾号、紧固件、装配工位、质检员、工单、批次。

然后他会问一个关键问题："你们说的'那架飞机', 在系统里对应哪个表、哪个字段？"

这个问题，就是 Ontology 构建的起点。

原则：用业务能听懂的语言定义实体，不是用技术术语。

技术人员的语言	业务人员的语言
Table_A: part_id, sku_code	这批紧固件
Table_B: order_id, status_code	3号工位的订单
Table_C: user_id, role_id	老张（那个干了20年的质检员）

有意思的是，FDE 在第一天花的大部分时间不是写代码，而是和业务员聊天——搞清楚他们嘴里的"那个零件""老张""3号线"在系统里到底对应什么表和字段。

第二步：编织关联（Links）

定义好实体之后，FDE 要做的是把这些孤立的实体编织成一张网。

传统方式：想知道"一批螺丝钉延期会影响哪架飞机"——需要写极度复杂的 SQL 语句，做 5 张表的 JOIN，跑几分钟才能出结果。

FDE 方式：提前把这些关系"固化"到 Ontology 里：

• 紧固件 → 链接到 → 装配工位
• 装配工位 → 链接到 → 飞机机尾号
• 飞机机尾号 → 链接到 → 客户订单
• 客户订单 → 链接到 → 交付日期

效果是什么？当某批次零件在海关被卡住的信号一传入系统，Ontology 就像一张触网，瞬间传导震动——直接在屏幕上把受影响的飞机标红，同时计算出每个订单的预计延期时间。

不需要写 SQL。不需要等人来查。系统会自动告诉你，谁会被影响。

第三步：赋予行动与闭环（Actions & Write-back）

绝大多数数据项目到这里就结束了——做了一套报表，建了一个大屏，能"看到"问题了。

但 FDE 不会停在这里。

如果只做到第二步，系统依然只是个"高级监控"——能告诉你问题在哪，但你得自己去想办法解决。

FDE 的第三步，也是整个 Ontology 最关键的一步，是把系统从"被动展示"变成"主动行动"。

具体来说，FDE 会在 Ontology 中定义 Actions（操作）：

• 发现缺料 → 系统不仅发出警报
• 还基于 Ontology 中的关联数据自动测算：如果从另一架优先级较低的飞机上拆借零件，延误成本是多少？
• 然后，在界面上生成一个【执行拆借调拨】的按钮

当供应链总监按下这个按钮——关键来了——系统会直接把这个调拨指令反向写回工厂底层的 ERP 系统，自动生成新的领料单，更新库存状态，变更工单优先级。

这个机制，叫 Write-back（回写）。

从发现异常，到评估影响，再到下达指令改变物理世界——全部在一个系统内闭环。

这是 FDE 和传统数据工程师最本质的区别。传统数据工程师做到"出报表"就结束了。FDE 要做到"按钮按下去，仓库里的零件真正被调走了"。

四、Ontology 的商业逻辑：越做越便宜

理解完技术机制之后，再来看商业逻辑。

如果每一个项目都要靠 FDE 从头搭 Ontology，那为什么 Palantir 的利润率能做到 80%？

答案在于 Ontology 的资产化能力——通过三个层次的复利效应。

第一层：沉淀——从"手艺活"到"标准件"

第一个 FDE 在某银行解决了反洗钱建模问题。他离开时，留下的不是一套代码，而是一系列被封装好的"数据模板"和"逻辑套件"，叫做反洗钱本体模型。

第二个银行项目开始时，新的 FDE 不再需要从零开始写 ETL。他直接调用这套已经被验证过的反洗钱本体模型——改几个参数就能适配新客户。

沉淀的结果是：每一次部署都在降低下一次部署的成本。

第二层：赋能——让客户的 IT 变成"初级 FDE"

一个更聪明的手段是：在项目后期，FDE 会刻意让自己"失业"。

怎么操作？通过 Foundry 平台提供的低代码工具（Workshop），FDE 把复杂的底层逻辑包装成简单的拖拽组件。

结果是什么？企业内部那些只会写简单 SQL 或只会用 Excel 的普通业务员，经过几周培训后，就能在 FDE 搭建好的框架上，自己开发新的分析应用。

不是 Palantir 帮他做，是 Palantir 帮他学会自己做。

第三层：复用——跨行业的逻辑迁移

最有意思的在这里。

汽车制造业的"零部件缺货预警"逻辑，和医疗器械的"耗材库存预警"逻辑——在 Ontology 层面，几乎是一回事。

FDE 只需要把"飞机机尾号"换成"医院科室"，把"装配工位"换成"手术室"——逻辑完全复用。

滚雪球效应一旦形成：

• 第一个场景落地可能要 3 个月
• 到了第五个场景，可能只需要 2 周
• 到了第十个场景，可能只需要 3 天

这就是 Palantir 能做到 80% 利润率的秘密——不是靠技术壁垒，而是靠"本体模型"的复利效应。卖代码的公司赚一次钱。卖"本体模型"的公司，越做越便宜、越做越快。

五、AI 时代的 Ontology：FDE 从"搬砖"到"定义"

最后，说说 AI 怎么改变了这件事。

以前 FDE 的时间去哪了？

70% 消耗在极其枯燥的"体力活"上：

• 对着几千个乱码一样的字段名猜业务含义
• 写 SQL 脚本清洗脏数据
• 调优 PySpark 代码

AI 成为"副驾驶"之后

在 AIP（Artificial Intelligence Platform）的加持下，AI 自动处理底层复杂性：

步骤	AI负责	FDE负责
需求捕捉	—	用自然语言描述需求
自动建模	自动检索数据表、推断字段含义、建议挂载方式	确认逻辑无误
策略模拟	自动模拟多种方案，计算成本和成功率	选择最优方案
安全围栏	自动生成前端看板和操作按钮	最终审查确认