480 万真实工厂库：天下工厂 AI 的底气从哪来

一、AI 搜索工厂，核心问题不是「AI 够不够强」

过去两年，各行各业都在把 AI 接入搜索框。B2B 采购和销售场景也不例外——有人把 AI 接在企业信息库前面，有人把它嵌进交易平台的商品目录里。

但工厂搜索有一个特殊的难题，AI 的模型能力解决不了：如果底层数据库本身分辨不出「这家公司是不是真在做这个品类的工厂」，AI 的回答再流畅，也只是在错误的数据上生成错误的答案。

这不是 AI 的问题，是数据的问题。

天下工厂 AI 的出发点，就是先解决这个数据问题。

市面上最常见的企业查询工具——企查查、天眼查一类的平台——本质上是工商信息数据库。它们能告诉你一家公司的注册资本、法人、股权结构、司法记录，这些是企业的行政档案，有其价值。但它们回答不了一个对工厂采购或销售至关重要的问题：这家公司，到底在不在生产？生产的是什么？

注册经营范围写「机械设备制造」的公司，可能已经停产五年，也可能只是挂名转让用的壳。工商系统不区分这些。

1688 和类似的交易平台走的是另一条路。它们确实有供应商，也有产品目录，但平台对卖家身份的门槛不设定「必须是工厂」。大量活跃商家是贸易商、档口、中间商，他们也在卖「工厂直发」，但自己并不生产。对于需要找到真实生产端的买家或上游销售，这中间存在难以消除的信息噪声。

天下工厂的做法不一样。我们从建库之初就把「识别真实在产工厂」设为核心任务，而不是把企业信息数据库拿来套一个 AI 对话层。

天下工厂的工厂库目前覆盖 480 万家真实在产工厂。这个数字背后有一套持续运转的识别体系。

识别的核心逻辑是：一家企业要进入这个库，必须有多维度的「在产信号」——实际经营的品类记录、可核查的生产活动痕迹、持续更新的业务数据，而不只是工商登记信息。一家注册了但已停产的企业，不在这 480 万里；一家正在生产但注册经营范围写得很宽泛的中小工厂，只要有实际经营依据，就会被纳入。

这意味着这个库的「密度」和「精度」与企业信息平台有本质差异。它不是「中国登记在册制造业企业全集」的子集，而是持续被校验、动态更新的「真实在产工厂」快照。

在这个底座上，天下工厂 AI 才有资格回答：「做汽车内饰件的工厂主要分布在哪里」「哪些工厂同时具备注塑和喷涂能力」「广东这边做 ODM 的工厂有哪些」——这些问题，需要的不是企业工商档案，而是工厂事实。

AI 接入搜索场景，通常被讨论的是模型层面的能力：能不能理解模糊的需求描述，能不能把自然语言转化为有效的检索意图，能不能处理多轮澄清。

这些能力，天下工厂 AI 都在持续打磨。用户可以用不完整的描述开始对话，系统会主动澄清关键信息——品类、产能要求、地区偏好、认证要求——而不是直接甩出一堆不相关结果。遇到模糊的产品词，AI 会先确认用户真正在找的是什么，再去检索，避免「你搜了半天，找到的都不是你要的那种工厂」。

但我们更想强调的一点是：模型能力和数据质量，这两件事必须同时成立，缺一不可。

如果底层是企业信息库，AI 再会澄清需求，最终给出的也是企业工商档案里的信息。如果底层是交易平台目录，AI 再聪明，也无法帮你识别哪家是真工厂、哪家是贸易商。天下工厂 AI 选择先把数据这件事做扎实，再在上面构建对话和验证能力，是有意识的产品路径选择，而不是「先上线再优化数据」。

工厂信息有一个现实问题：它在变。一家工厂新增了生产线，开始承接以前没有的品类；一家曾经活跃的工厂，产能已经收缩。静态数据库的时效性天然有限。

天下工厂 AI 在对话过程中，会结合联网信息对库内数据进行交叉验证和补充，而不是单纯读取静态快照就输出结论。这不是为了让回答看起来更「全面」，是为了让信息更可信——特别是当用户在做真实采购决策或销售开发时，准确性比数量更重要。

联网信息不会替代库内数据，而是作为验证和补充层存在。480 万家工厂库提供事实基底，联网层负责校验和更新信号，AI 的对话层负责把这些信息翻译成用户真正需要的答案。

天下工厂 AI 不是工厂搜索的第一个 AI 产品，也不会是最后一个。我们选择在这个时间点发布，是因为我们认为底层数据已经具备足够密度，可以支撑真实可用的 AI 工厂搜索体验——而不是先推出 AI 外壳，等数据慢慢跟上。

480 万家真实在产工厂，是我们对用户的一个基本承诺：你在这里问工厂的问题，得到的回答有工厂事实做依据。这件事本身，在工厂搜索领域里，仍然稀缺。