AI场景探索
现状评估

AI能力和数据知识盘点

全面梳理、评估与AI场景相关的内部数据、知识及已有的AI能力资产,摸清技术和数据家底,为AI方案可行性分析提供基础输入。

持续时间

2-4天

主要角色

产品经理, 业务骨干成员, 数据团队成员, AI团队成员/数据科学家

相关资源

3

AI能力和数据知识盘点

What(是什么)

AI能力和数据知识盘点 是AI场景探索阶段 中承上启下的关键一步。它旨在系统性地评估企业内部拥有哪些相关的数据、知识以及已有的AI能力(如模型、平台、API),并评估这些资产的质量、可用性和相关性。AI的智能源于数据和模型,因此这次盘点是判断一个AI构想能否落地的“事实检查”。

示例图片:

数据资产盘点示例

数据资产盘点示例

AI能力盘点示例

AI能力盘点示例

核心要素

  • 数据/知识资产识别:找到并列出所有可能与业务场景相关的数据源和知识库(结构化、半结构化、非结构化)。
  • AI能力资产识别:盘点公司内部已有的AI平台、预训练模型、算法组件或外部采购的AI服务。
  • 质量与成熟度评估:评估数据资产的质量(完整性、准确性等)和AI能力的成熟度(性能、稳定性等)。
  • 可及性与合规分析:明确资产的获取方式、管理方、技术接口和合规性要求。

When(什么时候做)

  • 业务流程探查之后:理解了业务流程才能知道需要寻找哪些对应的数据和能力。
  • AI技术选型与方案设计之前:数据和能力的现状是决定技术路径(例如,是复用、微调还是RAG)的关键因素。
  • 评估AI项目可行性时:没有足够的数据和可用的能力,项目将面临巨大风险。

How(怎么做)

第一步:定义盘点范围

  1. 明确需求:基于前序环节识别的业务痛点和AI机会点,列出需要哪些类型的数据、知识和AI能力来支撑。
  2. 组建盘点团队:由产品经理 牵头,必须有业务骨干 确认业务含义,并由数据团队 和AI团队成员/数据科学家 提供技术支持。

第二步:资产发现与梳理

  1. 数据与知识发现
    • 与业务部门和IT部门沟通,了解他们管理的数据。
    • 在数据团队 帮助下,扫描数据库、数据仓库、文档系统等。
    • 识别非结构化的知识资产,如内部Wiki、操作指南(SOP)、专家经验文档等。
  2. AI能力发现
    • 与AI团队成员/数据科学家 沟通,获取公司内部可用的AI平台、模型库、中间件等清单。
    • 梳理公司已经采购或正在使用的第三方AI服务(如云厂商的OCR、NLP API等)。

第三步:资产评估与分析

  1. 数据剖析 (Data Profiling):对识别出的数据源进行技术分析,了解其数据量、格式、更新频率等。
  2. 质量与成熟度打分
    • 数据:从准确性、完整性、时效性等维度为数据资产打分。
    • AI能力:从性能指标、稳定性、文档完善度、易用性等维度为AI能力打分。
  3. 可及性与合规评估:评估获取资产的技术难度、所需权限,并确认是否存在数据隐私或使用限制。

第四步:清单化与优先级排序

  1. 创建资产总清单:使用数据资产盘点模板 等工具,将所有盘点信息汇总,形成结构化的“数据资产清单” 和“AI能力清单”。
  2. 确定高优先级清单:根据资产与业务目标的关联度、质量和可及性,筛选出最有价值、最应优先使用的资产,形成“高优先级数据资产清单”。
  3. 评审与确认:将清单与项目组及利益相关者进行评审,确保信息准确,并就优先级达成共识。

实践Tips

✅ 最佳实践

  • 复用优先:优先考虑复用公司已有的AI能力和数据服务,避免重复造轮子。
  • 业务视角先行:始终从“要解决什么业务问题”出发来寻找资产,避免漫无目的。
  • 关注隐性知识:积极发掘存在于员工大脑或零散文档中的“隐性知识”,它们是构建高质量知识库的关键。
  • 建立动态清单:资产是动态变化的,应将盘点清单作为一个活文档,持续更新和维护。

⚠️ 常见陷阱

  • 只盘点数据:完全忽略了公司可能已经具备的、可直接复用的AI能力或平台。
  • 轻信文档:系统或模型的文档可能与实际情况不符,必须进行实际调用测试或样本验证。
  • 低估合规风险:在项目后期才发现数据或模型因合规问题无法使用,导致项目停滞。
  • 完美主义:试图一次性盘点所有资产,应聚焦于与当前目标最相关的部分。

📋 输出物清单

  • 数据资产清单
  • 高优先级数据资产清单
  • AI能力清单
  • 数据质量评估报告
  • AI能力成熟度评估报告

相关工具

案例参考

成功案例:某银行的智能投顾项目

背景:希望为客户提供个性化的理财产品推荐。 盘点过程:除了盘点客户交易数据外,还发现AI平台团队已经构建了一个成熟的用户画像标签服务(AI能力)。 结果:项目组直接复用了该用户画像服务,大大缩短了冷启动时间,避免了从零开始处理海量原始数据的复杂工作。全面的资产盘点是项目能快速见效的核心。

经验教训:某零售企业的库存预测项目

问题:项目组投入大量精力自行研发了一套基于机器学习的销量预测模型。 复盘发现:在项目进行到一半时,才发现公司另一个部门已经购买了业界领先的云预测服务API,且内部测试效果更好。 启示:跨部门的信息壁垒常常导致资源浪费。一个制度化的、全局的“AI能力和数据知识盘点”实践可以有效避免此类问题。