AI场景探索
现状评估
高
AI能力和数据知识盘点
全面梳理、评估与AI场景相关的内部数据、知识及已有的AI能力资产,摸清技术和数据家底,为AI方案可行性分析提供基础输入。
持续时间
2-4天
主要角色
产品经理, 业务骨干成员, 数据团队成员, AI团队成员/数据科学家
相关资源
3 篇
AI能力和数据知识盘点
What(是什么)
AI能力和数据知识盘点 是AI场景探索阶段 中承上启下的关键一步。它旨在系统性地评估企业内部拥有哪些相关的数据、知识以及已有的AI能力(如模型、平台、API),并评估这些资产的质量、可用性和相关性。AI的智能源于数据和模型,因此这次盘点是判断一个AI构想能否落地的“事实检查”。
示例图片:

数据资产盘点示例

AI能力盘点示例
核心要素
- 数据/知识资产识别:找到并列出所有可能与业务场景相关的数据源和知识库(结构化、半结构化、非结构化)。
- AI能力资产识别:盘点公司内部已有的AI平台、预训练模型、算法组件或外部采购的AI服务。
- 质量与成熟度评估:评估数据资产的质量(完整性、准确性等)和AI能力的成熟度(性能、稳定性等)。
- 可及性与合规分析:明确资产的获取方式、管理方、技术接口和合规性要求。
When(什么时候做)
- 业务流程探查之后:理解了业务流程才能知道需要寻找哪些对应的数据和能力。
- AI技术选型与方案设计之前:数据和能力的现状是决定技术路径(例如,是复用、微调还是RAG)的关键因素。
- 评估AI项目可行性时:没有足够的数据和可用的能力,项目将面临巨大风险。
How(怎么做)
第一步:定义盘点范围
- 明确需求:基于前序环节识别的业务痛点和AI机会点,列出需要哪些类型的数据、知识和AI能力来支撑。
- 组建盘点团队:由产品经理 牵头,必须有业务骨干 确认业务含义,并由数据团队 和AI团队成员/数据科学家 提供技术支持。
第二步:资产发现与梳理
- 数据与知识发现:
- 与业务部门和IT部门沟通,了解他们管理的数据。
- 在数据团队 帮助下,扫描数据库、数据仓库、文档系统等。
- 识别非结构化的知识资产,如内部Wiki、操作指南(SOP)、专家经验文档等。
- AI能力发现:
- 与AI团队成员/数据科学家 沟通,获取公司内部可用的AI平台、模型库、中间件等清单。
- 梳理公司已经采购或正在使用的第三方AI服务(如云厂商的OCR、NLP API等)。
第三步:资产评估与分析
- 数据剖析 (Data Profiling):对识别出的数据源进行技术分析,了解其数据量、格式、更新频率等。
- 质量与成熟度打分:
- 数据:从准确性、完整性、时效性等维度为数据资产打分。
- AI能力:从性能指标、稳定性、文档完善度、易用性等维度为AI能力打分。
- 可及性与合规评估:评估获取资产的技术难度、所需权限,并确认是否存在数据隐私或使用限制。
第四步:清单化与优先级排序
- 创建资产总清单:使用数据资产盘点模板 等工具,将所有盘点信息汇总,形成结构化的“数据资产清单” 和“AI能力清单”。
- 确定高优先级清单:根据资产与业务目标的关联度、质量和可及性,筛选出最有价值、最应优先使用的资产,形成“高优先级数据资产清单”。
- 评审与确认:将清单与项目组及利益相关者进行评审,确保信息准确,并就优先级达成共识。
实践Tips
✅ 最佳实践
- 复用优先:优先考虑复用公司已有的AI能力和数据服务,避免重复造轮子。
- 业务视角先行:始终从“要解决什么业务问题”出发来寻找资产,避免漫无目的。
- 关注隐性知识:积极发掘存在于员工大脑或零散文档中的“隐性知识”,它们是构建高质量知识库的关键。
- 建立动态清单:资产是动态变化的,应将盘点清单作为一个活文档,持续更新和维护。
⚠️ 常见陷阱
- 只盘点数据:完全忽略了公司可能已经具备的、可直接复用的AI能力或平台。
- 轻信文档:系统或模型的文档可能与实际情况不符,必须进行实际调用测试或样本验证。
- 低估合规风险:在项目后期才发现数据或模型因合规问题无法使用,导致项目停滞。
- 完美主义:试图一次性盘点所有资产,应聚焦于与当前目标最相关的部分。
📋 输出物清单
- 数据资产清单
- 高优先级数据资产清单
- AI能力清单
- 数据质量评估报告
- AI能力成熟度评估报告
相关工具
案例参考
成功案例:某银行的智能投顾项目
背景:希望为客户提供个性化的理财产品推荐。 盘点过程:除了盘点客户交易数据外,还发现AI平台团队已经构建了一个成熟的用户画像标签服务(AI能力)。 结果:项目组直接复用了该用户画像服务,大大缩短了冷启动时间,避免了从零开始处理海量原始数据的复杂工作。全面的资产盘点是项目能快速见效的核心。
经验教训:某零售企业的库存预测项目
问题:项目组投入大量精力自行研发了一套基于机器学习的销量预测模型。 复盘发现:在项目进行到一半时,才发现公司另一个部门已经购买了业界领先的云预测服务API,且内部测试效果更好。 启示:跨部门的信息壁垒常常导致资源浪费。一个制度化的、全局的“AI能力和数据知识盘点”实践可以有效避免此类问题。