沉睡数据高达90%?夏洛特黄蜂队竟靠AI挖掘录像,选中MVP新秀夺冠!企业如何唤醒这座“金山”实现突破?

企业坐拥大量非结构化数据,从通话记录、视频素材到客户投诉历史和供应链信号。然而,这些据估计占企业数据总量高达90%的宝贵商业情报,因其非结构化特性导致分析极其困难,长期处于沉睡状态。
但若能有效管理和整合,这些庞杂的数据不仅是训练优化下一代AI系统、提升其准确性、情境理解与适应性的珍贵资产,更能催生驱动实际业务成果的深刻洞察。
案例:夏洛特黄蜂队的AI选秀革命
美国NBA球队夏洛特黄蜂队提供了一个有力例证。他们成功挖掘了此前因数量庞大、结构混乱而无法分析的海量比赛录像,从中识别出一位能为球队带来胜利的新秀。然而,在数据产生价值前,团队分析师首先必须攻克一个关键挑战:处理原始的非结构化录像以供分析。
非结构化数据因其格式、质量和可靠性差异巨大而存在固有分析难度,需要自然语言处理和AI等专用工具进行解读。每个组织的非结构化数据池还包含特定领域的特征和术语,通用AI模型可能无法自动理解。例如,金融服务公司不能简单地使用通用语言模型进行欺诈检测,而必须调整模型以理解监管语言、交易模式、行业特定风险指标以及公司内部的数据政策等独特情境。
当整合具有不同结构和质量标准的多源数据时,挑战加剧,团队可能难以区分有价值的数据与噪声。
夏洛特黄蜂队在寻找新秀时,转向了包括计算机视觉在内的AI工具,以分析来自低级别联赛的原始比赛录像——这些联赛通常不在NBA球探的视野范围内,因此其数据不易获得分析。
“计算机视觉作为工具已存在一段时间,但我认为在当今AI时代,其适用性正在迅速提升,”参与该项目的AI公司Invisible Technologies高级副总裁乔丹·西利表示,“你现在可以处理以前无法消化的数据源,并提供前所未有的分析层。”
通过部署多种计算机视觉技术,包括物体与球员追踪、移动模式分析以及球场几何点位映射,团队得以提取运动学数据(如球员移动坐标),并生成速度、爆发力、加速度等指标。
这为球队提供了关于球员个体的丰富、数据驱动的洞察,帮助他们识别并选择了一位能弥补黄蜂队自身能力短板的新秀。这位被选中的运动员后来荣获2025年NBA夏季联赛最有价值球员,并帮助球队赢得了队史首个夏季联赛冠军。
从成功中汲取的经验
首先,非结构化数据必须通过直观的收集形式、正确的数据管道和管理记录为AI模型做好准备。“只有在结构化数据可被AI消化并准备就绪后,你才能利用非结构化数据,”西利强调,“你不能不做准备工作就直接把AI扔向问题。”
对许多组织而言,这可能意味着需要寻找能提供技术支持、根据业务情境微调模型的合作伙伴。传统的技术咨询模式——由外部供应商主导耗时漫长的数字化转型计划——在此并不适用,因为AI发展太快,解决方案需要根据公司当前的业务现实进行配置。
前沿部署工程师是一种更适合AI时代的新兴合作模式。该模式最初由Palantir推广,将产品和工程能力直接连接到客户的运营环境。FDE在现场与客户紧密合作,在构建解决方案前深入理解技术举措背后的具体情境。
“没有FDE,我们无法完成工作,”西利说,“他们外出微调模型,与我们的人工标注团队合作,生成可用于验证或改进生产环境模型性能的基准事实数据集。”
其次,数据需要在其自身情境中被理解,这要求模型根据具体用例进行精细校准。“你不能假设一个开箱即用的计算机视觉模型,仅仅通过应用开源模型处理你的非结构化数据流,就能带来更好的库存管理,”西利解释道,“你需要微调它,使其以你想要的格式输出数据并服务于你的目标。这样才能开始看到高性能模型,进而真正产生有用的数据洞察。”
对于黄蜂队,Invisible使用了五个基础模型,并根据特定情境数据进行了微调。这包括教会模型理解它正在“观察”的是篮球场而非足球场;理解篮球比赛规则与模型可能已知的其他运动有何不同;以及理解如何识别“出界”等规则。经过微调后,模型能够捕捉细微复杂的视觉场景,实现高度精确的物体检测、追踪、姿态分析和空间映射。
最后,尽管企业可用的AI技术组合日新月异,但它们不能回避传统的商业指标:清晰的目标。若业务目的不明确,AI试点项目很容易变成无休止、漫无目的的研究项目,在计算、数据成本和人员配置上代价高昂。
“我们见过的最佳合作是当人们清楚自己想要什么,”西利指出,“最糟糕的情况是当人们说‘我们想要AI’却没有方向。在这种情况下,他们就像在没有地图的情况下无尽追逐。”
—
延伸思考
1. 成本与普及的平衡:夏洛特黄蜂队的案例展示了前沿AI数据处理的巨大潜力,但这种高度定制化的模型微调与FDE深度参与模式,其成本与资源门槛是否可能将大多数中小企业挡在门外?如何降低此类技术的应用门槛,使其惠及更广泛的企业?
2. 数据准备与AI价值的再评估:文章强调“只有结构化数据准备就绪,才能利用非结构化数据”。这是否意味着,在当前的AI应用阶段,企业数据基础设施的成熟度(数据治理、管道建设)比选择何种炫酷的AI模型更为基础和关键?企业应如何重新分配在“数据准备”与“AI模型采购/开发”上的投入与期望?
阅读 Technology Review 的原文,点击链接。