海鹰队是如何利用数据湖来改进比赛的

post-thumb

在荷兰长大,美式足球对我来说基本上是一个陌生的概念。我对足球的看法是美丽的游戏或者像大多数美国人知道的那样,足球。足球,足球,足球,或者随便你叫它什么,将永远是我深爱的东西,特别是我的家乡球队,阿贾克斯。

当我加入亚马逊,西雅图成为我的新家时,我开始看到我的同事们对美式足球也有同样的热情,尤其是当地球队西雅图海鹰队(Seattle Seahawks)被称为“the 12”的狂热球迷。当我开始更好地理解这个版本的足球时,我很容易对比赛和幕后发生的事情感到兴奋。教练组、决策者,甚至广播员都在利用数据进行实时决策,每支队伍都在不断努力,以获得哪怕是对对手的一点点优势。

关于足球,我发现最有趣的一件事是技术的发展如何影响足球的发展。在我看来,海鹰队是最好的例子之一,他们一直在采用新技术的前沿,如机器学习(ML)、物联网(IoT)和无服务器架构,从球员的安全到球场上的性能进行改进。

但所有这些技术都是从数据开始的。这就是为什么去年海鹰队选择AWS作为其官方云合作伙伴并与AWS合作构建了一个数据湖,这是一个集中式存储库,允许组织在任何规模上存储、管理、发现和共享所有结构化和非结构化数据。

海鹰采用了一种无服务器的架构,采用了Amazon S3、AWS Lambda、AWS Fargate、AWS Step Functionbetway88体育官网s和AWS Glue等解决方案来构建他们的数据湖和输入管道。他们的数据来源于各种本地和第三方数据源,如NFL Next Gen Stats(由AWS提供支持)、Pro Football Focus(也由AWS提供支持)、来自物联网传感器的球员遥测数据,以及基于第三方应用程序的标记比赛。

有了这个数据湖,海鹰队希望能够提高人才评估和获取,球员健康和恢复时间,以及比赛计划。让我们仔细看看这三个领域,技术如何促进改进,以及海鹰数据湖背后的架构。

人才评估和获取

历史上,足球队评估潜在球员的方式是让球探尽可能多地去看比赛并仔细研究录像。显然,这种方法有局限性——例如,评估可能不客观,而且非常耗时。

这就是海鹰队在传统球探的基础上添加AWS分析来评估球员的原因。首先,他们收集关于球员的数据,比如球员来自的学校的规模,他们所扮演的位置,以及他们在大学球队中扮演的角色。然后,他们收集海鹰队的数据,比如他们自己的比赛风格、球队目前的球员等等,并使用ML模型来评估该球员是否合适。

在选秀过程中,海鹰队可能会使用这种分析,将一名球员排在比其他球队更高的位置,这样他们就可以在选秀过程中降低球员的排名,同时仍然为球队选择合适的球员,同时获得更多选秀权。这种模式在自由球员市场也有帮助,海鹰队签下了一名能为球队创造最大价值的球员,从而在不超出NFL工资帽的情况下产生最大影响。

除了有正确的数据来做出这些重要的决定,海鹰还有一个仪表板,使信息易于理解和采取行动。图1给出了海鹰在为2020年草案做准备时使用的分析仪表板类型的示例。

*图1:海鹰2020草案数据快照*

玩家的生命值和恢复时间

对海鹰队来说,没有什么比球员的健康和安全更重要的了。这就是为什么他们在医疗人员、力量和体能训练以及团队中每个人的营养上投入巨资的原因。数据在做出与玩家健康相关的决定时也扮演着重要角色。

每个玩家都接受了初始基线健康评估。然后,海鹰队会不断收集球员的信息,比如他们的运动水平、练习中重复次数的趋势、爆发力的动作、锻炼的频率等等。跟踪这些数据可以让海鹰队最大限度地提高球员的收益,减少软组织损伤,并更好地了解他们从训练到比赛的负荷。他们还利用这些数据来制定独特的训练计划,以优化不同球员必威体育精装版app官网的运动天赋,帮助球员达到目标,并最大限度地发挥他们的表现。

以前,海鹰将这些数据放在分段的数据桶中,这使得解析信息很困难。我们很难获得一个玩家生命值的完整视图。现在,有了AWS上的数据湖,这些信息可以很容易地在一个地方获取。更重要的是,海鹰队可以实时评估球员的健康状况,帮助他们做出明智的决定,比如在受伤发生之前。

游戏策划

比赛日是足球迷的生活。但大多数人没有意识到的是,一个体育组织需要花费数百个小时来准备一支球队每周在球场上的60分钟。视频分析是游戏规划过程中非常重要的一项任务。

每个团队都记录下自己一周的练习,然后在电影室会议期间将其分解。海鹰队与亚马逊机器学习解决方案实验室合作,建立自定义ML模型,自动识别场上的球员和比赛类型。使用这些ML模型,海鹰计划将视频分析中的许多手动过程自动化。

这种类型的视频分析也可以被玩家分解。回想一下天才的获取,海鹰队的数据科学家可以从球员的职业生涯中获取数据,看看他们最成功的是什么,这可以帮助球员融入特定的计划,并更快地最大化他们的结果。例如,通过观察一个球员的特点,它可能会显示出他将是一个伟大的表演者,即使当他被放在一个他可能没有很多经验的位置。

真正酷的是海鹰组织可以为很多不同的目的提取相同的数据。该团队正在真正利用aws中的各种服务和功能——从机器学习到人工智能,到数据库、分析、存储等等。

海鹰数据湖架构

通过思考上面的用例,很容易看出数据湖是正确的技术解决方案。AWS提供了大量的服务和技术,是构建云数据湖的理想选择。

图2:海鹰数据湖架构

AWS Lambda函数通过启动AWS Step函数来按照预定义的计划初始化数据的摄入。Step Functions通过管理状态、检查点,并尝试确保输入流程按照预期的顺序执行,从而从开始到结束协调输入工作流。

作为这个工作流的一部分,AWS Step Functions在AWS Fargate上旋转独立的docker映像,以查询第三方源API并将数据复制到S3桶中。Fargate为每个容器分配正确的计算量,消除了选择实例和手动扩展集群容量的需要。因为Fargate是无服务器的,所以它允许Seahawks避免扩展、打补丁、保护和管理服务器的操作开销。

在数据被输入到S3桶之后,Amazon Glue抓取数据并使用预构建的分类器构造一个data Catalog。通过在Glue上维护最新的数据目录,Seahawks可以在不移动数据的情况下快速发现和搜索多个AWS数据集。

*图3:第三方api的数据摄取管道

除了第三方api外,Seahawks还需要从内部的关系数据库和数据仓库中获取数据。AWS数据库迁移服务允许他们在将数据加载到Amazon Redshift之前,轻松且安全地将数据从各种源数据库和数据仓库中提取出来,并将其加载到S3中。这使得数据可以在ML和其他用例的数据湖中使用,同时确保用于分析查询的数据可以有效地加载到Amazon Redshift。

*图4:本地数据源的数据摄取管道*

如果在输入工作流中有任何失败,底层API调用将被记录到AWS CloudWatch Logs中。然后,AWS Step Functions将使用Amazon Simple Notification Service通过电子邮件通知海鹰数据分析团队故障。

把它们放在一起

自从去年宣布AWS是海鹰官方云提供商以来,海鹰数据湖已经运行了7个月,他们已经看到了其人才评估和收购、玩家健康和恢复时间以及游戏规划的价值。

虽然美式足球是我见过的最激动人心、最具体育性的运动之一,但这项运动每年都给我留下深刻印象的是当今在这项运动中发挥作用的洞察力、数据和技术。一支像西雅图海鹰队这样成功的足球队不仅需要像拉塞尔·威尔逊这样的MVP候选人在场上,还需要一支强大的技术专家团队和一些世界上最好的技术,在幕后共同努力,在这样的联赛中获胜。海鹰队本赛季的表现——6胜3负,在NFC西部并列第一——得到了每一场比赛日精心准备的帮助,其中一些直接来自这个数据湖。我知道整个足球组织需要很多人才能让一支球队进入超级碗,AWS很自豪能在海鹰队的成功中扮演一个小角色,无论是现在还是将来。

评论由Disqus