足球鹰眼技术的原理?

黎昕萌黎昕萌最佳答案最佳答案

谢邀! 最近关于AI和足球的问题很多,索性把以前写的这篇文重新发一下,希望对大家有所帮助(由于时间久远,可能部分图像数据会有所缺失) 对于大部分非专业人士来说,“深度学习”似乎是个很玄妙的词,听起来很高大上,但实际上又不太能理解其内涵。为了让各位看官老爷明白这到底是一个怎样的流程,我们先简单介绍一下机器学习领域的另一个概念——“伪随机数生成”。

什么是伪随机数生成? 简单来说就是:你不可能预测到这个随机数序列的下一位数字是什么,但你可以通过某种算法来得到下一个数字。以扑克牌为例,假如你需要猜测下一手出牌是什么,那么你的策略要么是在已有的出牌记录里总结(比如过去十次我出了A,下次我大概率也会出A),或者是假设每一手牌都是独立事件(下一手我不一定出A)并通过电脑模拟无数种情况来计算概率。前一种方法是基于历史数据的统计分析,后一种方法则是利用了随机数发生器的机制。

当然,真实的情况要比这个复杂的多,因为要引入模型的参数、参数的先验分布以及计算误差等等,但这已经足够让各位理解“伪随机数生成”是怎么一回事了。 接下来我们聊一聊如何将这个伪随机数产生器运用到足球比赛的视频分析当中。

首先我们需要收集大量的足球比赛视频,然后对视频进行切分(即切分出每一个片段),再标注每一片段的发生时间(以帧为单位)以及每个时间点上的动作(球员姓名+动作类型),最后我们将这些剪辑按照时间顺序排列并输入到我们的计算机当中。此时计算机的每一秒钟都在做一件事:从视频片段中抽出一个画面,然后用随机数发生器产生一个数字,用这个数字在训练集里查找相应的动作,然后将这个动作返回给人类审核员进行审核(为了避免机检导致的错误,我们采用双检的方式,即同一个镜头两次检测到相同动作才认定该动作有效)。

经过大量视频的标注与学习,当计算机遇到新的视频时,它可以自动检测并识别其中的动作(当然,现在人们越来越注重短视频的分析,因此如何高效切分视频并定位关键动作是现阶段的一个研究热点)。 如果我们继续深入探究这个过程,就会发现其实这里运用了机器学习领域里的两个分支——“分类”和“聚类”。 分类问题的核心在于通过学习建立模型,然后用模型对新数据进行归类;而聚类问题则是将数据根据相似性自行聚集在一起。在我们这个场景下,每一帧的画面都可以看作是一个样本,每一样本的动作类型就是该样本的类别;把无数个样本聚合在一起就形成了聚类。通过对单个视频的大量采样并且结合随机数发生器的机制,我们可以实现对未知视频的数据挖掘。

我来回答
请发表正能量的言论,文明评论!