诱导式深度学习的动作识别方法:利用相机获取用于动作识别的视频序列,对视频序列进行预处理,得到一种或多种不同特性的信息源序列,选择一种或多种类型的特征,构建提取所选类型特征的深度学习网络,将信息源序列输入深度学习网络中提取特征,得到视频序列的动作类型,将特征流输入深度学习网络架构中进行动作识别。
创见与创新:
选择了多种特征源,使深度学习网络能够提取出更多具有良好区分性的特征,使得整个系统具有更好的辨识能力。
每类特征都有自身的优势,反应了目标的不同特性,适用于不同的应用场合,依据领域知识,设计了多种不同的特征类型,让深度学习网络能够获取更多、更合适的特征,并进行融合,有助于提升识别的效果,适应更多的场景。
对视频序列流进行预处理,使深度学习能够获得更加准确和可靠的信息,加快深度学习的速度,提高识别率。
根据应用场景,有针对性的去解决问题,考虑关节点的权重问题,采用带全局时空注意力模型的LSTM结构进行识别。
由于每一种深度学习方法都有其自身的特色,适用于处理特定的问题,因此,在面向实际问题的时候,根据不同的目的选择合适的结构,如CNN比较适合处理图像相关的问题,LSTM比较适合处理连续序列相关的问题。因此,产品自主设计深度学习网络结构,提高深度学习的性能。