跳转至

LHPE

论文阅读记录

  • 作者认为现有存在的问题
    • Pooling操作可以保持目标识别过程中的转换不变性,但是对于姿态估计的坐标会产生空间位置信息损失,降低预测坐标的精度
    • 直接从输入空间到关节位置的坐标系数映射是一个高度非线性的过程,且不存在一对一的关系
  • 作者思路
    • 利用多个独立的卷积网络执行身体部位的二分类任务
    • 利用滑窗的方式预测该局部区域是否存在对应身体部位,得到响应图反映了身体部位在各个区域的置信度
      • 优点:可以使用更小的卷积网络,保留了池化的优势
      • 缺点:需要为每一个部件单独保存一组模型参数