Octree-based convolutional neural network summary

来源:互联网 发布:导航仪软件 编辑:程序博客网 时间:2024/06/03 05:32
  1. 在3D shape的分类、检索、分割等应用中,使用神经网络面临的一大挑战是3D shape的不规则性。
  2. 已有的应有:
    • 使用3D object在多个特定角度下的投影,作为输入,使用神经网络进行处理
    • 使用voxel-based 的方法,每一个三维cube都使用binary 表示是否为3D object的一部分,这样就解决了 irregularity的问题。
    • 使用geometry image的方法,将3D object 参数化到二维平面,GI作为网络输入即可。
  3. 本文中,同样使用八叉树这种数据结构,来构建神经网络中不同layer之间的联系。
    1. 具体而言,将3D object存储在八叉树中后,各个不同的3D object对应的叶节点并不相同,在本文实现中,将空叶节点上的法向量等property置为0, 以此保证输入结构的统一性。
    2. 此外使用Label 数组来记录不同layer 间父子节点对应的关系。在进行convolution、pooling等操作时,将前一层的结果 对应于 后一层的输入,同时,其对应关系与 octree 相对应。所以,步长stride的大小、pooling的kernel大小等应当为2的幂,因为,对应于octree的各层关系。
    3. 二维下:
      这里写图片描述
      ————
      这里写图片描述
阅读全文
1 0
原创粉丝点击