旷视科技（Face++）面经

来源：互联网发布：centos 安装 apt get 编辑：程序博客网时间：2024/04/28 13:46

一面：

介绍一下项目（你参与度最高的）

问：Pooling知道吧？我们在做cv的时候，图像经常是不同size的，我们在训练的时候经常通过crop图片取得同size的输入数据。但是训练的时候，输入是整张图，【这样会造成什么后果呢？】用没有什么办法可以解决这个问题呢？即测试的时候如何有效利用整张图的信息？

答：测试的时候也crop,每个croped图片有一个预测结果，通过投票的形式得到最后结果。

问：因为crop是overlapping的，这种方式会造成在部分图片区域上的重复卷积，增加计算复杂度，有没有办法解决这个问题？

答：在卷积输出层，也就是fc层前进行crop（但是网络结构不能改变）

问：怎么做呢？举个例子，原来是8x8x128的卷积输出层，换成全图之后，是10x12x128的卷积层，怎么连接到fc1层（假设是20维的）？

答：（在提示下）用20x8x8x128(n,c,h,w)的卷积核对10x12x128的map进行(s=1,p=0)的卷积，其实就相当于crop，得到fc1为20x3x5（c,h,w）的输出

问：但是此时fc1层改变了（从20编程20x3x5）， fc2层与之的连接也就失效了, 怎么解决？

答：（在各种提示下，提醒：搞DeepLearning的，卷积计算一定要熟练啊）用5x20x1x1的卷积核再操作，得到5x3x5的（这里卡住了）输出结果

要得到一个五维的输出向量，对3x5区域做一个平均就可以了（每个channel是3x5=15个结果，即对卷积层输出卷积操作得到3x5个不同feature预测的结果，就是15个crop对应的结果）

问：为什么选InceptionV3？

答：实现方便，top1正确率和其他比较新的模型差不多

问：有看过他们的输入么？inception用的是299x299， resnet用的是224x224,大size的一般都要比较好，所以Inception好是正常的，但是输入不一样，不能直接比

这个东西叫FCN测试，可以看看

编程题：

一维pooling（先avg后max），考虑时间复杂度和算法复杂度

暴力循环，时间复杂度nk

用前一次循环的结果，时间复杂度 n

二面：

问：介绍一下研究背景？

答：研究背景？

问：都做过哪些研究？

答：哦哦从大四毕设讲起

问：你这个双目匹配讲一下，你做了啥？

答：。。。。恩恩，我现在在做这个视差，用patchmatch

问：深度和视差的关系是什么？推导一下

答：卡主，是通过相似三角形的关系，

问：相似三角形在哪里？

答:（画半天。。。。）提示下做出==太久没做了，忘了

问：那其他项目，风险预测这个项目，特征是几维的，

讲一下SVM，SVM的原理？

答：最大间隔

问：最大间隔是什么，SVM的损失函数具体形式？SVM的参数和超参数？

编程：

递归输出下列长度为2^n的矩阵（每个矩阵由四部分组成），矩阵满足以下条件：

右下角部分全为0，其他部分等于上一阶段的矩阵

N=0, 1

N=1, 1 1

1 0

N=2, 1 1 1 1

1 0 1 0

1 1 0 0

1 0 0 0

三面：

说一个你自以为最突出的点（假设现在有10个候选人，我为什么选你）

说一个你没有写在简历里的优点

（xx项目，做到了72%的准确率）这个问题的极限解有多高？评估你最好能把这个问题做到什么程度?

就是让你说一下可以改进的点，改进的投入是多少？reward有多少？

把reward量化出来（可以提升几个百分点的accuracy?）

（其实就是想问你的改进方案，以及改进之后带来的提升，结果自己一直纠结在如何量化提升的百分点上==）

【有的时候我们可以估计，有的时候我们还是得估计，从解决问题的开始阶段就要评估，看看我们究竟能做到什么程度】

问题：

a，b ~i.i.d~ U(0, 1)

求E(max（a, b）)

用几何思想求解

阅读全文

0 0