卷积神经网络源码——最终输出部分的理解

来源：互联网发布：金马网络服装批发城编辑：程序博客网时间：2024/06/06 09:21

　　针对matlab版本的卷积神经网络的最终分类器（输出部分)的理解：
　　部分代码：

    '''cnnff'''    net.fv = []; % 把最后一层得到的特征map拉成一条向量，作为最终提取到的特征向量      for j = 1 : numel(net.layers{n-1}.a) % 最后一层的特征map的个数         sa = size(net.layers{n-1}.a{j});   %得到几行几列的数        % 将所有的特征map拉成一条列向量。还有一维就是对应的样本索引。每个样本一列，每列为对应的特征向量          net.fv = [net.fv; reshape(net.layers{n-1}.a{j}, sa(1) * sa(2), sa(3))];    end;    %  feedforward into output perceptrons    if strcmp(net.layers{n}.objective, 'sigm')         % 计算网络的最终输出值        net.o = sigm(net.ffW * net.fv + repmat(net.ffb, 1, size(net.fv, 2)));    '''cnntest'''    net = cnnff(net, x);  %前向传播得到输出    % [Y,I] = max(X) returns the indices of the maximum values in vector I       [~, h] = max(net.o);   % 找到最大的输出对应的标签     [~, a] = max(y);  % 找到最大的期望输出对应的索引     bad = find(h ~= a); % 找到他们不相同的个数，也就是错误的次数      er = numel(bad) / size(y, 2);

　　拿MNIST手写体的十种分类来举例, 单纯的提取出CNN输出特征向量的最大值在向量里的位置，位置对应于10个数字0~9
　　如向量L1=[0 0.9 0.1 0.2 0 0 0 0 0 0 ],　0.9最大，在第二个位置，分类到数字1的类中。
　　如向量L2=[0 0.5 0.1 0.2 0 0 0 0 0 0.8 ],　0.8最大，在第十个位置，分类到数字9的类中。
　　说明：为什么第二个位置就代表数字1这一类呢，这和标签有关，这里面标签的设定不是1,2,3,4,5…；而是[1,0,0,0,…]，1代表表示哪一类。
　　当然也可以进行其他分类器设计，CNN的主要任务是进行特征提取，对应分类器设计没有要求。

0 0