利用BPNN程序设计自己的学习训练队列，java版源码

来源：互联网发布：linux 启动ntp 编辑：程序博客网时间：2024/06/12 22:30

关于机器学习和人工智能的原理本文不做介绍，请自行百度资料，例如：http://baike.baidu.com/link?url=LrZmiGtDHhABKj1lbg398UHYjC1bzYG847URvtbJXwq6WgS7dszcx7gCoHCpqQYQXNxW4bzNRy1hFn6RSrY_snqhEGW3XDjiUSm2uZ9tLicEJDWrgNX-aKY0LDqVhvhrNpbcmotSkrL7t5y3H0Endq。

以下是java 源码：

package ml;

import java.util.Random;

/**
* BPNN.
*
* @author RenaQiu
*
*/
public class BP {
   /**
   * input vector.
   */
   private final double[] input;
   /**
   * hidden layer.
   */
   private final double[] hidden;
   /**
   * output layer.
   */
   private final double[] output;
   /**
   * target.
   */
   private final double[] target;

   /**
   * delta vector of the hidden layer .
   */
   private final double[] hidDelta;
   /**
   * output layer of the output layer.
   */
   private final double[] optDelta;

   /**
   * learning rate.
   */
   private final double eta;
   /**
   * momentum.
   */
   private final double momentum;

   /**
   * weight matrix from input layer to hidden layer.
   */
   private final double[][] iptHidWeights;
   /**
   * weight matrix from hidden layer to output layer.
   */
   private final double[][] hidOptWeights;

   /**
   * previous weight update.
   */
   private final double[][] iptHidPrevUptWeights;
   /**
   * previous weight update.
   */
   private final double[][] hidOptPrevUptWeights;

   public double optErrSum = 0d;

   public double hidErrSum = 0d;

   private final Random random;

   /**
   * Constructor.
   * <p>
   * <strong>Note:</strong> The capacity of each layer will be the parameter
   * plus 1. The additional unit is used for smoothness.
   * </p>
   *
   * @param inputSize
   * @param hiddenSize
   * @param outputSize
   * @param eta
   * @param momentum
   * @param epoch
   */
   public BP(int inputSize, int hiddenSize, int outputSize, double eta,
           double momentum) {

       input = new double[inputSize + 1];
       hidden = new double[hiddenSize + 1];
       output = new double[outputSize + 1];
       target = new double[outputSize + 1];

       hidDelta = new double[hiddenSize + 1];
       optDelta = new double[outputSize + 1];

       iptHidWeights = new double[inputSize + 1][hiddenSize + 1];
       hidOptWeights = new double[hiddenSize + 1][outputSize + 1];

       random = new Random(19881211);
       randomizeWeights(iptHidWeights);
       randomizeWeights(hidOptWeights);

       iptHidPrevUptWeights = new double[inputSize + 1][hiddenSize + 1];
       hidOptPrevUptWeights = new double[hiddenSize + 1][outputSize + 1];

       this.eta = eta;
       this.momentum = momentum;
   }

   private void randomizeWeights(double[][] matrix) {
       for (int i = 0, len = matrix.length; i != len; i++)
           for (int j = 0, len2 = matrix[i].length; j != len2; j++) {
               double real = random.nextDouble();
               matrix[i][j] = random.nextDouble() > 0.5 ? real : -real;
           }
   }

   /**
   * Constructor with default eta = 0.25 and momentum = 0.3.
   *
   * @param inputSize
   * @param hiddenSize
   * @param outputSize
   * @param epoch
   */
   public BP(int inputSize, int hiddenSize, int outputSize) {
       this(inputSize, hiddenSize, outputSize, 0.25, 0.9);
   }

   /**
   * Entry method. The train data should be a one-dim vector.
   *
   * @param trainData
   * @param target
   */
   public void train(double[] trainData, double[] target) {
       loadInput(trainData);
       loadTarget(target);
       forward();
       calculateDelta();
       adjustWeight();
   }

   /**
   * Test the BPNN.
   *
   * @param inData
   * @return
   */
   public double[] test(double[] inData) {
       if (inData.length != input.length - 1) {
           throw new IllegalArgumentException("Size Do Not Match.");
       }
       System.arraycopy(inData, 0, input, 1, inData.length);
       forward();
       return getNetworkOutput();
   }

   /**
   * Return the output layer.
   *
   * @return
   */
   private double[] getNetworkOutput() {
       int len = output.length;
       double[] temp = new double[len - 1];
       for (int i = 1; i != len; i++)
           temp[i - 1] = output[i];
       return temp;
   }

   /**
   * Load the target data.
   *
   * @param arg
   */
   private void loadTarget(double[] arg) {
       if (arg.length != target.length - 1) {
           throw new IllegalArgumentException("Size Do Not Match.");
       }
       System.arraycopy(arg, 0, target, 1, arg.length);
   }

   /**
   * Load the training data.
   *
   * @param inData
   */
   private void loadInput(double[] inData) {
       if (inData.length != input.length - 1) {
           throw new IllegalArgumentException("Size Do Not Match.");
       }
       System.arraycopy(inData, 0, input, 1, inData.length);
   }

   /**
   * Forward.
   *
   * @param layer0
   * @param layer1
   * @param weight
   */
   private void forward(double[] layer0, double[] layer1, double[][] weight) {
       // threshold unit.
       layer0[0] = 1.0;
       for (int j = 1, len = layer1.length; j != len; ++j) {
           double sum = 0;
           for (int i = 0, len2 = layer0.length; i != len2; ++i)
               sum += weight[i][j] * layer0[i];
           layer1[j] = sigmoid(sum);
       }
   }

   /**
   * Forward.
   */
   private void forward() {
       forward(input, hidden, iptHidWeights);
       forward(hidden, output, hidOptWeights);
   }

   /**
   * Calculate output error.
   */
   private void outputErr() {
       double errSum = 0;
       for (int idx = 1, len = optDelta.length; idx != len; ++idx) {
           double o = output[idx];
           optDelta[idx] = o * (1d - o) * (target[idx] - o);
           errSum += Math.abs(optDelta[idx]);
       }
       optErrSum = errSum;
   }

   /**
   * Calculate hidden errors.
   */
   private void hiddenErr() {
       double errSum = 0;
       for (int j = 1, len = hidDelta.length; j != len; ++j) {
           double o = hidden[j];
           double sum = 0;
           for (int k = 1, len2 = optDelta.length; k != len2; ++k)
               sum += hidOptWeights[j][k] * optDelta[k];
           hidDelta[j] = o * (1d - o) * sum;
           errSum += Math.abs(hidDelta[j]);
       }
       hidErrSum = errSum;
   }

   /**
   * Calculate errors of all layers.
   */
   private void calculateDelta() {
       outputErr();
       hiddenErr();
   }

   /**
   * Adjust the weight matrix.
   *
   * @param delta
   * @param layer
   * @param weight
   * @param prevWeight
   */
   private void adjustWeight(double[] delta, double[] layer,
           double[][] weight, double[][] prevWeight) {

       layer[0] = 1;
       for (int i = 1, len = delta.length; i != len; ++i) {
           for (int j = 0, len2 = layer.length; j != len2; ++j) {
               double newVal = momentum * prevWeight[j][i] + eta * delta[i]
                       * layer[j];
               weight[j][i] += newVal;
               prevWeight[j][i] = newVal;
           }
       }
   }

   /**
   * Adjust all weight matrices.
   */
   private void adjustWeight() {
       adjustWeight(optDelta, hidden, hidOptWeights, hidOptPrevUptWeights);
       adjustWeight(hidDelta, input, iptHidWeights, iptHidPrevUptWeights);
   }

   /**
   * Sigmoid.
   *
   * @param val
   * @return
   */
   private double sigmoid(double val) {
       return 1d / (1d + Math.exp(-val));
   }
}

======================================================================

package ml;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
/**
* 利用神经网络程序学习判断正负奇偶数
*
*
*/
public class Test {

   /**
   * @param args
   * @throws IOException
   */
   public static void main(String[] args) throws IOException {
       BP bp = new BP(32, 15, 4);

       Random random = new Random();
       List<Integer> list = new ArrayList<Integer>();
       for (int i = 0; i != 1000; i++) {
           int value = random.nextInt();
           list.add(value);
       }

       for (int i = 0; i != 200; i++) {
           for (int value : list) {
               System.out.println(value); // 输入一个随机整数
               double[] binary = new double[32]; // 将整数表示为2进制，存储在double数组中，整数长度为32位，所以数组长度为32
               double[] real = new double[4]; // 结果保存在一个double数组中，一共有4个状态，所以长度为4
               if (value >= 0)
                   if ((value & 1) == 1)
                       real[0] = 1;
                   else
                       real[1] = 1;
               else if ((value & 1) == 1)
                   real[2] = 1;
               else
                   real[3] = 1;

               int index = 31;
               do {
                   binary[index--] = (value & 1);
                   value >>>= 1;
               } while (value != 0);

               bp.train(binary, real);
           }
       }

       System.out.println("训练完毕，下面请输入一个任意数字，神经网络将自动判断它是正数还是复数，奇数还是偶数。");

       while (true) {
           byte[] input = new byte[10];
           System.in.read(input);
           Integer value = Integer.parseInt(new String(input).trim());
           int rawVal = value;
           double[] binary = new double[32];
           int index = 31;
           do {
               binary[index--] = (value & 1);
               value >>>= 1;
           } while (value != 0);

           double[] result = bp.test(binary);

           double max = -Integer.MIN_VALUE;
           int idx = -1;

           for (int i = 0; i != result.length; i++) {
               if (result[i] > max) {
                   max = result[i];
                   idx = i;
               }
           }

           switch (idx) {
           case 0:
               System.out.format("%d是一个正奇数\n", rawVal);
               break;
           case 1:
               System.out.format("%d是一个正偶数\n", rawVal);
               break;
           case 2:
               System.out.format("%d是一个负奇数\n", rawVal);
               break;
           case 3:
               System.out.format("%d是一个负偶数\n", rawVal);
               break;
           }
       }
   }

}

===============================================================

以上的例子只能判断数字的奇偶数和正负数，对我用处不大

下面的例子我将改造训练序列，让程序学会判断7的倍数，希望能抛砖引玉，能启发大家开发更加强大的功能

===============================================================

package ml;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
/**
* 利用神经网络程序学习判断是否为7的倍数
* @author zhouxj
*
*/
public class Test2 {

   /**
   * @param args
   * @throws IOException
   */
   public static void main(String[] args) throws IOException {
       BP bp = new BP(32, 15, 2); //输出结果为2位长度的结果

       Random random = new Random();
       List<Integer> list = new ArrayList<Integer>(); //自己定义训练队列，训练队列设计不好，对后面的结果有较大影响
       list.add(7);
       list.add(14);
       list.add(-14);
       list.add(-7);
       list.add(32);
       list.add(64);
       list.add(392);
       list.add(15);
       list.add(16);
       list.add(17);
       list.add(19);
       list.add(21);
       list.add(22);
       list.add(23);
       list.add(28);
       list.add(29);
       list.add(35);
       list.add(42);
       list.add(49);
       list.add(56);
       list.add(63);
       list.add(70);
       list.add(700);
       list.add(701);
       list.add(7000);
       for (int i = 0; i != 200; i++) {
           int value = random.nextInt()*7;
           list.add(value);
       }


       for (int i = 0; i != 200; i++) {
           for (int value : list) {
               System.out.println(value); // 输入一个随机整数
               double[] binary = new double[32]; // 将整数表示为2进制，存储在double数组中，整数长度为32位，所以数组长度为32
               double[] real = new double[2]; // 结果保存在一个double数组中，一共有2个状态，所以长度为2

               if ((value % 7) == 0)
                   real[0] = 1;
               else
                   real[1] = 1;

               int index = 31;
               do {
                   binary[index--] = (value & 1);
                   value >>>= 1;
               } while (value != 0);

               bp.train(binary, real);
           }
       }

       System.out.println("训练完毕，下面请输入一个任意数字，神经网络将自动判断它是否7倍数。");

       while (true) {
           byte[] input = new byte[10];
           System.in.read(input);
           Integer value = Integer.parseInt(new String(input).trim());
           int rawVal = value;
           double[] binary = new double[32];
           int index = 31;
           do {
               binary[index--] = (value & 1);
               value >>>= 1;
           } while (value != 0);

           double[] result = bp.test(binary);

           double max = -Integer.MIN_VALUE;
           int idx = -1;

           for (int i = 0; i != result.length; i++) {
               if (result[i] > max) {
                   max = result[i];
                   idx = i;
               }
           }

           switch (idx) {
           case 0:
               System.out.format("%d是一个7的倍数\n", rawVal);
               break;
           case 1:
               System.out.format("%d不是7的倍数\n", rawVal);
               break;

           }
       }
   }

}

==================================================================

可能的输出：

训练完毕，下面请输入一个任意数字，神经网络将自动判断它是否7倍数。
14
14是一个7的倍数
15
15不是7的倍数
89
89不是7的倍数
70
70是一个7的倍数
700
700是一个7的倍数
701
701不是7的倍数
7000
7000是一个7的倍数
800
800不是7的倍数
1400
1400是一个7的倍数
1403
1403不是7的倍数
-1414
-1414不是7的倍数
-21
-21是一个7的倍数

结论：训练队列对程序判断结果影响极大，一个好的AI程序需要多调整训练队列，才能提高判断结果的正确率

0 0