Logistic分类函数

来源：互联网发布：miui8降级miui7数据编辑：程序博客网时间：2024/05/29 15:47

Logistic分类函数

这部分教程将介绍两部分：

Logistic函数
交叉熵损失函数

如果我们利用神经网络进行分类，对于二分类问题，t=1或者t=0，我们能在logistic回归中使用logistic函数。对于多分类问题，我们使用softmax函数来处理多项式logistic回归。本教程我们先解释有关logistic函数的知识，后续教程会介绍softmax函数的知识。

我们先导入教程需要使用的软件包。

from __future__ import print_functionimport numpy as npimport matplotlib.pyplot as plt

Logistic函数

假设我们的目标是根据输入的z去预测分类t。概率方程P(t=1|z)表示输出y根据logisitc函数y=σ(z)得到的值。σ被定义为：

logistic函数

根据函数分类的概率t=1或者t=0，我们能得到以下公式：

概率方程

注意一下，其实z就是P(t=1|z)与P(t=0|z)的比值求对数。

比值比

logistic函数在下面的代码中logistic(z)实现，并且可视化了logistic函数。

# Define the logistic functiondef logistic(z):  return 1 / (1 + np.exp(-z))

# Plot the logistic functionz = np.linspace(-6,6,100)plt.plot(z, logistic(z), 'b-')plt.xlabel('$z$', fontsize=15)plt.ylabel('$\sigma(z)$', fontsize=15)plt.title('logistic function')plt.grid()plt.show()

logistic函数

Logistic函数求导

因为神经网络一般使用梯度下降来优化，所以我们需要先求出y对于z的倒数，即∂y/∂z可以表示为：

梯度推导

因为1−σ(z))=1−1/(1+e^−z)=e−z/(1+e^−z)，所以我们又可以把上式简化为：

梯度推导

logistic_derivative(z)函数实现了Logistic函数的求导。

# Define the logistic functiondef logistic_derivative(z):  return logistic(z) * (1 - logistic(z))

# Plot the derivative of the logistic functionz = np.linspace(-6,6,100)plt.plot(z, logistic_derivative(z), 'r-')plt.xlabel('$z$', fontsize=15)plt.ylabel('$\\frac{\\partial \\sigma(z)}{\\partial z}$', fontsize=15)plt.title('derivative of the logistic function')plt.grid()plt.show()