libsvm实例子

来源：互联网发布：max 无法录入数据编辑：程序博客网时间：2024/04/28 16:55

实际应用的小贴士

=======================

* 缩放数据。例如，缩放每个属性为 [0，1] 或 [-1，+1]。

* 对于 C-SVC，可以考虑用 ‘tools’ 文件夹下的模型选择工具。

* nu-SVC/one-class-SVM/nu-SVR 中的 nu 参数近似为训练误差和支持向量的比率。

* 如果要分类的数据是不平衡的（如，大正集和小负集），用 -wi 尝试不同的惩罚因子（参见下述例子）。

* 对于复杂问题，指定更大的缓存（即，larger -m）。

例子
=======================

> svm-scale -l -1 -u 1 -s range train > train.scale

> svm-scale -r range test > test.scale
缩放训练数据的每个特征值在 [-1，1] 内（训练数据文件为 train，缩放后的数据为 train.scale），缩放因子（就是一些参数）被存储在 range 文件中然后被用于缩放测试数据（测试数据文件为test，缩放后的数据为test.scale）。

> svm-train -s 0 -c 5 -t 2 -g 0.5 -e 0.1 data_file
用 RBF核函数 exp(-0.5|u-v|^2) 训练（data_file文件）得到一个分类器，C=10，终止允差为0.1。

> svm-train -s 3 -p 0.1 -t 0 data_file
用线性核函数 u'v 解决 SVM 回归（问题），损失函数中 epsilon=0.1。

> svm-train -c 10 -w1 1 -w2 5 -w4 2 data_file

训练一个分类器，对于 ‘1’ 类惩罚因子为 10= 1 * 10，对于 ‘2’ 类惩罚因子为 50 = 5 * 10，对于 ‘4’ 类惩罚因子为 20 = 2 * 10。

> svm-train -s 0 -c 100 -g 0.1 -v 5 data_file

对分类器用参数 C=100，gamma=0.1 做五折交叉验证。

> svm-train -s 0 -b 1 data_file

> svm-predict -b 1 test_file data_file.model output_file

用概率信息得到一个模型。用概率估计来预测测试数据。

自定义核函数
=======================

用户可以自定义核函数的值并输入它们作为训练和测试文件。之后 libsvm 不需要原始的训练和测试集。

假定有 L 个训练实体 x1, ..., xL。以 K(x, y) 做核函数中两个实体 x，y 的值，输入格式如下：

新训练实例 xi：

<label> 0:i 1:K(xi,x1) ... L:K(xi,xL)

新测试实例任意 x:

<label> 0:? 1:K(x,x1) ... L:K(x,xL)

即，在训练文件中，第一列必须是 xi 的‘ID’。在测试中，用 ? 作为任意值。

所有核函数值包括 ZEROs 必须是明确提供的。训练和测试文件中任何随机的或排列的子集也有效（见下例）。

注意：格式与以前在 libsvmtools（文件夹）中发布的预定义核函数略有不同。

例子:

假定最初的训练数据有三个 4-feature 的实例，测试数据有一个实例：

15 1:1 2:1 3:1 4:1

45 2:3 4:3

25 3:1

15 1:1 3:1

如果用线性核函数，我们将得到如下新的训练和测试子集：

15 0:1 1:4 2:6 3:1

45 0:2 1:6 2:18 3:0

25 0:3 1:1 2:0 3:1

15 0:? 1:2 2:0 3:1

? 可为任何值。

上面的训练文件的任何子集也是有效的。如，

25 0:3 1:1 2:0 3:1

45 0:2 1:6 2:18 3:0

意味着核矩阵为：

[K(2,2) K(2,3)] = [18 0]

[K(3,2) K(3,3)] = [ 0 1]

0 0