支持向量分类实用指南

说明:本文翻译总结自 Chih-Wei Hsu等的论文 A Practical Guide to Support Vector Classification. 该论文也是libsvm的指导教程,在libsvm的homepage上可以下载阅读。

1 Introduction

  • SVM在数据分类上是很有用的工具。
  • 虽然它比神经网络更易于使用,但不熟悉的使用者在第一次使用时往往得不到好的结果。
  • 一个分类任务需要把数据分成训练集和测试集。
  • 给出训练集的样本对\( (x_i,y_i),i = 1, ...,l , x \in R^n, y \in {1, -1}^l \) 求解最优化问题: \( \min \limits _{ w,b,\xi } { 1 \over 2 } { W^T W + C \sum \limits _{i = 1}^l \xi_i } \) \( \quad subject \ to \quad y_i (W^T\phi(X_i)+b) \ge 1-\xi_i , \xi_i \ge 0\)
  • 四种基本核函数:
    • 线性: \( K (X_i, X_j) = X_i ^TX_j \)
    • 多项式: \( K (X_i,X_j) = (\gamma X_i^TX_j + r)^d , \gamma > 0\)
    • 径向基函数(RBF): \( K(X_i, X_j) = e^{-\gamma||X_i - X_j||^2}, \gamma > 0 \)
    • sigmoid: \(K(X_i,X_j) = tanh(\gamma X_i^TX_j +r) \)

Continue reading "支持向量分类实用指南"

支持向量分类实用指南