SVM的英文全称Support Vector Mahine,中文为支持向量机。可以用来处理离散型变量的分类和连续因变量的预测,是一种有监督的机器学习算法。其核心是要找到一个满足条件的“分割平面”,实现不同维度空间下对数据的分割。它是一维空间里的一个点,二维空间的一条直线,三维空间里的一个平面。如果能在对应的维度空间里,找到合适的“平面”,把两组数据完全分开。则称这样的数据线性可分。以二维空间距离,线性不可分是指找不到一条直线能后讲两组数据区分开来,我们通过一个核函数,将数据映射到三维空间,这是可以找到一个平面完全切割着两组数据,这个平面在二维平面上显示的是一条曲线。先升维,再降维处理。如下是数据线性不可分的示例。常用的核函数用四种:线性核函数、多项式核函数、高斯核函数、Sigmoid核函数。当我们的数据线性不可分的时候,除了升维度进行处理,还有一种方法是允许少量的点存在于超平面的错误一侧。使用软间隔,区别于数据线性可分的硬间隔,允许部分样本违反约束。
# 分类器from sklearn.svm import SVC, LinearSVC, NuSVC# 回归器from sklearn.svm import SVR, LinearSVR
我的一天就是一辈子的缩影,所以我今天开心了就是一辈子开心了。