知识向量机
1.支持向量机是什么东西
支持向量机(SVM)是数据挖掘中的一个新方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,因此可应用于理科、工科和管理等多种学科。
目前国际上支持向量机在理论研究和实际应用两方面都正处于飞速发展阶段。它广泛的应用于统计分类以及回归分析中. 支持向量机属于一般化线性分类器.他们也可以认为是提克洛夫规则化(Tikhonov Regularization)方法的一个特例.这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区.因此支持向量机也被称为最大边缘区分类器.。
2.向量机是什么
向量机vector machine是向量计算机的简称。
词霸
vector machine
词性及解释
【计】 向量机, 向量计算机
向加工向量机 这种机器采用向量全长的纵向加工方式,每执行一个向量运算都要从头至尾执行全部分量的运算,操作数或结果向量都直接取自主存或写入主存。主存的数据传输率须按运算部件速度的3~4倍来配置。纵向加工向量机设置交叉访问的、数量众多的存储体和很宽的数据通路,并以超长字为单位进行访问,以便满足要求。这样,就使成本高、主存系统灵活性差,难以实现对繁多的主存向量的高效存取。此外,向量运算的起步时间长,短向量运算速度下降幅度大。
纵横加工向量机 这种机器采用向量分段纵横加工方式,并设置有小容量高速度的多个向量运算寄存器。计算向量运算表达式时,每个向量运算每次只执行一段分量。从主存取出的操作数向量和运算产生的中间结果向量,可以逐段存放在向量寄存器中,运算部件主要访问向量寄存器组。这样,就能保证运算部件进行高速运算,同时又能减轻主存的负担,使对主存数据传输率的要求比纵向加工下降70%左右。美国的CRAY-1机和中国的757机都属于这种型式。
软件与应用 向量机一般配有向量汇编和向量高级语言,供用户编制能发挥具体向量机速度潜力的向量程序。只有研制和采用向量型并行算法,使程序中包含的向量运算越多、向量越长,运算速度才会越高。面向各种应用领域的向量的建立,能方便用户使用和提高向量机的解题效率。向量识别程序是中新开发的一部分,用于编译时自动识别采用通常串行算法的源程序中的向量运算成分,并编译成相应的向量运算目标程序,以提高向量机计算大量现存非向量程序的计算速度。向量识别技术还有待进一步发展和完善,以提高识别水平。
向量计算机的发展方向是多向量机系统或细胞结构向量机。实现前者须在软件和算法上取得进展,解决如任务划分和分派等许多难题;后者则须采用适当的,用硬件自动解决因用户将分散的主存当作集中式的共存使用而带来的矛盾,才能构成虚共存的细胞结构向量机。它既具有阵列机在结构上易于扩大并行台数以提高速度的优点,又有向量机使用方便的优点。
参考书目
高庆狮著:《数字计算机系统功能设计导引Ⅱ向量巨型机》,科学出版社,北京,1983
3.支持向量机请通俗介绍 高中文化
超级通俗的解释:
支持向量机是用来解决分类问题的。
先考虑最简单的情况,豌豆和米粒,用晒子很快可以分开,小颗粒漏下去,大颗粒保留。
用一个函数来表示就是当直径d大于某个值D,就判定为豌豆,小于某个值就是米粒。
d>D, 豌豆
d<D,米粒
在数轴上就是在d左边就是米粒,右边就是绿豆,这是一维的情况。
但是实际问题没这么简单,考虑的问题不单单是尺寸,一个花的两个品种,怎么分类?
假设决定他们分类的有两个属性,花瓣尺寸和颜色。单独用一个属性来分类,像刚才分米粒那样,就不行了。这个时候我们设置两个值 尺寸x和颜色y.
我们把所有的数据都丢到x-y平面上作为点,按道理如果只有这两个属性决定了两个品种,数据肯定会按两类聚集在这个二维平面上。
我们只要找到一条直线,把这两类划分开来,分类就很容易了,以后遇到一个数据,就丢进这个平面,看在直线的哪一边,就是哪一类。
比如x+y-2=0这条直线,我们把数据(x,y)代入,只要认为x+y-2>0的就是A类,x+y-2<0的就是B类。
以此类推,还有三维的,四维的,N维的 属性的分类,这样构造的也许就不是直线,而是平面,超平面。
一个三维的函数分类 :x+y+z-2=0,这就是个分类的平面了。
有时候,分类的那条线不一定是直线,还有可能是曲线,我们通过某些函数来转换,就可以转化成刚才的哪种多维的分类问题,这个就是核函数的思想。
例如:分类的函数是个圆形x^2+y^2-4=0。这个时候令x^2=a; y^2=b,还不就变成了a+b-4=0 这种直线问题了。
这就是支持向量机的思想。
机的意思就是 算法,机器学习领域里面常常用“机”这个字表示算法
支持向量意思就是 数据集种的某些点,位置比较特殊,比如刚才提到的x+y-2=0这条直线,直线上面区域x+y-2>0的全是A类,下面的x+y-2<0的全是B类,我们找这条直线的时候,一般就看聚集在一起的两类数据,他们各自的最边缘位置的点,也就是最靠近划分直线的那几个点,而其他点对这条直线的最终位置的确定起不了作用,所以我姑且叫这些点叫“支持点”(意思就是有用的点),但是在数学上,没这种说法,数学里的点,又可以叫向量,比如二维点(x,y)就是二维向量,三维度的就是三维向量( x,y,z)。所以 “支持点”改叫“支持向量”,听起来比较专业,NB。
所以就是 支持向量机 了。
4.支持向量机是什么意思
试读结束,如需阅读或下载,请点击购买> 原发布者:陈晓宇 支持向量机支持向量机VC维在有限的训练样本情况下,当样本数n固定时,此时学习机器的VC维越高学习机器的复杂性越高。
VC维反映了函数集的学习能力,VC维越大则学习机器越复杂(容量越大)。所谓的结构风险最小化就是在保证分类精度(经验风险)的同时,降低学习机器的VC维,可以使学习机器在整个样本集上的期望风险得到控制。
支持向量机支持向量机-SVM(SupportVectorMachine)一种分类技术解决小样本、非线性和高维模式识别问题表现出许多特有的优势,并在很大程度上克服了“维数灾难”和“过学习”等问题。应用于文本识别、手写字体识别、人脸图像识别、基因分类挤时间序列预测等。
SVM以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法。SVM所使用训练实例的一个子集来表示决策边界,该子集称为支持向量;支持向量机—超平面样本A:样本B:上图显示了一个数据集,包含A,B两个不同类的样本,分别用方块和圆圈表示。
这个数据集是线性可分得,即可以找到这样一个超平面,使得所有的方块位于该超平面的一侧,而所有的圆圈位于它另一侧;并由图可以看出存在无数个那样的超平面。B2b21。
..b22支持向量机—最大边缘超平面如左图所示。
B1,B2这两个决策边界都能准确无误的将训练样本划分到各自的类中。每个决策边界都对应着一对超平。
5.支持向量机 这个名字是怎么来的
支持向量机SVM(Support Vector Machine)作为一种可训练的机器学习方法,依靠小样本学习后的模型参数进行导航星提取,可以得到分布均匀且恒星数量大为减少的导航星表 基本情况 Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则。其原理也从线svm 产品
性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(Support Vector Machine,简称SVM)。支持向量机的提出有很深的理论背景。 支持向量机方法是在近年来提出的一种新方法。 SVM的主要思想可以概括为两点: (1) 它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而 使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;(2) 它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全svm 系列产品
局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。 在学习这种方法时,首先要弄清楚这种方法考虑问题的特点,这就要从线性可分的最简单情况讨论起,在没有弄懂其原理之前,不要急于学习线性不可分等较复杂的情况,支持向量机在设计时,需要用到条件极值问题的求解,因此需用拉格朗日乘子理论,但对多数人来说,以前学到的或常用的是约束条件为等式表示的方式,但在此要用到以不等式作为必须满足的条件,此时只要了解拉格朗日理论的有关结论就行。