VC维举例以及理解

网上看了很多VC维的讲解,但依然云里雾里,我曾听过老师讲过两遍,也搜了很多解释,可能是我理解能力比较差,我始终无法深入明白是什么意思。又由于这个概念(或许)不是特别特别重要的概念,貌似也没有特别影响我做其它的实验以及学习,因为论文中强调这个的并不多,或者说我基本没在论文中见过有人讨论VC维,以至于每次见到即便没搞懂,下完课,吃罢饭我好像就忘了。今天回看统计学习方法时,想到这个概念,便了解了一下。

 

这篇博客并不准备长篇大论的讲各种基本概念,公式,旨在以两个小例子帮助我以后想到这个概念时可以迅速的想起它的意思,同时也给需要了解此知识的同学有所帮助。

 

定义(来自于我老师上课的PPT):可以被H散列的点的最大数量成为H的VC维。

其中H是假设空间,什么是假设空间? 

诸如 H  =  二维空间中的直线

又如 H  =  二维空间中轴平行的矩形

我以这两个假设空间举例来说明他们的VC维是什么?

 

对于空间中三个点,任意三个点,不管怎么摆放,大概也就如下这个样子(暂不考虑直线排列)

如果将这三个点赋于两个类,一共有以下8种情况

我们如果用一条直线去区分这两类,可以很显然的得到,这8种情况都可以被一条直线区分开。

但是如果对于平面中4个点,一共有2的4次方,也就是16种情况,这16种情况中有些情况必定可以被一条直线分开,

但这其中必定有以下这种状况(异或):

这种情况,无论一条直线怎么画都是无法区分开的。

所以:我们认为 H  =  二维空间中的直线   这个假设最多能区分3个点,4个以上的点就不能完全区分开了,此时VC维就是3

 

同样的,类比于以上情况

假设空间有4个点,分为两类的话一共有2的4次方就是16种情况。如下

那么:用一个矩形总是可以将这4个点分开:

16种情况大家可以自己尝试。

而如果空间中5个点的时候,二维空间中轴平行的矩形这个假设应该存在有些情况不能正确分配(我没有实际证明,只是出自老师的PPT,大家可以思考一下)

所以:对于4个点,H  =  二维空间中轴平行的矩形 ,最多只能处理4个点,VC维是4.

 

 

有一些疑问:这几个点为什么只能分为两类?

或许和它的定义有关吧,这张图来自Wiki的定义。

另外,以上的图片来自于老师的PPT,对于三个点,如果并排成一条直线,是不是也不一定能用一条直线分开呢?

以下图片来自:https://www.jianshu.com/p/9214c838d9b1

应该还是和定义有关。

 

欢迎大家留言

yueguanli
关注 关注
  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习:VC的概念和用途
gongdiwudu的专栏
06-29 1万+
VC是机器学习的重要概念,它给机器学习的“可学习性”提供了理论基础。然而,在网上的博客中,多数将VC解释的复杂抽象,看后似是而非。本文意在用浅显易懂的手段,将VC的基本概念交待清楚,然后,再在高层次上介绍其用途。...............
ML之VCVC(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略
近期请国内外头部出版社可尽快私信博主!——心比天高,仗剑走天涯,保持热爱,奔赴向梦想!低调,谦虚,自律,反思,成长,还算是比较正能量的博主,公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然,有点小情怀,也有点使命感呀)…
03-28 1万+
ML之VCVC(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标)的简介、案例理解之详细攻略 目录 VC(Vapnik-Chervonenkis Dimension)理论的简介 VC(Vapnik-Chervonenkis Dimension)理论的概述(衡量模型复杂度和预测能力的指标,但VC理论目前已被边缘化) 案例理解如何计算VC的大小 VC(Vapnik-Chervonenkis Dimension
机器学习-VC
05-07
包含监督学习与非监督学习的基本概念,VC,概率逼近学习的基本原理
关于VC理解
热门推荐
微念的博客
06-27 2万+
简介         VC,全称为Vapnik-Chervonenkis Dimension,它反映了模型的学习能力,VC越大,则模型的容量越大。 通俗定义   
VC理解
ningyanggege的博客
12-27 301
                       
VC
双杯献酒的专栏
04-09 440
1. 函数类的标注数量 函数类F中的一个函数f, 应用于一个观测数据集S, f会为每一个数据计算出一个预测标注。 设数据集S的数据数量是n, 则显然不管F中的函数有多少(甚至无限), 不同的标注最多只有 2ⁿ种标注, 所以是有限的。 所以对于数量无限的F, 必然有很多函数的标注是一样的, 对于这个观测数据集而言, 相同标注的函数是等价的。 经...
支持向量机导论
rein07的专栏
03-14 1657
<br /><br />    今天开始看《支持向量机导论》,前面三章讲的还是通俗易懂的。但是第四章看了一节之后,就让人坠入云里雾里了。其中VC数讲了长长的一大段,看了几遍都是不知所云。于是我只能BAIDU下了。果然,网上很多人对这个问题相当关心的,也有些很经典的解释。我摘录如下:<br />VC被认为是数学和计算机科学中非常重要的定量化概念,它可用来刻画分类系统的性能.<br />   模式识别中VC的直观定义是:对一个指示函数集,如果存在h个样本能够被函数集中的函数按所有可能的2h种形式分开,则称
VC+西瓜书讲解
weixin_42305378的博客
06-17 360
现实学习任务所面临的通常是无限假设空间,例如实数域中的所有区间、R^{d}空间中的所有线性超平面,欲对此种情形的可学习性进行研究,需度量假设空间的复杂度,最常见的办法是考虑假设空间的"VC”。 给定训练样本集合x_{0},x_{1}\cdots ,x_{n-1},其中每个样本有两个可选的label(+1, -1)。因此总共有2^{n}种不同的label组合。如果对于其中每一种组合,分类模型 f 都能够对其进行正确的划分,那么我们称 f 能够将训练样本集合x_{0},x_{1}\cdots ,x_{n-1}
VC++马走日棋盘搜索算法源码举例
03-17
为了实现马走日棋的搜索,开发者可能首先定义了一个棋盘类,该类包含了棋盘的二数组表示,以及棋子的位置。接着,他们可能创建了函数来模拟马的移动,这个函数会检查每一步是否合法,即是否遵循“日”字规则并且...
机器学习 · 总览篇 X 可学习性 & VC理论
OEDead的专栏
07-09 820
VC 理论中 VCVC界 作为机器学习可学习性的最重要的理论基础,对于机器学习方法的研究和使用具有十分重要的指导意义。比如对于一个任务,我准备使用的机器学习方法是否合理、数据量至少需要多少,这些问题如何在进行实验之前就能被解答?答案就在本文中。 文章首发于我的博客,转载请保留链接 ???? 机器学习主要研究的是怎么去学习解决一个问题,这里面包含了一个隐含的前提条件:对于待学习的问题,学习方法必须是可行的。那么怎么去判定一个学习方法对于问题的可学习性呢?PCA Learning 就是关于机器学习
PAC增长函数与VC极简例子
minfanphd的博客
07-10 820
PAC增长函数与VC极简例子动机例1:一个分割点例2:两个分割点 动机 从组合的方式,计算学习模型的表达能力。表达能力越强的模型越复杂。 例1:一个分割点 如图1所示,输入空间为实数轴。假设学习模型为一个分割点(一上的分割超平面),将负类(三角形)与正类(圆形)分开。计算增长函数: 对于m个数据而言,分割点d有m + 1个位置可选(两邻两个数据之间只能算一个位置)。 分割点d左右可以是正/负,也可以是负/正,因此有2(m+1)种分类方式 d在最左边和最右边,均表示所有的样本预测为同一类,因此有2种重复
机器学习-特征选择-VC理解
weixin_41647586的博客
03-22 3021
vc含义的个人理解 在看斯坦福机器学习公开课的第10课特征选择中,Andrew Ng老师引入了VC的概念,可能是字幕翻译不准确的原因,不是很理解,自己在网上查了一些资料,下面说说自己的理解。 必要定义: 分散(shatter):对于一个给定集合S={x1, … ,xd},如果一个假设类H能够实现集合S中所有元素的任意一种标记方式,则称H能够分散S。 VC:H的VC表示为VC(H) ,指能够...
转网上关于VC的一些解释,通过这些解释可以比较清楚地了解VC
tech_ant的专栏
05-08 1904
VC理解 2010-10-21 10:00 这两天在看VC,文献上讲的一直不太明白,今天看到一篇文章,终于有些理解了。 VC的直观定义是:对一个指标函数集,如果存在h 个样本能够被函数集中的函数按所有可能的2h种形式分开,则称函数集能够把h个样本打散;函数集的VC就是它能打散的最大样本数目h。若对任意数 目的样本都有函数能将它们打散,则函数集的VC
Computer Science Theory for the Information Age-5: 学习理论——VC的定义以及一些例子...
weixin_34406796的博客
05-02 348
Computer Science Theory for the Information Age-5: 学习理论——VC的定义以及一些例子 学习理论——VC的定义以及一些例子 本文主要介绍一些学习理论上的东西。首先,我们得明确,从训练集上学习出来的分类器的最终目标是用于预测未知的样本,那么我们在训练的时候该用多少的样本才能使产生的分...
7 - VC度(VC Dimension)-- 衡量模型与样本的复杂度
weixin_33829657的博客
03-31 691
2019独角兽企业重金招聘Python工程师标准>>> ...
关于统计学VC理解
scy的技术博客
03-11 743
...
VCVC Dimension)
qq_43391414的博客
12-25 8792
定义 VC Dimension:全称是Vapnik-Chervonenkis dimension。其用来衡量一个模型的复杂度,定义为:在该模型对应的空间中随机撒x点,然后对其中的每个点随机分配一个2类标签,使用你的模型来分类,并且要分对,请问x至多是多少。这个x就是VC。 例子 1.线性函数 如果选用二空间中的直线作为判别函数,该分类模型的VC是多少? 答案:3 解释:如果是3个点,无论如何随机的打标签,都存在一条直线都可以将两类样本分开。 如果是4个点,就可能会出现一种标签序列,使得不存在一条直线将
学习理论-VC
myazi
09-15 555
学习理论 1、基本概念 2、PAC理论 3、VC 4、极大似然,最大后验概率,贝叶斯估计 5、模型评估与评价指标 6、模型诊断调参 三、VC ​ 在PAC理论中,我们用假设空间的取值NNN来描述模型的复杂度,然而很多时候假设空间的取值是无限的,比如线性模型中模型属于连续空间,我们无法用取值来衡量模型的复杂度,VC的主要价值在于用VC度)衡...
写文章

热门文章

  • 进不了BIOS,电脑开机黑屏 21276
  • Latex 高亮文字 8984
  • Apriori性质剪枝:频繁项集的所有子集必须是频繁的 3697
  • Anaconda+SimpleITK+pyCharm环境搭建 2897
  • VC维举例以及理解 2614

分类专栏

  • 电脑 4篇
  • 软件 4篇
  • 非技术 2篇
  • 机器学习 9篇
  • 信息安全 1篇
  • 论文 1篇
  • 网络 1篇

最新评论

  • 进不了BIOS,电脑开机黑屏

    CaoLuffy: 开机不亮怎么办?就是主板引导都不出来那种,接外接显示器也没用,屏幕全是黑的,开机指示灯倒是亮了,看网上说擦内存条的,我这一体机差不下来啊

  • Apriori性质剪枝:频繁项集的所有子集必须是频繁的

    山水也无美: 自连接错了吧哪来的{A,B,C}

  • Anaconda+SimpleITK+pyCharm环境搭建

    Expected future: 走心好文,必须收藏!

  • 模糊等价关系

    王小二的拖拉机: 看到母校了

  • Apriori性质剪枝:频繁项集的所有子集必须是频繁的

    qq498068797: 明白了,感谢

最新文章

  • pip安装失败提示warning和error
  • eclipse+pydev环境搭建20200929
  • kaggle 不是内部 或 外部命令
2020年10篇
2019年7篇
2018年3篇
2017年4篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

天下网标王江苏正规的网站seo优化推广凌源企业网站优化服务徐州铜山网站优化有哪些手机端网站优化怎样优化门户网站淮北专业网站优化商丘网站自然优化报价沛县优化网站哪家专业温州网站的优化电影网站优化价格恩施网站建设优化网站优化销售合肥服务好的网站优化网站模板网站建设推广价格优化新手网站优化方法网站排名优化费用贵不贵深圳搜索网站优化公司网站内部优化技术雅安网站优化学习一套完整的外贸网站优化流程湘乡市优化网站泰安济南网站优化清远企业网站优化公司删除网站内容影响优化网站优化为什么见效慢为你解惑阳江企业网站关键词优化教程南通优化网站价格静安区专业网站优化奉化网站优化找哪家前端如何优化网站性能香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化