《零基础学机器学习》读书笔记一之机器学习基础概念

12 篇文章 1 订阅
订阅专栏
7 篇文章 0 订阅
订阅专栏
本文介绍了机器学习的基础,包括作为AI分支的机器学习和深度学习,强调数据与硬件在发展中的重要性。提到了入门机器学习所需的数学基础和逻辑分析能力。机器学习涉及模型构建、特征选择,通过监督学习、无监督学习、强化学习等方法从数据中发现规律。文章还讨论了回归、分类等常见问题类型,以及聚类、关联规则、时间序列等应用场景。
摘要由CSDN通过智能技术生成

《零基础学机器学习》读书笔记一之机器学习基础概念

一、机器学习快速上手路径

1.1 机器学习的家族谱

人工智能,可以被简单地定义为努力将通常由人类完成的智力任务自动化
AI效应的2个阶段:
(1)AI将新技术、新体验带进人类的生活,完成了一些原本需要人类智慧才能完成的工作,此时舆论会对AI期待极高,形成一种让人觉得“真正的”AI时代麻黄素那个就要到来的氛围。
(2)一旦大家开始习惯这些新技术,就又开始认为这些技术没什么了不起,根本代表不了真正的人类智慧,此时又形成一种对AI的现状十分失望的氛围。
机器学习是AI的分支,而深度学习是机器学习的技术之一
AI的发展离不开数据和硬件:
(1)数据。数据是燃料,有了算法所需要的海量数据,机器才能够运转。
(2)硬件。存储能力、计算能力的增强,以及云服务、GPU等。
技术的可达性和实用性,才是机器学习和深度学习的真正价值所在。

1.1.1 入门机器学习

在入门阶段,需要一些数学基础,包括函数、概率统计,线性代数和微积分最基础的内容。机器学习中的数学内容重在理解,不重在公式的推演
机器学习,注重模型的选择、整合、参数的调试。这要求的主要是逻辑分析与判断能力,再加上点直觉和运气。

1.1.2 机器学习就是从数据中发现规律

使用正确的特征来构建正确的模型,以完成既定的任务。
——Peter Flach《机器学习》

机器学习的关键内涵之一在于利用计算机的运算能力从大量的数据中发现一个“函数”或:“模型”,并通过它来模拟现实世界事物间的关系,从而实现预测或判断的功能
这个过程的关键是建立一个正确的模型。
特征:自变量(x1,x2,x3,…xn);
标签:因变量y。
训练数据集 training dataset,测试数据集 test dataset。
机器学习,就是在已知数据集的基础上,通过反复的计算,选择最贴切的函数去描述数据集中自变量(x1,x2,x3,…xn)和因变量y之间的关系。
从数据中发现关系,归纳成函数,以实现从A到B的推断。

机器学习的另外一个特质是从错误中学习。
机器找到一个函数去拟合(fit)它要解决的问题,一直到找到相对最为合适的函数为止,机器通过机器学习算法自己摸索出来。机器从已知数据中不断试错之后,归纳出规则。
训练步骤:
(1)选定模型的类型,也就是算法;
(2)通过fit方法来训练机器,进行函数的拟合;
(3)预测验证集的y值;
(4)计算验证集中预测值和真值之间的差异,评估预测结果;
拟合意味着找到最优的函数去模拟训练集中的输入特征和目标标签的关系,确定模型的参数。
要比较不同的模型,都应采用相同的评估指标,在同样的标准下,哪个分数更高,就说明哪个模型更好。
学习重点在于解释这些算法,并应用它们建立机器学习模型(函数)来解决具体问题

1.1.3 机器学习的类别

最常见的分类为 监督学习无监督学习半监督学习
监督学习的训练需要标签数据,而无监督学习不需要标签数据,半监督学习介于两者之间。
半监督学习使用大量的无标签数据,同时使用部分有标签数据来进行建模。
另一种分类方式,监督学习、无监督学习和强化学习。

1.1.4 机器学习的重要分支

深度学习,是根据机器学习的模型或训练机器时所采用的算法进行分类。
监督学习或无监督学习,着眼点在于数据即问题的本身;
传统机器学习还是深度学习,着眼点在于解决问题的方法。
人工神经网络,是数据结构和算法形成的机器学习模型,由大量的所谓人工神经元相互联结而成,这些神经元都具有可以调整的参数,可以实现监督学习或无监督学习。
现在把层数较多、结构比较复杂的神经网络的机器学习技术叫作深度学习
深度学习的另一大好处是对数据特征的要求降低,自动地实现非结构化数据的结构化,无须手工获取特征,减少特征工程。
特征工程是指对数据特征的整理和优化工作,让它们更易于被机器所学习。
数据结构化的目标:使数据变得**“计算机友好”**。
深度学习通过神经网络把特征提取和分类任务一并解决了。

1.1.5 机器学习新热点

强化学习研究的目标是智能体如何基于环境而做出行动反应,以取得最大化的累积奖励。智能体通过所得到的奖励(或惩罚)、环境反馈回来的状态以及动作与环境互动。
强化学习和普通机器学习的差异在于:普通机器学习是在开放的环境中学习;而强化学习的环境是封闭的。
强化学习和监督学习的差异在于:监督学习是从数据中学习,而强化学习是从环境给它的奖惩中学习。监督学习中数据的标签就是答案,强化学习得到惩罚后,没人告诉它具体哪里做错了,所以它调整策略的时候需要的智能更强,要求它的思路也更加广阔、更为长远。智能体不一定每次都明确地选择最优动作,而是要在探索(未知领域)和利用(当前知识)之间找到平衡。
其他机器学习方法(算法),例如集成学习、在线学习、迁移学习等。

1.1.6 机器学习的两大应用场景

回归和分类是两种最常见的机器学习问题类型。
回归问题通常用来预测一个值,其标签的值是连续的。常见的回归算法是线性回归算法以及深度学习中的神经网络等。
分类问题是将事物标记一个类别标签,结果为离散值,也就是类别中的一个选项。分类有二元分类和多元分类,每类的最终正确结果只有一个。
分类是机器学习的经典应用领域,很多种机器学习算法都可以用于分类,包括最基础的逻辑回归算法、经典的决策树算法,以及深度学习中的神经网络等。

1.1.7 机器学习的其他应用场景

无监督学习中最常见的聚类问题是在没有标签的情况下,把数据按照其特征的性质分成不同的簇(数据分类);还有一种无监督学习是关联规则,通过它可以找到特征之间的影响关系。
时间序列,指在内部结构随时间呈规律性变化的数据集,如趋势性数据、随季节变化的数据等。时间序列问题其实就是和时间、周期紧密关联的回归问题。
结构化输出,通常机器学习都是输出一个答案或者选项,而有时需要通过学习输出一个结构。
生成式学习,比如AI画画。
当机器学习的目标是做出决定时,叫决策性问题。决策性问题本质上仍然是分类问题,因为每一个决策实际上还是在用最适合的行为对环境的某一个状态进行分类。在很多决策性问题中,机器必须学习哪些决策是有效的、可以带来回报的,哪些是无效的、会带来负回报的,以及哪些是对长远目标有利的。因此,强化学习是这种情况下的常用技术。
机器学习的诀窍在于要了解自己的问题,并针对自己的问题选择最佳的机器学习方法(算法),也就是找到哪一种技术最有可能适合这种情况。
机器学习分类

机器学习不是万能的,它只能作用于和已知数据集类似的数据,不能抽象推广。机器的优势仍在于计算量、速度和准确性,尚无法形成类似人类的智力思维模式。

集成习精讲01 - SAP大神黄佳新作《零基础机器学习》节选
JackyHuang79的博客
11-28 2892
集成习(ensemble learning),是通过构建出多个模型(这些模型可以是比较弱的模型),然后将它们组合起来完成任务。名字听起来比较高大上,但它其实是很经典的机器学习方法了。在深度学习时代,集成习仍然具有很高的江湖地位。它的核心策略是通过模型的集成减少机器学习中的方差(variance)和偏差(bias)。 我们将分为5篇文章介绍集成习,分别是: 1. 偏差和方差 2. Bagging 3. Boosting 4. Stacking/Blending 5. Voting/Avera
机器学习入门资源不完全汇总_拔剑-浆糊的传说_新浪博客
拔剑—浆糊的传说
01-19 280
机器学习入门资源不完全汇总 http://ml.memect.com/article/machine-learning-guide.html#入门攻略 基本概念|入门攻略|课程资源|论坛网站|东拉西扯 2014-10-14版, 好东西传送门编辑整理, 原文链接http://ml.memect.com/article/machine-learning-guide...
适合新手入门的机器学习网站整理
青青木屋
01-30 653
适合新手入门的机器学习网站
机器学习-五大主派
daguo_zhan的博客
06-10 1690
机器学习分类
写了一本适合本科生的机器学习书:《机器学习入门基础(微课版)》
fengdu78的博客
08-28 1473
各位读者朋友们,今天我要给大家推荐一本非常实用的机器学习入门基础图书——《机器学习入门基础(微课版)》。这本书是由黄海广老师倾心打造,适合只有本科三年级数水平以上的初者入门,这本书已经被很多校定为本科生教材。背景介绍本书的作者黄海广老师是一名大教师,翻译和整理过很多人工智能的入门课程资料,如“吴恩达机器学习”的翻译和笔记整理等,他目前承担本科生和研究生的机器学习课程的教工作。在借鉴了国内...
机器学习基础笔记.md
最新发布
08-16
机器学习基础笔记.md
我的机器学习笔记(一)-监督习vs无监督
02-25
在监督习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和输出之间有着一个特定的关系。这么说可能理解起来不是很清晰,没关系,后面有具体的例子。监督习可分为“回归”和“分类”...
2022吴恩达机器学习笔记汇总(共10章节).zip
12-27
2022吴恩达机器学习笔记汇总(共10章节).zip2022吴恩达机器学习笔记汇总(共10章节).zip2022吴恩达机器学习笔记汇总(共10章节).zip2022吴恩达机器学习笔记汇总(共10章节).zip2022吴恩达机器学习笔记汇总(共10章节).zip...
机器学习基础笔记.zip
11-07
总之,这个"机器学习基础笔记.zip"压缩包为初者提供了一个全面了解机器学习基础知识的资源,涵盖了从基本概念到实际应用的关键内容,通过深入习和实践,可以帮助读者逐步掌握这一领域的重要技能。
吴恩达机器学习基础笔记1
11-03
机器学习领域,吴恩达是一位著名的专家,他的课程涵盖了机器学习基础到高级主题。这篇笔记主要关注的是吴恩达的机器学习基础课程,特别是到回归树的部分。 首先,我们来了解一下监督习。监督习是一种机器...
集成习精讲02 - Bagging方法:多个基模型的聚合(SAP大神黄佳新作《零基础机器学习》节选)
JackyHuang79的博客
11-28 2565
Bagging是我们要讲的第一种集成习方法,是Bootstrap Aggregating的缩写。有人把它翻译为套袋法,装袋法,或者自助聚合,没有个统一的叫法,那就直接用它的英文名称。其算法的基本思想是从原始的数据集中抽取数据,形成k个随机的新训练集,然后训练出k个不同的模型。 这是5篇文章中的第二篇: 1. 集成习集成知识:偏差和方差 2. Bagging 3. Boosting 4. Stacking/Blending 5. Voting/Averaging
电商业务中的五大机器学习问题!
夕小瑶科技说
08-30 834
机器学习正在从曾经的“科幻”,走向大众生活,比如:高铁站的人脸识别系统、小区门口的无人化测量体温,还有这些年很火的自动驾驶,再到电商的精准推荐系统...等等,背后都是机器学习。今天就以电商...
零基础机器学习(基于Python Scikit-learn)
wjsn520的博客
01-31 1198
机器学习 第一章——概述 目录前言一、机器学习介绍1.1什么是机器学习?1.2开发机器学习应用程序的步骤二、特征工程和文本特征提取2.1数据的特征工程2.1.1数据集的组成2.1.2特征工程的定义2.2数据的特征抽取2.2.1字典特征数据抽取2.2.2文本特征提取以及中文问题2.2.3tf-df分析问题三、数据特征预处理3.1特征预处理-归一化3.2归一化以及标准化对比3.3标准化以及缺失值处理四、数据降维4.1数据的降维之特征选择4.2案例1-4.3案例2-五、机器学习概述5.1六、K-近邻算法6.1七
中国智能语音助手企业案例研究报告(2018年)-笔记
青青木屋
07-09 2999
中国智能语音助手企业案例研究报告(2018年)-笔记 1 摘要 目前行业里的智能语音助手主要应用于消费级产品和专业级行业应用两大领域。 智能语音助手的卖点是:想通过语音操控从而解放双手,并且智能语音助手对语音语义识别的准确性成为了用户选择及使用时最重要的考量因素。 2 概念 人工智能核心的三大基础技术:计算机视觉、智能语音和机器学习。 智能语音技术:语音识别ASR、语音合成TT...
the Art of Life
青青木屋
06-23 725
        在找东西的时候,无意间看到这段话,觉得很不错。给大家分享一下。      Aboutpersonality, real beauty comes from learning, growing, and loving inthe ways of life. That is the Art of Life. You can learn slowly, andsometi
人工智能:一种现代的方法》读书笔记之 智能Agent
热门推荐
青青木屋
05-03 1万+
本书链接:人工智能:一种现代的方法(第3版) 本人人工智能小白,为了恶补知识,所以买了一本综述型的入门教材。 一、前提 AI的任务是设计Agent程序,实现的是把感知信息映射到行动的Agent函数。 二、什么是Agent Agent就是能够行动的某种东西,具备自主的操作、感知环境、长期持续、适应变化并能创建与追求目标。 三、什么是合理Agent 合理Agent是一个为了实现最佳结果,...
人工智能技术在银行客服中心的应用风险-笔记
青青木屋
09-04 4377
人工智能技术在银行客服中心的应用风险-笔记 一、人工智能在客服中心的应用现状 1、人工智能对金融业的影响 建立金融大数据系统,提升金融金融多媒体数据处理与理解能力。创新智能金融产品和服务,发展金融新业态。鼓励金融行业应用智能客服、智能监控等技术和装备。建立金融风险智能预警与防控系统。 对于金融领域来讲,人工智能的应用主要包括智能客服、智能网点、智能营销、智能风控几大块。 概要: 新一代...
知识图谱的技术与应用-笔记
青青木屋
07-03 2664
知识图谱的技术与应用 原文链接 知识图谱的技术与应用 概论 只要有关系分析的需求,就能用上“知识图谱” 场景 社交网络图谱 风控知识图谱 知识图谱应用的前提是已经构建好了知识图谱 知识图谱是一个比较新的工具,主要作用在于分析关系,尤其是深度的关系。 知识图谱领域最重要的是知识的推理。 知识图谱工程本身还是业务为中心,以数据为中心。 什么...
知识图谱-概述
青青木屋
05-28 2615
知识图谱 什么是知识图谱 表示 属性图 RDF格式 存储 RDF存储格式 图数据库 优势 1、在关联查询的效率上会比传统的存储方式有显著的提高。 2、基于图的存储在设计上会非常灵活,一般只需要局部的改动即可。 3、把实体和关系存储在图数据结构是一种符合整个故事逻辑的最好的方式。 定义 知识图谱就是把所有不同种类的信息(Heterogeneous ...
吴恩达机器学习笔记:从基础到应用
这个笔记提供了一个入门级的机器学习教程,涵盖了从基础概念到实际算法的详细介绍,对于想要机器学习的读者来说,是宝贵的习资料。通过理解并应用这些理论和方法,习者可以在监督习、非监督习(如ICA...
写文章

热门文章

  • Java读取文本文件中文乱码问题 149237
  • jquery如何判断滚动条滚到页面底部并执行事件 89143
  • 解决fatal: unable to connect to github.com问题 66358
  • firebug加载不了js脚本文件问题 34755
  • mac一键删除所有数据 22412

分类专栏

  • Python 1篇
  • 机器学习 7篇
  • web前端 54篇
  • jQuery 9篇
  • ASP.NET 1篇
  • Ext 1篇
  • JavaScript 11篇
  • Java 15篇
  • SSO
  • ubuntu linux 5篇
  • 学习心得--技术 20篇
  • 设计模式 1篇
  • Web Service 2篇
  • Hadoop 1篇
  • SQL 1篇
  • Web开发 6篇
  • 自动化测试 1篇
  • 点滴感悟 1篇
  • 快捷键 1篇
  • mac 13篇
  • 性能优化 1篇
  • CSS 1篇
  • 浏览器
  • 调试工具 1篇
  • 脚本 1篇
  • 人工智能 12篇

最新评论

  • python读取.data文件总结

    下次见给你带玫瑰: 请问有没有倒序读取的方法呢?

  • Xenu Link Sleuth 简单好用的链接测试工具 使用说明

    weixin_57778299: 这个版本10年没更新过了

  • 《零基础学机器学习》读书笔记一之机器学习基础概念

    w57w57w57: 好多烧脑的,我是老了,跟不上节奏了

  • 解决fatal: unable to connect to github.com问题

    不会游泳的鱼灬: 用这个: git config --global url."https://github.com".insteadOf git://github.com 用这个好使,也是看其他大佬才解决的这个问题,感谢大佬救我狗命

  • 解决fatal: unable to connect to github.com问题

    不会游泳的鱼灬: 感谢大佬救我狗命

大家在看

  • Jboss 靶场攻略
  • 基于python+flask框架的基于智慧养老管理系统的药品管理(开题+程序+论文) 计算机毕设
  • 【开题报告】基于django+vue校园活动信息系统(论文+程序) 661
  • springboot+vue有机蔬菜销售系统与设计【开题+程序+论文】
  • c#代码介绍23种设计模式-08桥接模式

最新文章

  • python读取.data文件总结
  • 《零基础学机器学习》读书笔记五之机器学习项目实战架构
  • 机器学习项目Github仓库推荐
2023年8篇
2018年12篇
2017年4篇
2016年12篇
2015年3篇
2014年26篇
2013年23篇
2012年17篇
2011年9篇
2010年12篇
2009年8篇
2008年2篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

天下网标王太湖网站排名优化公司安徽营销网站搭建优化黄冈市网站关键词优化公司教你分分钟解决网站优化难题网站优化视频缓存网站优化建议百度推广整站搜索网站排名优化建一个自动优化的网站信阳网站优化哪里靠谱南昌网站优化快速获取排名上海网站优化排名平台收费淄博电脑网站优化公司无锡网站关键词优化公司排名习水网站seo优化公司南通网站建设方案优化网站微信登录回调页如何优化木工机械网站seo优化专家随州有学习网站优化的吗佛山网站的优化青岛网站优化电池充电如何对网站做优化宁波网站优化软件哪家好明城网站优化规划清远网站优化如何西安网站推广优化文山网站优化方式彭泽网站seo优化樊城区网站seo优化排名乳山网站搜索优化网站关键词排名优化哪家值得信赖香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化