序言
本文参考到没参考到的内容都挺多。
- Hinton coursera《neural network for machine learning》第一周第五个视频
- Andrew Ng在斯坦福的cs229, cs229
- 李航《统计学习方法》
专业水平、 写作水平都很次,若有意见或建议, 欢迎通过下方微博或邮箱联系。
原则上,上一篇讲的是 机器学习定义
这一篇将向各位介绍机器学习的主要类型。
原则上从什么开始?
A. 问题
B. 定义
C. 故事
D. 历史
不是每个东西都能启发的
个人认为,对一个领域进行分门别类 需要较高、较深的专业知识水平,有了足够的问题、知识,进行归纳、分类,这是我个人理解的做法。
但一般教材都没这么做,直接把各种分类一股脑地列出来,因为也确实做不到,不可能列出足够的例子,慢慢地归纳出各类的特点。 并且,分类的方式可能多种多样, 往往不存在唯一的权威分类方式。
所以这块的教程写起来就会比较难,读者也不是很有体会。
所以,我要尝试做到更自然地从定义来预测大概有些什么问题,可以划分哪些类别。也算是锻炼了直觉、 猜测的能力。
还记得, 机器学习的起因、经过、结果吧?
起因:某些方面不够好,经过:从数据中使用某些方法学习到经验,结果:提高了性能、准确率、知识等等。
哪总分的特点可作为分类依据?
A. 起因
B. 经过
C. 结果
那又如何?
从数据中使用某些方法学习到经验, 这句话能有什么特点?
学完机器学习,也许 我们可以在方法上进行分类(我也没学完,所以瞎分一下)——线性、非线性、核方法;最优、非最优;树状、网状、线状;单挑、群殴。 但是,我们还什么都没学呢, 怎么分? 也许以后值得一试,但现在没法。
那我们只能看“数据”了,分成图像、文本、 数字(整数、虚数)?估计也是一种方案——不过肯定得不到大家的认可。
数据有什么不一样的呢? 肯定又要从人类的日常汲取养分了。 那人最早是怎么学习的?
写写你的想法
一种学习
是不是父母指着一个东西说这是什么?
但是不是所有的学习都是这样呢?填是或你认为的其他学习方式。
反馈学习
我现在不知道你填了什么~~~不好意思。
除了父母、课本明确指明对象的名字、标签的学习外,还有种反馈学习,什么时候会有反馈、反馈是对是错都不知道, 但反馈对之后的行动又非常重要。
就好比你在恋爱,你自以为体贴周到,可从对象那里什么时候会有反馈、 什么样的反馈、甚至是否能正确理解,如何能从对象那里持续获得反馈、而且都是真正的积极反馈(你们相处得很好),这就是恋爱的学习了~~~
那我们现在就有两类学习:
- 有明确、及时的标签。
- 有不一定及时、完全不明确的反馈。
还有没有其他可能?
A. 有
B. 没有
还有什么?
还有
- 有明确、及时的标签。
- 有不一定及时、完全不明确的反馈。
那肯定还有个, 完全无标签、 完全无反馈的学习。
想想, 人什么时候这样学习过呢?没头没脑地一堆数据扔给你, 什么解释都没有, 这种学习形式应该是比较少的。
你能想到这种例子吗?
为什么少?
个人感觉就是对人而言, 学习还是要有个明确的、形式化的描述,模糊、朦胧的感知很难达到学习、提升的效果。
比如说机器学习里需要的聚类, 人手工也能聚, 但你说能从中学到些啥说不清楚, 假设班级中,人以类聚,但说不清楚。
至于数据降维就更是没几个人自己弄过——求特征值、特征量,但没拿来用过。
所以这种学习形式不难理解, 就是亲自尝试、有体会的不多。
还有其他类型吗?
A. 有
B. 没有
总结
我们总结出了三种
- 有明确、及时的标签的学习。
- 有不一定及时、完全不明确的反馈的学习。
- 完全无标签、 无反馈的学习。
这就是机器学习的三种类型:
- 监督学习: 有标签的数据的学习
- 无监督学习: 没有标签的数据的学习
- 强化学习: 有反馈影响行为的学习
基础概念给出了, 接下来本应给出数学抽象, 统一数学符号,但因为看的内容来源不一, 符号并不统一, 我也未能完全消化领会, 所以,哪里需要数学化,就补哪里了。