The essence of machine learning
- A pattern exists
- We cannot pin it down mathematically
- We have data on it
建模,现有的问题,存在一个从x到y的函数f,我们通过历史数据(x1,y1)…(xn,yn) 找出一个函数g,使得g越来越像f
梳理一下机器学习的流程图:
1、目标是从x到y ,找到函数
2、有一组训练数据(x1,y1)…(xn,yn)
3、通过算法找到g,使得g逼近f
这里重点是存在一组假设H(这个应该就是超参数???),找到最贴近的假设,例如可能是linear model,可能是 support vector machine等等这些假设。
但是这组假设是没有downside的,因为你可以穷尽所有的可能去找Hypothesis
但是有一个upside,这个upside可以告诉我们怎么改进,什么是正确的方向
solution的解决部分
1、The Hypothesis Set
这是由我们可感知(percetron)的模型,例如神经模型、SVM…
H是超参数集
h是其中一个可能的参数
g是最终集
2、The learning Algorithm
这是由我们我们可感知(percetron)的算法,例如反向传播算法、一元二次方程…
1和2分构成learning model
有三种机器学习方式
1、supervised learning
有输入,正确的输出(起到label或者flag的作用)
2、Unsupervised learning
有输入,但没有明确的输出
3、Reinforcement learning
有输入,还有一定的输出(起到辅助作用)