绪论
引言
- 让电脑基于数据产生模型 — 从数据中学到的结果
- 利用经验获得关于任务评估的改善 称为对经验进行了学习
- 模型 : 从数据中学到的结果
基本术语
- 数据集, 示例, 维数
- 学习, 训练, 假设, 真实, 学习器
- 标记信息 (类似于样例结果) 监督学习 无监督学习
- 分布 独立同分布
假设空间
- 最基本的是布尔概念学习,本章假定训练样本不含噪音
- 学习的目的是”泛化”,过程是在所有假设组成空间中进行搜索的过程,寻求匹配的假设
- 通配符 * (与python中import相似)
- 多个假设与训练集一致 : 版本空间
归纳偏好
- 对于一个具体学习算法而言,它必须产生一个模型
- 偏好会起到关键作用 (觉得选择哪种/具体与否的) 结论
- 任何一个有效的机器学习算法必有其归纳偏好
- “什么样的的模型更好的” 假设
- 特征选择
- 泛化能力更强
- 奥卡姆剃刀原则 : 选最简单的那个
- 没有免费午餐定理 NFL : 所有学习算法的期望性能相同
- 脱离具体问题空泛而谈毫无意义