机器学习(周志华) 01 绪论

大二充实的生活开始噜

绪论

引言

  • 让电脑基于数据产生模型 — 从数据中学到的结果
  • 利用经验获得关于任务评估的改善 称为对经验进行了学习
  • 模型 : 从数据中学到的结果

基本术语

  • 数据集, 示例, 维数
  • 学习, 训练, 假设, 真实, 学习器
  • 标记信息 (类似于样例结果) 监督学习 无监督学习
  • 分布 独立同分布

假设空间

  • 最基本的是布尔概念学习,本章假定训练样本不含噪音
  • 学习的目的是”泛化”,过程是在所有假设组成空间中进行搜索的过程,寻求匹配的假设
  • 通配符 * (与python中import相似)
  • 多个假设与训练集一致 : 版本空间

归纳偏好

  • 对于一个具体学习算法而言,它必须产生一个模型
  • 偏好会起到关键作用 (觉得选择哪种/具体与否的) 结论
    • 任何一个有效的机器学习算法必有其归纳偏好
    • “什么样的的模型更好的” 假设
    • 特征选择
    • 泛化能力更强
  • 奥卡姆剃刀原则 : 选最简单的那个
  • 没有免费午餐定理 NFL : 所有学习算法的期望性能相同
    • 脱离具体问题空泛而谈毫无意义
文章目录
  1. 1. 绪论
    1. 1.1. 引言
    2. 1.2. 基本术语
    3. 1.3. 假设空间
    4. 1.4. 归纳偏好