机器学习
####
计算机科学X统计学
模式识别,计算机视觉,语言识别,数据挖掘,统计学习,自然语言处理
数据处理-确定模型-算法训练
模型分类
回归, 分类
线性回归
overfitting 过拟合
regularization 正则化
KNN(监督学习)
从训练集中找到最接近的k条记录
根据他们的主要分类来觉得新数据的类别
K-Means(非监督学习[聚类])
- 选择k个点作为初始中心 (canopy, 模拟退火, 贝叶斯准则)
- 每个点指派到最近的中心,形成k个簇
- 重新计算每个簇的中心
- 到中心发生明显变化/未达到最大迭代次数
计算机视觉
大脑/眼睛
无人驾驶汽车/人脸识别/肿瘤识别/手势识别
OpenCV, PIL
- 数据输入 - 图像处理 - 数据输出
AdaBoost
- 初始化权值, i=1,wij=0.1
- 训练学习,选择弱分类器
- 计算分类误差 误分类率 弱分类器系数
- 判断是否满足要求
- 计算影响因子
- 更新权值
- 归一化