Reference:
https://zhuanlan.zhihu.com/p/20894041
https://zhuanlan.zhihu.com/p/20900216
图像分类
颜色channel 有三个 red green blue, RGB
流程就是 输入 -> 学习 -> 评价
K Nearest Neighbor 分类器
k 越高 generalization 能力越好
用距离来分类
L1范数 和 L2范数
L1
L2
distances = np.sqrt(np.sum(np.square(self.Xtr - X[i,:]), axis = 1))
L1和L2比较。。在面对两个向量之间的差异时,L2比L1更加不能容忍这些差异。也就是说,相对于1个巨大的差异,L2距离更倾向于接受多个中等程度的差异。L1和L2都是在p-norm常用的特殊形式。
hyperparameter: 超参数,需要去测试调整
validation set: 测试集 只能使用一次
Cross validation: train <-> test
##k Nearest Neighbor 优缺点:
Advantange:易于理解,实现简单。
Disadvantage: 算法的训练不需要花时间,因为其训练过程只是将训练集数据存储起来。然而测试要花费大量时间计算,因为每个测试图像需要和所有存储的训练图像进行比较,这显然是一个缺点。在实际应用中,我们关注测试效率远远高于训练效率