
上QQ阅读APP看书,第一时间看更新
第3章
k最近邻算法
俗话说“近朱者赤,近墨者黑”,想象一下我们的数据集里面有一半是“朱”,一半是“墨”,现在有了一个新数据点,我们怎么判断它属于哪一个分类?基于一个假设前提“属性越接近的人,行为偏好也越相似”。k最近邻算法(k-Nearest Neighbors,简称kNN)的原理简单地说,就是新数据点离谁最近,就和谁属于同一类。kNN是非常简单的算法,也是新手入门机器学习的常用算法。
俗话说“近朱者赤,近墨者黑”,想象一下我们的数据集里面有一半是“朱”,一半是“墨”,现在有了一个新数据点,我们怎么判断它属于哪一个分类?基于一个假设前提“属性越接近的人,行为偏好也越相似”。k最近邻算法(k-Nearest Neighbors,简称kNN)的原理简单地说,就是新数据点离谁最近,就和谁属于同一类。kNN是非常简单的算法,也是新手入门机器学习的常用算法。