标签: 机器学习算法

在学习机器学习的时候，接触的第一个算法大都是 KNN。不过在介绍之前，请先允许我讲一下个别名词：

原理介绍

简言之，KNN 算法计算不同特征值之间的距离对样本进行分类。

OK，说完结论，懂的可以直接看代码部分了，如果不能理解的请听我娓娓道来~现在有这么一组数据

AI悦创原创2022/11/14...大约 8 分钟

你好，我是悦创。

家里有五口人，爷爷奶奶、两个孩子、一个母亲。

我们要做个分类，在分类中，我们要做个判断：谁爱玩电脑游戏。

谁爱玩电脑游戏肯定是数据当中这些特征所决定的吧，假如当前数据中有两个特征：年龄、性别。这两个特征都会对结果产生影响。上图是我们现在构建出决策树的模型。

从数据栏当中，回落到第一个判断的键当中。

从上往下走，通过对年龄的判断，年龄是不是小于 15 岁，如果年龄小于 15岁，他是潜在有玩游戏的可能性的。那就让他往左边走：

如果不是小于 15岁的，我们就把他排除在外了，认为他是不喜欢玩电脑游戏的。

AI悦创原创2022/10/14...大约 15 分钟

你好，我是悦创。

本文是由给私教学员 cava 讲解时编写，主要逻辑没有错误。

k-近邻算法（K-Nearest Neighbour algorithm），又称 KNN 算法，是数据挖掘技术中原理最简单的算法。

工作原理：给定一个已知标签类别的训练数据集，输入没有标签的新数据后，在训练数据集中找到与新数据最邻近的 k 个实例，如果这 k 个实例的多数属于某个类别，那么新数据就属于这个类别。简单理解为：由那些离 X 最近的 k 个点来投票决定 X 归为哪一类。

（1）计算已知类别数据集中的点与当前点之间的距离；

AI悦创原创2022/9/7...大约 6 分钟