原创2022年11月14日...大约 8 分钟
1. 决策树算法概述
你好,我是悦创。
家里有五口人,爷爷奶奶、两个孩子、一个母亲。
我们要做个分类,在分类中,我们要做个判断:谁爱玩电脑游戏。
谁爱玩电脑游戏肯定是数据当中这些特征所决定的吧,假如当前数据中有两个特征:年龄、性别。这两个特征都会对结果产生影响。上图是我们现在构建出决策树的模型。
从数据栏当中,回落到第一个判断的键当中。
从上往下走,通过对年龄的判断,年龄是不是小于 15 岁,如果年龄小于 15岁,他是潜在有玩游戏的可能性的。那就让他往左边走:
如果不是小于 15岁的,我们就把他排除在外了,认为他是不喜欢玩电脑游戏的。
原创2022年10月14日...大约 15 分钟
一、介绍
你好,我是悦创。
本文是由给私教学员 cava 讲解时编写,主要逻辑没有错误。
k-近邻算法(K-Nearest Neighbour algorithm),又称 KNN 算法,是数据挖掘技术中原理最简单的算法。
工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻近的 k 个实例,如果这 k 个实例的多数属于某个类别,那么新数据就属于这个类别。简单理解为:由那些离 X 最近的 k 个点来投票决定 X 归为哪一类。
二、k-近邻算法的步骤
(1)计算已知类别数据集中的点与当前点之间的距离;
原创2022年9月7日...大约 6 分钟