25丨KNN(下):如何对手写数字进行识别?

你好,我是悦创。

今天我来带你进行 KNN 的实战。上节课,我讲了 KNN 实际上是计算待分类物体与其他物体之间的距离,然后通过统计最近的 K 个邻居的分类情况,来决定这个物体的分类情况。

这节课,我们先看下如何在 sklearn 中使用 KNN 算法,然后通过 sklearn 中自带的手写数字数据集来进行实战。

之前我还讲过 SVM、朴素贝叶斯和决策树分类,我们还可以用这个数据集来做下训练,对比下这四个分类器的训练结果。

如何在 sklearn 中使用 KNN

在 Python 的 sklearn 工具包中有 KNN 算法。KNN 既可以做分类器,也可以做回归。如果是做分类,你需要引用:


AI悦创原创...大约 10 分钟数据分析数据分析实战 45 讲数据分析数据分析实战 45 讲
24丨KNN(上):如何根据打斗和接吻次数来划分电影类型?
img

你好,我是悦创。

今天我来带你进行 KNN 的学习,KNN 的英文叫 K-Nearest Neighbor,应该算是数据挖掘算法中最简单的一种。

我们先用一个例子体会下。

假设,我们想对电影的类型进行分类,统计了电影中打斗次数、接吻次数,当然还有其他的指标也可以被统计到,如下表所示。

img

我们很容易理解《战狼》《红海行动》《碟中谍 6》是动作片,《前任 3》《春娇救志明》《泰坦尼克号》是爱情片,但是有没有一种方法让机器也可以掌握这个分类的规则,当有一部新电影的时候,也可以对它的类型自动分类呢?


AI悦创原创...大约 10 分钟数据分析数据分析实战 45 讲数据分析数据分析实战 45 讲
18丨决策树(中):CART,一棵是回归树,另一棵是分类树
img

你好,我是悦创。

上节课我们讲了决策树,基于信息度量的不同方式,我们可以把决策树分为 ID3 算法、C4.5 算法和 CART 算法。今天我来带你学习 CART 算法。CART 算法,英文全称叫做 Classification And Regression Tree,中文叫做分类回归树。ID3 和 C4.5 算法可以生成二叉树或多叉树,而 CART 只支持二叉树。同时 CART 决策树比较特殊,既可以作分类树,又可以作回归树。

那么你首先需要了解的是,什么是分类树,什么是回归树呢?


AI悦创原创...大约 9 分钟数据分析数据分析实战 45 讲数据分析数据分析实战 45 讲
17 丨决策树(上):要不要去打篮球?决策树来告诉你
img

你好,我是悦创。

想象一下一个女孩的妈妈给她介绍男朋友的场景:

女儿:长的帅不帅?

妈妈:挺帅的。

女儿:有没有房子?

妈妈:在老家有一个。

女儿:收入高不高?

妈妈:还不错,年薪百万。

女儿:做什么工作的?

妈妈:IT 男,互联网公司做数据挖掘的。

女儿:好,那我见见。

在现实生活中,我们会遇到各种选择,不论是选择男女朋友,还是挑选水果,都是基于以往的经验来做判断。如果把判断背后的逻辑整理成一个结构图,你会发现它实际上是一个树状图,这就是我们今天要讲的决策树


AI悦创原创...大约 19 分钟数据分析数据分析实战 45 讲数据分析数据分析实战 45 讲
开篇词 | 你为什么需要数据分析能力?
img

你好,我是悦创。

Python 中有一个学科或者分支,叫数据挖掘,正是通过这门课,我学会了如何从海量的数据中找到关联关系,以及如何进行价值挖掘。那时候感觉自己掌握了一门利器,就特别想找到一个钉子,来试试自己手里的这把锤子。

当时恰好赶上 2009 年微博的热潮。我的朋友悦兮用 3 个月的时间就积累了 4 万粉丝,一年的时间积累了上百万粉丝。这是怎么做到的呢?

欢迎关注我公众号:AI悦创,有更多更好玩的等你发现!

公众号:AI悦创【二维码】

AI悦创原创...大约 2 分钟数据分析数据分析实战 45 讲数据分析数据分析实战 45 讲