Python 决策树的生成算法介绍_济南千锋IT培训

千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

首页课程

HTML5

Java

Python

云计算

软件测试

网络安全

大数据

物联网

Unity

UI/UE设计

全媒体营销

影视剪辑

游戏原画

区块链

产品经理

商业插画

PMP认证

红帽RHCE

软考认证

华为认证

教程
HTML5视频教程 Java视频教程 Python视频教程 UI视频教程云计算视频教程软件测试视频教程大数据视频教程物联网视频教程 Unity视频教程网络安全视频教程全媒体视频教程影视剪辑视频教程
教研
教研院师资团队项目大赛
服务
企业内训高校合作学科共建
就业
就业服务双选会上门招聘人才定制
问答资讯技术干货 IT培训机构零基础学IT 关于千锋
千锋简介联系我们锋益公益大赛组织品牌活动

上海

北京
郑州
武汉
成都
西安
沈阳

广州
南京
深圳
大连
青岛
杭州
重庆

当前位置：济南千锋IT培训 > 技术干货 > Python 决策树的生成算法介绍

Python 决策树的生成算法介绍

来源：千锋教育

发布人：xqq

时间： 2023-11-12 09:30:39

划分数据集的最大原则是：使无序的数据变的有序。如果一个训练数据中有20个特征，那么选取哪个做划分依据?这就必须采用量化的方法来判断，量化划分方法有多重，其中一项就是“信息论度量信息分类”。基于信息论的决策树算法有ID3、CART和C4.5等算法，其中C4.5和CART两种算法从ID3算法中衍生而来。

决策树的生成算法由很多变形，这里简单说一下几种经典的实现算法：ID3算法，C4.5算法和CART算法。这些算法的主要区别在于分类结点熵特征选择的选取标准不同，下面了解一下算法的具体实现过程。

一：ID3算法

ID3算法所采用的度量标准就是我们前面提到的“信息增益”。当属性a的信息增益最大时，则意味着用a属性划分，其所获得的“纯度”提升最大，我们所要做的，就是找到信息增益最大的属性。

ID3算法的核心是在决策树的各个节点上应用信息增益准则进行特征选择，具体的做法是：

从根节点上开始，对结点计算所有可能特征的信息增益，选择信息增益最大的特征作为结点的特征，并由该特征的不同取值构建子节点;

对于子节点递归的调用以上方法，构建决策树;

直到所有特征的信息增益均很小或者没有特征可选择的时候为止。

ID3算法具体的算法过程如下：

输入的是m个样本，样本输出集合为D，每个样本有n个离散特征，特征集合为A，输出为决策树T。

1，初始化信息增益的阈值€

2，判断样本是否为同一类输出Di，如果是则返回单节点树T，标记类别为Di

3，判断特征是否为空，如果是则返回单节点树T，标记类别为样本值红输出类别D实例数最多的类别

4，计算A中的各个特征(一共n个)对输出D的信息增益，选择信息增益最大的特征Ag

5，如果Ag的信息增益小于阈值€，则返回单节点树T，标记类别为样本中输出类别D实例树最多的类别

6，否则，按特征Ag的不同取值Agi将对应的样本输出D分成不同的类别Di，每个类别产生一个子节点。对应特征为Agi，返回增加了节点的数T

7，对于所有的子节点，令D=Di，A=A-{Ag}递归调用2~6步，得到子树Ti并返回

ID3算法存在的缺点：

1.ID3算法在选择根节点和内部节点中的分支属性时，采用信息增益作为评价标准。信息增益的缺点是倾向于选择取值较多是属性，在有些情况下这类属性可能不会提供太多有价值的信息。

2.ID3算法只能对描述属性为离散型属性的数据集构造决策树。

3.ID3算法对于缺失值的情况没做考虑。

4.没有考虑过拟合的问题。

以上内容为大家介绍了Python决策树的生成算法介绍，希望对大家有所帮助，如果想要了解更多Python相关知识，请关注 IT培训机构:千锋教育。

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

上一篇

Python静态方法，类方法的使用区别

下一篇

Python 基本语句

猜你喜欢LIKE

python中merge函数如何使用?

python中str内置函数总结归纳

python中的unittest框架是什么?

最新文章NEW

python timedelta函数是什么?

Python jieba库分词模式怎么用?

TCP在python中如何连接服务器?

相关推荐HOT

更多>>

如何使用python中的add函数?

如何使用python中的add函数?本文教程操作环境：windows7系统、Python3.9.1，DELLG3电脑。add函数使用方法1、numpy中加法运算使用实例importnump...详情>>

2023-11-14 14:11:16

python如何将九九乘法表写入到Excel?

python如何将九九乘法表写入到Excel?现在使用python去输出九九乘法表，已经不再稀奇，我们经常输出的环境是文本，但是今天教大家更为复杂一点的...详情>>

2023-11-14 12:11:28

python中altair可视化库怎么用?

python中altair可视化库怎么用?作为六大python可视化库，基本上学会都是可以通吃任何领域的存在，本章要给大家介绍的Altair就是其中之一的可视...详情>>

2023-11-14 09:40:29

python中最小二乘法如何理解?

python中最小二乘法如何理解?python中在实现一元线性回归时会使用最小二乘法，那你知道最小二乘法是什么吗。其实最小二乘法为分类回归算法的基...详情>>

2023-11-14 06:58:12

热门推荐

如何使用python中的add函数?

python中dir函数如何使用?

python中merge函数如何使用?

python中str内置函数总结归纳

python如何将九九乘法表写入到Excel?

Python的scikit-image模块是什么?

python timedelta函数是什么?

python中如何使用np.concatenate()拼接numpy数组

Python jieba库分词模式怎么用?

python中altair可视化库怎么用?

TCP在python中如何连接服务器?

python中使用__slots__定义类属性

python中的unittest框架是什么?

python字典获取对应键的方法

行业资讯 更多>>

济南大学生如何正确选择嵌入式培...

济南学嵌入式哪个培训机构好一些

济南学习嵌入式哪家培训机构好

济南如何选择合适的嵌入式培训机...

技术干货

如何使用python中的add函数?

如何使用python中的add函数?

python中dir函数如何使用?

python中dir函数如何使用?

python中merge函数如何使用?

python中merge函数如何使用?

python中str内置函数总结归纳

python中str内置函数总结归纳

python如何将九九乘法表写入到Excel?

python如何将九九乘法表写入到Excel?

Python的scikit-image模块是什么?

Python的scikit-image模块是什么?

python timedelta函数是什么?

python timedelta函数是什么?

技术问答 在线提问>>

张同学在线提问

unity编辑器在哪里修改

除了基本的修改操作，Unity编辑器还提供了许...详情

刘同学在线提问

linux创建多个子目录如何操作

可以使用循环结构来批量创建子目录。以下是使...详情

师资团队 更多>>

陆神

原去哪儿网高级架构师

北京大学计算机系毕业

HTML5学科教研总监

千锋威哥

OCP认证专家

15年以上开发经验

Java学科首席技术官

宋宋

原阿里后端架构师

北京邮电大学硕士

Python学科首席技术官

卢老师

北京大学博士后

北京科技大学博士

人工智能学科总监

索尔

原阿里后端架构师

浙工大计算机系毕业

Java学科高级讲师

jackfrued

曾任职华为成都研究所

计算机应用技术博士

Python学科教学主管

快速通道 更多>>

课程介绍
点击获取大纲
就业前景
查看就业薪资
学习费用
了解课程价格
优惠活动
领取优惠券
学习资源
领3000G教程
师资团队
了解师资团队
实战项目
获取项目源码
开班地区
查看来校路线

最新开班信息更多>>

网友热搜更多>>

IT行业年龄有限制吗女生学IT Java薪资待遇零基础Web培训 Python就业如何学UI设计大数据学习路线 java培训学费软件测试培训转行学Linux 网络安全基础知识网络营销培训 unity培训 30岁还能学it吗大数据技术学什么 python培训费

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站