分类 决策树 下的文章


撰写于    浏览:3139 次  分类: 决策树
1、基尼不纯度的定义基尼不纯度是决策树算法中非常重要的概念,对于它的理解可以有两个方面:(1)基尼不纯度的术语理解:从一个数据集中随机选取子项,度量其被错误的划分到其他组里的概率。(2)基尼不纯度的简单理解:一个随机事件变成它的对立事件的概率。2、基尼不纯度计算公式:(fi为某概率事件发生的概率)下图是相关曲线图,可以参考数据挖掘导论的98页:从上[...]

撰写于    浏览:331 次  分类: 决策树
scikit-learn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预处理到训练模型的各个方面。在实战使用scikit-learn中可以极大的节省我们编写决策树代码的时间以及减少代码量,使我们有更多的精力去分析数据分布,调整决策树模型和修改超参。但是,需要说明,scikit-learn提供的决策树工具类,只接受数值型的数据,不[...]

撰写于    浏览:206 次  分类: 决策树
本站的小册子:《决策树内参》,欢迎咨询。本书在我的个人淘宝小店有售:https://shop343278341.taobao.com/

撰写于    浏览:221 次  分类: 决策树
决策树算法例题:假设现在我们想预测的是,女性到底想要嫁什么样的人。我们现在手里拥有一些未婚男性的数据,其中包括了收入、房产、样貌、学历等字段。利用决策树的思想,构建出一个完整的决策树了,从此之后,有任何男青年放在这儿,我们都能通过决策树,轻松预测出,此人是否可嫁。决策树(Decision Tree)是一种以树形数据结构来展示决策规则和分类结果的模型[...]

撰写于    浏览:244 次  分类: 决策树
1、scikit-learn中的决策树决策树是一个非参数的监督式学习方法,主要用于分类和回归。决策树算法的目标是通过推断数据特征,学习决策规则从而创建一个预测目标变量的模型。scikit-learn中决策树的类都在sklearn.tree这个模块之下,这个模块总共包含五个类:2、scikit-learn的安装scikit-learn是一个用于机器学[...]