撰写于    浏览:589 次  分类: 决策树
1、基尼不纯度的定义基尼不纯度是决策树算法中非常重要的概念,对于它的理解可以有两个方面:(1)基尼不纯度的术语理解:从一个数据集中随机选取子项,度量其被错误的划分到其他组里的概率。(2)基尼不纯度的简单理解:一个随机事件变成它的对立事件的概率。2、基尼不纯度计算公式:(fi为某概率事件发生的概率)下图是相关曲线图,可以参考数据挖掘导论的98页:从上[...]

撰写于    浏览:239 次  分类: 决策树
scikit-learn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预处理到训练模型的各个方面。在实战使用scikit-learn中可以极大的节省我们编写决策树代码的时间以及减少代码量,使我们有更多的精力去分析数据分布,调整决策树模型和修改超参。但是,需要说明,scikit-learn提供的决策树工具类,只接受数值型的数据,不[...]

撰写于    浏览:142 次  分类: 决策树
本站的小册子:《决策树内参》,欢迎咨询。本书在我的个人淘宝小店有售:https://shop343278341.taobao.com/

撰写于    浏览:129 次  分类: 决策树
决策树算法例题:假设现在我们想预测的是,女性到底想要嫁什么样的人。我们现在手里拥有一些未婚男性的数据,其中包括了收入、房产、样貌、学历等字段。利用决策树的思想,构建出一个完整的决策树了,从此之后,有任何男青年放在这儿,我们都能通过决策树,轻松预测出,此人是否可嫁。决策树(Decision Tree)是一种以树形数据结构来展示决策规则和分类结果的模型[...]

撰写于    浏览:158 次  分类: 决策树面试
算法工程师在实际求职面试中,决策树内容几乎是机器学习领域必考必问的知识点,因为它不仅是常见的机器学习模型,更是在许多互联网公司实际业务中得到广泛的使用。决策树模型具有可解释性,容易向业务部门人员描述。而且决策树模型分类速度很快,很受互联网公司的欢迎。决策树面试问题1:什么是决策树?决策树面试问题2:和其他模型比,决策树的优点?决策树面试问题3:如何[...]