算法工程师在实际求职面试中,决策树内容几乎是机器学习领域必考必问的知识点,因为它不仅是常见的机器学习模型,更是在许多互联网公司实际业务中得到广泛的使用。决策树模型具有可解释性,容易向业务部门人员描述。而且决策树模型分类速度很快,很受互联网公司的欢迎。

决策树面试问题1:什么是决策树?

决策树面试问题2:和其他模型比,决策树的优点?

决策树面试问题3:如何学习一棵决策树?

决策树面试问题4:构建决策树的过程中,如何选择最优特征呢?

决策树面试问题5:构建决策树过程中,递归的终止条件是什么呢?

答案:

通常有两个终止条件:一是所有训练数据子集被基本正确分类。二是没有合适的特征可选,即可用特征为0,或者可用特征的信息增益或信息增益比都很小了。

决策树面试问题6:什么是决策树剪枝,怎么剪枝?

决策树面试问题7:决策树几种常用的算法如何选择划分的特征?

答案:

常用的几种决策树算法有ID3、C4.5、CART等。其中ID3使用的是信息熵增益选大的方法划分数据,C4.5是使用增益率选大的方法划分数据,CART使用的是基尼指数选小的划分方法。

决策树面试问题8:如何防止过拟合?

决策树面试问题9:什么是随机森林?

决策树面试问题10:决策树模型的特征选择中,除了信息增益、信息增益比、基尼指数这三个外,你知道的还有哪些呢?