在1970年代,心理学家昆兰找到了用信息论来度量决策树的决策选择过程,原理是对于按照样本的特征进行分支,每一步都判断按照当前某个特征进行分类时,信息熵是否是最大的。昆兰将这个算法称为ID3.
ID3算法:
首先,信息论中熵的概念,熵是度量事物的不确定性,越不确定的事物,它的熵就越大。对于随机变量X的熵的表达式表示如下:
刚才提到了![image](https://yqfile.alicdn.com/6ba4d95325bda6d6ba01f657ba451dd9ba076cab.png)
时间: 2024-12-11 12:10:38