决策树算法及应用拓展(附PPT教程) |
|
|
| 作者:佚名 文章来源:互联网 点击数: 更新时间:2005-12-8 10:11:46 |
|
|
|
决策树算法及应用拓展 概述(一) 概述(二) 预备知识一(Building Tree) 使用决策树进行分类 决策树算法 伪代码(Building Tree) 属性选择的统计度量 信息增益度度量(ID3/C4.5) 训练集(举例) 使用信息增益进行属性选择 Decision Tree (结果输出) 基尼指数 Gini Index (IBM IntelligentMiner) 预备知识二(Pruning Tree) 两种剪枝标准 Cost of Encoding Data Records Cost of Encoding Tree 剪枝算法 计算最小子树代价的伪代码 引入Public算法 具体思路 改进算法的伪代码 计算子树代价下界 Public(S)算法(一) 相关概念 Public(S)算法(二) Public(S)算法(证明一) Public(S)算法(证明二) 计算minCost_S的代码 Public(S)示例 Public(V)算法 计算分类节点值的代价: 编码叶子节点记录的代价 i=1..k (1) 在所有内部节点编码分裂节点值的代价 (2) 总代价 (1)+(2) 其中,Cj是叶子节点j上的主要类;M是S+1个叶子节点上的主要类的集合 算法比较 实验数据(Real-life) 实验结果(一) 实验结果(二) 算法结果分析 言归正传—捕捉数据变化的挖掘方法 方法三的对应算法 标识几种不同的变化类型 小结 个人观点 计算分裂点属性代价下界的算法代码
附件:决策树算法及应用拓展(PPT教程) |
| 文章录入:mind99 责任编辑:mind99 |
|
上一篇文章: 没有了 下一篇文章: 奥美策略思考白皮书(全文见附件PPT) |
| 【字体:小 大】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 |