设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 技术文摘 查看内容

趣味编程:Python实现的随机森林

2013-6-12 09:39| 发布者: joejoe0332| 查看: 9023| 评论: 0|原作者: 开源中国社区|来自: 开源中国社区

摘要:   随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模拟的建模,统计客户来源,保留和流失。也可用来预测疾病的风险和病患者的易感性。   随机森 ...

  随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模拟的建模,统计客户来源,保留和流失。也可用来预测疾病的风险和病患者的易感性。

  随机森林是一个可做能够回归和分类。 它具备处理大数据的特性,而且它有助于估计或变量是非常重要的基础数据建模。

  这是一篇关于使用Python来实现随机森林文章。

  什么是随机森林?

  随机 森林 几乎 任何 预测 问题 (甚至 非直线 部分) 的固有 选择 它是 一个 相对较 机器 学习 策略 90 年代产生于 贝尔 实验室 ) 可以 几乎用于 任何方面 属于 机器 学习 算法 类----- 集成学习 方法

 

  集成学习

  集成学习通过建立几个模型组合解决单一预测问题工作原理是生成多个分类器/模型,各自独立地学习作出预测这些预测最后结合 预测因此优于任何一个单分类的做出预测

  随机森林是集成学习的一个子类,由于它依靠于策率合并。你可以在这找到用python实现集成学习的文档 Scikit 学习文档

  随机决策树

  我们 知道 随机 森林 是 其他 的模型 聚合, 但 它 聚合 了什么 类型 模型 ? 你 可能 已经 从 其 名称 、 随机 森林 聚合 分类(或 回归) 的 树 中猜到。 决策 树 是 由 一 系列 的 决策的组合, 可 用于 分类 观察 数据集 。

  随机森林

  算法引入了一个随机森林来 自动 创建 随机 决策 树 群 。 由于 树 随机 生成 的树, 大部分的树(或许 99.9%树) 不 会 对 学习 的 分类/回归 问题 都 有意义 。

  如果 观察到 长度 为 45 ,蓝 眼睛 , 和 2 条腿 , 就 被 归类 为 红色
  树的投票

  所以10000个(概率上)糟糕的模型有TMD什么好的?好吧,这样确实没什么特别地好处。但是随着很多糟糕的决策树被生成,其中也会有很少确实很优秀的决策树。

  当你要做预测的时候,新的观察到的特征随着决策树自上而下走下来,这样一组观察到的特征将会被贴上一个预测值/标签。一旦森林中的每棵树都给出了预测值/标签,所有的预测结果将被归总到一起,所有树的模式投票被返回做为最终的预测结果。

  简单来说,99.9%不相关的树做出的预测结果涵盖所有的情况,这些预测结果将会彼此抵消。少数优秀的树的预测结果将会超脱于芸芸“噪音”,做出一个好的预测。

 


酷毙
2

雷人

鲜花

鸡蛋

漂亮

刚表态过的朋友 (2 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号