设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

LinkedIn开源的机器学习工具包:ml-ease

2014-10-8 16:08| 发布者: joejoe0332| 查看: 1753| 评论: 0|原作者: CSDN CODE|来自: CSDN CODE

摘要: ml-ease是LinkedIn的一个开源的大规模机器学习库,目前拥有基于大规模逻辑回归的ADMM(交替方向法乘数,Alternating Direction Method of Multipliers)。

  ml-ease是LinkedIn的一个开源的大规模机器学习库,目前拥有基于大规模逻辑回归的ADMM(交替方向法乘数,Alternating Direction Method of Multipliers)。


  代码托管地址:https://github.com/linkedin/ml-ease


  ml-ease支持在单个机器上模型拟合/培训、支持Hadoop集群和Spark集群,强调可伸缩性、速度和易用性。对于开发人员来说,ml-ease是一个在大数据机器学习应用方面非常有用的工具。


  ml- ease目前支持ADMM二进制逻辑回归响应预测,基于L1和L2规则。其中,ADMM代表交替方向法乘数(Boyd et al . 2011年)。ADMM的基本思想如下:ADMM认为大规模逻辑回归模型拟合与约束凸优化问题。同时最大限度地减少用户定义的损失函数,它会强制系数从所 有分区都等于一个额外的约束。


  为了解决这个优化问题,ADMM使用一个迭代过程。对于每个迭代它将大数据划分成许多小的分区,并为每个分区适配一个独立的逻辑回归。然后,它汇总从所有分区收集的系数,学习的共识系数,并将其发送回给所有分区重新培训。


  在10-20此迭代之后,最终融合的解决方案理论上是接近你在单个机器上获得的。



快速启动:

安装: 使用 maven to 来编译,命令: "mvn clean install"


运行 ADMM:

  • 复制 jar ./target/ml-ease-1.0-jar-with-dependencies.jar到hadoop网关。然后创建配置文件如: ./examples/sample-config.job.
  • 执行Admm:hadoop jar ml-ease-1.0-jar-with-dependencies.jar com.linkedin.ml-ease.regression.jobs.Regression sample-config.job.


  详细配置方法见 这里。关于ml-ease的介绍请查看这里


  转自:http://code.csdn.net/news/2821915


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部