ml-ease是LinkedIn的一个开源的大规模机器学习库,目前拥有基于大规模逻辑回归的ADMM(交替方向法乘数,Alternating Direction Method of Multipliers)。 代码托管地址:https://github.com/linkedin/ml-ease ml-ease支持在单个机器上模型拟合/培训、支持Hadoop集群和Spark集群,强调可伸缩性、速度和易用性。对于开发人员来说,ml-ease是一个在大数据机器学习应用方面非常有用的工具。 ml- ease目前支持ADMM二进制逻辑回归响应预测,基于L1和L2规则。其中,ADMM代表交替方向法乘数(Boyd et al . 2011年)。ADMM的基本思想如下:ADMM认为大规模逻辑回归模型拟合与约束凸优化问题。同时最大限度地减少用户定义的损失函数,它会强制系数从所 有分区都等于一个额外的约束。 为了解决这个优化问题,ADMM使用一个迭代过程。对于每个迭代它将大数据划分成许多小的分区,并为每个分区适配一个独立的逻辑回归。然后,它汇总从所有分区收集的系数,学习的共识系数,并将其发送回给所有分区重新培训。 在10-20此迭代之后,最终融合的解决方案理论上是接近你在单个机器上获得的。 快速启动: 安装: 使用 maven to 来编译,命令: "mvn clean install" 运行 ADMM:
转自:http://code.csdn.net/news/2821915 |