设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 软件追踪 查看内容

腾讯Angel 1.0正式版发布,机器学习高性能计算平台

2017-6-17 21:51| 发布者: joejoe0332| 查看: 376| 评论: 0|原作者: oschina|来自: oschina

摘要: 在去年 12 月 18 日的腾讯大数据技术峰会暨 KDD China 技术峰会上,腾讯大数据宣布推出了面向机器学习的「第三代高性能计算平台」——Angel,并表示将于 2017 年开放其源代码。现在,2017 年已经大约过去了一半, An ...

在去年 12 月 18 日的腾讯大数据技术峰会暨 KDD China 技术峰会上,腾讯大数据宣布推出了面向机器学习的「第三代高性能计算平台」——Angel,并表示将于 2017 年开放其源代码。现在,2017 年已经大约过去了一半, Angel 1.0 正式版发布了。

Angel 1.0.0 新特性:

1.ParameterServer 功能

  •  基于 Matrix/Vector 的模型自动切分和管理,兼顾稀疏和稠密两种格式

  •  支持对 Model 进行 Push 和 Pull 操作,可以自定义复杂的 psFunc

  •  提供多种同步控制机制(BSP/SSP/ASP)

2. 开发运行

  •  语言支持:系统基于 Scala 和 Java 开发,用户也可以自由选择

  •  部署方便:可以直接在 Yarn 社区版本中运行,也支持本地调试模式

  •  数据切分: 自动切分读取训练数据,默认兼容了 Hadoop FS 接口

  •  增量训练:训练过程中会自动 Checkpoint,而且支持加载模型后,增量训练

3.PS Service

  •  只启动 PSServer 和 PSAngent,为其他分布式计算平台提供 PS 服务

  •  基于 PS-Service,不需要修改 Spark 核心代码,直接开发 Spark-on-Angel 算法,该模式无缝支持 Breeze 数值运算库

4. 算法库

  •  集成 Logistic Regression,SVM,KMeans,LDA,MF,GBDT 等机器学习算法

  •  多种优化方法,包括 ADMM,OWLQN,LBFGS 和 GD

  •  支持多种损失函数、评估指标,包含 L1、L2 正则项

5. 算法优化

  •  LDA 采用了 F+LDA 算法用于加速采样的速度,同时利用流式参数获取的方法减少网络参数获取的延迟

  •  GBDT 使用两阶段树分裂算法,将部分计算转移到 PS,减少网络传输,提升速度

下载地址:


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部