设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 技术文摘 查看内容

国外程序员整理的机器学习资源大全

2014-7-22 12:03| 发布者: joejoe0332| 查看: 8967| 评论: 0|原作者: toolate|来自: 伯乐在线

摘要: 本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。

  本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。

C++

计算机视觉

  • CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库

  • OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。

通用机器学习

Closure

通用机器学习

Go

自然语言处理

  • go-porterstemmer—一个Porter词干提取算法的原生Go语言净室实现

  • paicehusk—Paice/Husk词干提取算法的Go语言实现

  • snowball—Go语言版的Snowball词干提取器

通用机器学习

  • Go Learn— Go语言机器学习库

  • go-pr —Go语言机器学习包.

  • bayesian—Go语言朴素贝叶斯分类库。

  • go-galib—Go语言遗传算法库。


数据分析/数据可视化

  • go-graph—Go语言图形库。

  • SVGo—Go语言的SVG生成库。

Java

自然语言处理

  • CoreNLP—斯坦福大学的CoreNLP提供一系列的自然语言处理工具,输入原始英语文本,可以给出单词的基本形式(下面Stanford开头的几个工具都包含其中)。

  • Stanford Parser—一个自然语言解析器。

  • Stanford POS Tagger —一个词性分类器。

  • Stanford Name Entity Recognizer—Java实现的名称识别器

  • Stanford Word Segmenter—分词器,很多NLP工作中都要用到的标准预处理步骤。

  • Tregex, Tsurgeon and Semgrex —用来在树状数据结构中进行模式匹配,基于树关系以及节点匹配的正则表达式(名字是“tree regular expressions”的缩写)。

  • Stanford Phrasal:最新的基于统计短语的机器翻译系统, java编写

  • Stanford Tokens Regex—用以定义文本模式的框架。

  • Stanford Temporal Tagger—SUTime是一个识别并标准化时间表达式的库。

  • Stanford SPIED—在种子集上使用模式,以迭代方式从无标签文本中学习字符实体

  • Stanford Topic Modeling Toolbox —为社会科学家及其他希望分析数据集的人员提供的主题建模工具。

  • Twitter Text Java—Java实现的推特文本处理库

  • MALLET -—基于Java的统计自然语言处理、文档分类、聚类、主题建模、信息提取以及其他机器学习文本应用包。

  • OpenNLP—处理自然语言文本的机器学习工具包。

  • LingPipe —使用计算机语言学处理文本的工具包。


通用机器学习

  • MLlib in Apache Spark—Spark中的分布式机器学习程序库

  • Mahout —分布式的机器学习库

  • Stanford Classifier —斯坦福大学的分类器

  • Weka—Weka是数据挖掘方面的机器学习算法集。

  • ORYX—提供一个简单的大规模实时机器学习/预测分析基础架构。

数据分析/数据可视化

  • Hadoop—大数据分析平台

  • Spark—快速通用的大规模数据处理引擎。

  • Impala —为Hadoop实现实时查询

Javascript

自然语言处理

  • Twitter-text-js —JavaScript实现的推特文本处理库

  • NLP.js —javascript及coffeescript编写的NLP工具

  • natural—Node下的通用NLP工具

  • Knwl.js—JS编写的自然语言处理器

数据分析/数据可视化


通用机器学习

  • Convnet.js—训练深度学习模型的JavaScript库。

  • Clustering.js—用JavaScript实现的聚类算法,供Node.js及浏览器使用。

  • Decision Trees—Node.js实现的决策树,使用ID3算法。

  • Node-fann —Node.js下的快速人工神经网络库。

  • Kmeans.js—k-means算法的简单Javascript实现,供Node.js及浏览器使用。

  • LDA.js —供Node.js用的LDA主题建模工具。

  • Learning.js—逻辑回归/c4.5决策树的JavaScript实现

  • Machine Learning—Node.js的机器学习库。

  • Node-SVM—Node.js的支持向量机

  • Brain —JavaScript实现的神经网络

  • Bayesian-Bandit —贝叶斯强盗算法的实现,供Node.js及浏览器使用。

Julia

通用机器学习

  • PGM—Julia实现的概率图模型框架。

  • DA—Julia实现的正则化判别分析包。

  • Regression—回归分析算法包(如线性回归和逻辑回归)。

  • Local Regression —局部回归,非常平滑!

  • Naive Bayes —朴素贝叶斯的简单Julia实现

  • Mixed Models —(统计)混合效应模型的Julia包

  • Simple MCMC —Julia实现的基本mcmc采样器

  • Distance—Julia实现的距离评估模块

  • Decision Tree —决策树分类器及回归分析器

  • Neural —Julia实现的神经网络

  • MCMC —Julia下的MCMC工具

  • GLM —Julia写的广义线性模型包

  • Online Learning

  • GLMNet —GMLNet的Julia包装版,适合套索/弹性网模型。

  • Clustering—数据聚类的基本函数:k-means, dp-means等。

  • SVM—Julia下的支持向量机。

  • Kernal Density—Julia下的核密度估计器

  • Dimensionality Reduction—降维算法

  • NMF —Julia下的非负矩阵分解包

  • ANN—Julia实现的神经网络

自然语言处理

数据分析/数据可视化

杂项/演示文稿


酷毙

雷人
1

鲜花

鸡蛋

漂亮

刚表态过的朋友 (1 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部