设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 技术文摘 查看内容

国外程序员整理的机器学习资源大全

2014-7-22 12:03| 发布者: joejoe0332| 查看: 8971| 评论: 0|原作者: toolate|来自: 伯乐在线

摘要: 本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。


Python

计算机视觉

  • SimpleCV—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。使用Python编写,可以在Mac、Windows以及Ubuntu上运行。

自然语言处理

  • NLTK —一个领先的平台,用来编写处理人类语言数据的Python程序

  • Pattern—Python可用的web挖掘模块,包括自然语言处理、机器学习等工具。

  • TextBlob—为普通自然语言处理任务提供一致的API,以NLTK和Pattern为基础,并和两者都能很好兼容。

  • jieba—中文断词工具。

  • SnowNLP —中文文本处理库。

  • loso—另一个中文断词库。

  • genius —基于条件随机域的中文断词库。

  • nut —自然语言理解工具包。

通用机器学习

  • Bayesian Methods for Hackers —Python语言概率规划的电子书

  • MLlib in Apache Spark—Spark下的分布式机器学习库。

  • scikit-learn—基于SciPy的机器学习模块

  • graphlab-create —包含多种机器学习模块的库(回归,聚类,推荐系统,图分析等),基于可以磁盘存储的DataFrame。

  • BigML—连接外部服务器的库。

  • pattern—Python的web挖掘模块

  • NuPIC—Numenta公司的智能计算平台。

  • Pylearn2—基于Theano的机器学习库。

  • hebel —Python编写的使用GPU加速的深度学习库。

  • gensim—主题建模工具。

  • PyBrain—另一个机器学习库。

  • Crab —可扩展的、快速推荐引擎。

  • python-recsys —Python实现的推荐系统。

  • thinking bayes—关于贝叶斯分析的书籍

  • Restricted Boltzmann Machines —Python实现的受限波尔兹曼机。[深度学习]。

  • Bolt —在线学习工具箱。

  • CoverTree —cover tree的Python实现,scipy.spatial.kdtree便捷的替代。

  • nilearn—Python实现的神经影像学机器学习库。

  • Shogun—机器学习工具箱。

  • Pyevolve —遗传算法框架。

  • Caffe —考虑了代码清洁、可读性及速度的深度学习框架

  • breze—深度及递归神经网络的程序库,基于Theano。

数据分析/数据可视化

  • SciPy —基于Python的数学、科学、工程开源软件生态系统。

  • NumPy—Python科学计算基础包。

  • Numba —Python的低级虚拟机JIT编译器,Cython and NumPy的开发者编写,供科学计算使用

  • NetworkX —为复杂网络使用的高效软件。

  • Pandas—这个库提供了高性能、易用的数据结构及数据分析工具。

  • Open Mining—Python中的商业智能工具(Pandas web接口)。

  • PyMC —MCMC采样工具包。

  • zipline—Python的算法交易库。

  • PyDy—全名Python Dynamics,协助基于NumPy, SciPy, IPython以及 matplotlib的动态建模工作流。

  • SymPy —符号数学Python库。

  • statsmodels—Python的统计建模及计量经济学库。

  • astropy —Python天文学程序库,社区协作编写

  • matplotlib —Python的2D绘图库。

  • bokeh—Python的交互式Web绘图库。

  • plotly —Python and matplotlib的协作web绘图库。

  • vincent—将Python数据结构转换为Vega可视化语法。

  • d3py—Python的绘图库,基于D3.js。

  • ggplot —和R语言里的ggplot2提供同样的API。

  • Kartograph.py—Python中渲染SVG图的库,效果漂亮。

  • pygal—Python下的SVG图表生成器。

  • pycascading

杂项脚本/iPython笔记/代码库

Kaggle竞赛源代码

Ruby

自然语言处理

  • Treat—文本检索与注释工具包,Ruby上我见过的最全面的工具包。

  • Ruby Linguistics—这个框架可以用任何语言为Ruby对象构建语言学工具。包括一个语言无关的通用前端,一个将语言代码映射到语言名的模块,和一个含有很有英文语言工具的模块。

  • Stemmer—使得Ruby可用 libstemmer_c中的接口。

  • Ruby Wordnet —WordNet的Ruby接口库。

  • Raspel —aspell绑定到Ruby的接口

  • UEA Stemmer—UEALite Stemmer的Ruby移植版,供搜索和检索用的保守的词干分析器

  • Twitter-text-rb—该程序库可以将推特中的用户名、列表和话题标签自动连接并提取出来。

通用机器学习

数据分析/数据可视化

Misc
杂项


酷毙

雷人
1

鲜花

鸡蛋

漂亮

刚表态过的朋友 (1 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部