Pandas v0.15.0 final 发布,此版本现已提供下载,主要是大量的 API 改进,一些新特性,功能增强和性能提升,还有大量的 bug 修复,具体更新内容如下:
Drop support for numpy < 1.7.0 The Categorical type was integrated as a first-class pandas type New scalar type Timedelta , and a new index type TimedeltaIndex New DataFrame default display for df.info() to include memory usage New datetimelike properties accessor .dt for Series Split indexing documentation into Indexing and Selecting Data and MultiIndex / Advanced Indexing Split out string methods documentation into Working with Text Data read_csv will now by default ignore blank lines when parsing
API change in using Indexes in set operations Internal refactoring of the Index class to no longer sub-class ndarray dropping support for PyTables less than version 3.0.0, and numexpr less than version 2.1
更多内容请看 Whatsnew。
Python Data Analysis Library 或 pandas 是连接 SciPy 和 NumPy
的一种工具,该工具是为了解决数据分析任务而创建的。Pandas
纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Comma-separated values (CSV)
文件表示在有关各方之间分发数据的最常见的方法之一。Pandas 提供了一种优化库功能来读写多种文件格式,包括 CSV 和高效的 HDF5 格式。 |