James 发表于 2015-12-1 06:11:28

Python数据分析扩展库

  Anaconda和Python(x,y)都自带了下面的这些库。

1. NumPy
  强大的ndarray和ufunc函数。
  

import numpy as np  
xArray = np.ones((3, 4))
  
xArray
  
Out:
  
array([[ 1.,1.,1.,1.],
  [ 1.,1.,1.,1.],
  [ 1.,1.,1.,1.]])
  

2. SciPy
  科学计算(插值、积分、优化和图像处理)
  

from scipy import linalg  
arr = np.array([, ])
  
linalg.det(arr) #计算行列式
  
Out: -2.0
  

3. Matplotlib
  基于NumPy,二维绘图库,简单快速地生成曲线图、直方图和散点图等形式的图。
  
常用的pyplot是一个简单提供类似Matlab接口的模块。

4. Pandas
  基于SciPy和NumPy,拥有高效的Series和DataFrame数据结构,数据操作和分析能力非常强,拥有能够高效处理大数据集的切片等功能,提供优化库功能读写多种文件格式,如CSV, HDF5等
  

df.head(3) #头3行  
df.tail(4) #最后4行
  
df.sort(columns='score') #按照score列排序
  

  作者:liulixiang1988#gmail.com (#换成@)
  
参考链接:https://www.coursera.org/learn/hipython/home/welcome
页: [1]
查看完整版本: Python数据分析扩展库