PyODPS: ODPS Python SDK and data analysis framework

PyODPS 是ODPS的Python版本的SDK, 它提供了对ODPS对象的基本操作;并提供了DataFrame框架,能轻松在ODPS上进行数据分析。

安装

PyODPS支持Python 2.6以上包括Python 3。系统安装了pip后,只需运行:

pip install pyodps

PyODPS的相关依赖会自动安装。

注意,对于Linux和Mac用户,先安装Cython,再运行安装pyodps命令,能加速Tunnel的上传和下载。

安装有 合适版本 Visual C++和Cython的Windows用户也可使用Tunnel加速功能, 但Visual C++ 2008及以下用户需要在编译器include目录中加入stdint.h头文件,否则会导致编译错误。该文件可在 这里 获得。

快速开始

首先,我们需要阿里云的帐号来初始化一个ODPS的入口:

from odps import ODPS

odps = ODPS('**your-access-id**', '**your-secret-access-key**', '**your-default-project**',
            endpoint='**your-end-point**')

这样就已经初始化,就可以对表、资源、函数等进行操作了。

在主入口,我们对于主要的ODPS对象都提供了最基本的几个操作,包括 listgetexistcreatedelete

我们会对这几部分来分别展开说明。