常见问题

  • 安装失败 / 出现问题

    请参考 PyODPS 安装常见问题解决

  • 提示 Project not found

    Endpoint配置不对,详细配置参考 MaxCompute 开通 Region 和服务连接对照表 。 此外还需要注意 ODPS 入口对象参数位置是否填写正确。

  • 如何申请开通公共云 Python UDF

    公共云 Python UDF 目前处于公测阶段,可在 这里 申请开通,审批进度等信息可通过工单咨询。

  • 读取数据时报”project is protected”

    Project 上的安全策略禁止读取表中的数据,此时,如果想使用全部数据,有以下选项可用:

    • 联系 Project Owner 增加例外规则
    • 使用 DataWorks 或其他脱敏工具先对数据进行脱敏,导出到非保护 Project,再进行读取

    如果只想查看部分数据,有以下选项

    • 改用 o.execute_sql('select * from <table_name>').open_reader()
    • 改用 DataFrameo.get_table('<table_name>').to_df()
  • 出现 ImportError,并且在 ipython 或者 jupyter 下使用

    如果 from odps import errors 也不行,则是缺少 ipython 组件,执行 pip install -U jupyter 解决。

  • 执行 SQL 通过 open_reader 只能取到最多1万条记录,如何取多余1万条?

    使用 create table as select ... 把SQL的结果保存成表,再使用 table.open_reader 来读取。

  • 上传 pandas DataFrame 到 ODPS 时报错:ODPSError: ODPS entrance should be provided

    原因是没有找到全局的ODPS入口,有三个方法:

    • 使用 room 机制%enter 的时候,会配置全局入口
    • 对odps入口调用 to_global 方法
    • 使用odps参数,DataFrame(pd_df).persist('your_table', odps=odps)
  • 在 DataFrame 中如何使用 max_pt ?

    使用 odps.df.func 模块来调用 ODPS 内建函数

    from odps.df import func
    df = o.get_table('your_table').to_df()
    df[df.ds == func.max_pt('your_project.your_table')]  # ds 是分区字段