配置选项

PyODPS 提供了一系列的配置选项,可通过 odps.options 获得。下面列出了可配的 ODPS 选项。

通用配置

选项 说明 默认值
end_point ODPS Endpoint None
default_project 默认 Project None
log_view_host LogView 主机名 None
log_view_hours LogView 保持时间(小时) 24
tunnel_endpoint Tunnel Endpoint None
lifecycle 所有表生命周期 None
temp_lifecycle 临时表生命周期 1
biz_id 用户 ID None
verbose 是否打印日志 False
verbose_log 日志接收器 None
chunk_size 写入缓冲区大小 1496
retry_times 请求重试次数 4
connect_timeout 连接超时 5
read_timeout 读取超时 120
table_read_limit 表下载条数限制 None
completion_size 对象补全列举条数限制 10
notebook_repr_widget 使用交互式图表 True
sql.settings ODPS SQL运行全局hints None
runner.parallel_num 最多并行执行作业数 5
runner.retry_times 最大重试次数 3

DataFrame 配置

选项 说明 默认值
interactive 是否在交互式环境 根据检测值
df.analyze 是否启用非 ODPS 内置函数 True
df.optimize 是否开启DataFrame全部优化 True
df.optimizes.pp 是否开启DataFrame谓词下推优化 True
df.optimizes.cp 是否开启DataFrame列剪裁优化 True
df.optimizes.tunnel 是否开启DataFrame使用tunnel优化执行 True
df.quote ODPS SQL后端是否用``来标记字段和表名 True
df.libraries DataFrame运行使用的第三方库(资源名) None

机器学习配置

选项 说明 默认值
ml.xflow_project 默认 Xflow 工程名 algo_public
ml.auto_transfer_pmml 默认 Xflow 工程名 algo_public