配置选项

PyODPS 提供了一系列的配置选项,可通过 odps.options 获得。下面列出了可配的 ODPS 选项。

通用配置

选项 说明 默认值
end_point ODPS Endpoint None
default_project 默认 Project None
log_view_host LogView 主机名 None
log_view_hours LogView 保持时间(小时) 24
tunnel_endpoint Tunnel Endpoint None
local_timezone 使用的时区,True 表示本地时间,False 表示 UTC, 也可用 pytz 的时区 1
lifecycle 所有表生命周期 None
temp_lifecycle 临时表生命周期 1
biz_id 用户 ID None
verbose 是否打印日志 False
verbose_log 日志接收器 None
chunk_size 写入缓冲区大小 1496
retry_times 请求重试次数 4
connect_timeout 连接超时 5
read_timeout 读取超时 120
use_instance_tunnel 使用 Instance Tunnel 获取执行结果 True
limited_instance_tunnel 限制 Instance Tunnel 获取结果的条数 True
completion_size 对象补全列举条数限制 10
notebook_repr_widget 使用交互式图表 True
sql.settings ODPS SQL运行全局hints None

DataFrame 配置

选项 说明 默认值
interactive 是否在交互式环境 根据检测值
df.analyze 是否启用非 ODPS 内置函数 True
df.optimize 是否开启DataFrame全部优化 True
df.optimizes.pp 是否开启DataFrame谓词下推优化 True
df.optimizes.cp 是否开启DataFrame列剪裁优化 True
df.optimizes.tunnel 是否开启DataFrame使用tunnel优化执行 True
df.quote ODPS SQL后端是否用``来标记字段和表名 True
df.libraries DataFrame运行使用的第三方库(资源名) None

机器学习配置

选项 说明 默认值
ml.xflow_project 默认 Xflow 工程名 algo_public
ml.use_model_transfer 是否使用 ModelTransfer 获取模型 PMML True
ml.model_volume 在使用 ModelTransfer 时使用的 Volume 名称 pyodps_volume