跳转至

PaddleX时序任务模型配置文件参数说明

Global

参数名 数据类型 描述 默认值
model str 指定模型名称 yaml文件中指定的模型名称
mode str 指定模式(check_dataset/train/evaluate/export/predict) check_dataset
dataset_dir str 数据集路径 yaml文件中指定的数据集路径
device str 指定使用的设备 yaml文件中指定的设备id
output str 输出路径 "output"

CheckDataset

参数名 数据类型 描述 默认值
convert.enable bool 是否进行数据集格式转换;时序预测、时序异常检测、时序分类支持xlsx和xls格式的数据转换 False
convert.src_dataset_type str 需要转换的源数据集格式 null
split.enable bool 是否重新划分数据集 False
split.train_percent int 设置训练集的百分比,类型为0-100之间的任意整数,需要保证和val_percent值加和为100; null
split.val_percent int 设置验证集的百分比,类型为0-100之间的任意整数,需要保证和train_percent值加和为100; null

Train

时序任务公共参数

参数名 数据类型 描述 默认值
epochs_iters int 模型对训练数据的重复学习次数 yaml文件中指定的重复学习次数
batch_size int 批大小 yaml文件中指定的批大小
learning_rate float 初始学习率 yaml文件中指定的初始学习率
time_col str 时间列,须结合自己的数据设置时间序列数据集的时间列的列名称。 yaml文件中指定的时间列
freq str or int 频率,须结合自己的数据设置时间频率,如:1min、5min、1h。 yaml文件中指定的频率

时序预测参数

参数名 数据类型 描述 默认值
target_cols str 目标变量列,须结合自己的数据设置时间序列数据集的目标变量的列名称,可以为多个,多个之间用','分隔 OT
input_len int 对于时序预测任务,该参数表示输入给模型的历史时间序列长度;输入长度建议结合实际场景及预测长度综合考虑,一般来说设置的越大,能够参考的历史信息越多,模型精度通常越高。 96
predict_len int 希望模型预测未来序列的长度;预测长度建议结合实际场景综合考虑,一般来说设置的越大,希望预测的未来序列越长,模型精度通常越低。 96
patience int early stop机制参数,指在停止训练之前,容忍模型在验证集上的性能多少次连续没有改进;耐心值越大,一般训练时间越长。 10

时序异常检测

参数名 数据类型 描述 默认值
input_len int 对于时序异常检测任务,该参数表示输入给模型的时间序列长度,会按照该长度对时间序列切片,预测该长度下这一段时序序列是否有异常;输入长度建议结合实际场景考虑。如:输入长度为 96,则表示希望预测 96 个时间点是否有异常。 96
feature_cols str 特征变量表示能够判断设备是否异常的相关变量,例如设备是否异常,可能与设备运转时的散热量有关。结合自己的数据,设置特征变量的列名称,可以为多个,多个之间用','分隔。 feature_0,feature_1
label_col str 代表时序时间点是否异常的编号,异常点为 1,正常点为 0。 label

时序分类

参数名 数据类型 描述 默认值
target_cols str 用于判别类别的特征变量列,须结合自己的数据设置时间序列数据集的目标变量的列名称,可以为多个,多个之间用','分隔 dim_0,dim_1,dim_2
freq str or int 频率,须结合自己的数据设置时间频率,如:1min、5min、1h。 1
group_id str 一个群组编号表示的是一个时序样本,相同编号的时序序列组成一个样本。结合自己的数据设置指定群组编号的列名称, 如:group_id。 group_id
static_cov_cols str 代表时序的类别编号列,同一个样本的标签相同。结合自己的数据设置类别的列名称,如:label。 label

Evaluate

参数名 数据类型 描述 默认值
weight_path str 评估模型路径 默认训练产出的本地路径,当指定为None时,表示使用官方权重

Export

参数名 数据类型 描述 默认值
weight_path str 导出模型的动态图权重路径 默认训练产出的本地路径,当指定为None时,表示使用官方权重

Predict

参数名 数据类型 描述 默认值
batch_size int 预测批大小 yaml文件中指定的预测批大小
model_dir str 预测模型路径 默认训练产出的本地推理模型路径,当指定为None时,表示使用官方权重
input str 预测输入路径 yaml文件中指定的预测输入路径

评论