接口变化说明文档¶

一、模型模块相关¶

1.1 模型配置文件¶

存储目录变更：paddlex/configs 更新为 paddlex/configs/modules。
模块名变更，相关配置文件路径同样更新：
anomaly_detection 更新为 image_anomaly_detection
face_recognition 更新为 face_feature
general_recognition 更新为 image_feature
multilabel_classification 更新为 image_multilabel_classification
pedestrian_attribute 更新为 pedestrian_attribute_recognition
structure_analysis 更新为 layout_detection
table_recognition 更新为 table_structure_recognition
text_detection_seal 更新为 seal_text_detection
vehicle_attribute 更新为 vehicle_attribute_recognition

1.2 模型推理¶

1. `create_model()`¶

参数修改：
model_name：只能传入字符串类型的模型名。
新增参数：
- model_dir：指定本地推理模型文件目录，默认为 None，表示自动下载官方模型并使用。
- batch_size：指定推理时批处理的大小，默认为 1。
- 支持指定模型常见超参数，具体参数与模型任务相关，详见模型文档。例如，图像分类模型支持 topk。
- use_hpip 和 hpi_params：用于支持高性能推理，默认不开启。
功能更新：
支持 CV 类模型使用 PDF 文件作为输入样本。
预测结果仍为 dict 类型，但格式有所变化：{'key1': val} 改为 {"res": {'key': val}}，即以 "res" 作为键，原结果数据作为值。
使用 save_to_xxx() 方法保存预测结果时，若 save_path 为目录，存储文件命名方式有变更。例如，保存为 JSON 格式时为 输入文件前缀名_res.json；保存为图像格式时为 输入文件前缀名_res_img.输入文件后缀名。

二、模型产线相关¶

2.1 产线配置文件¶

配置文件存储目录变更：paddlex/pipelines 更新为 paddlex/configs/pipelines。
产线名称变更：
ts_fc 更新为 ts_forecast
ts_ad 更新为 ts_anomaly_detection
ts_cls 更新为 ts_classification

2.2 产线推理¶

1. 模型产线命令行推理¶

新增支持：
推理超参数，具体参数与产线相关，详见产线文档。例如，图像分类产线支持 --topk 参数，指定返回的前 n 个结果。
删除：
--serial_number，高性能推理不再需要传入序列号。

2. `create_pipeline()`¶

删除：
高性能推理 hpi_params 参数中的 serial_number 参数，高性能推理不再需要传入序列号。
不再支持：
产线推理超参数设置，相关参数设置均需通过产线配置文件完成，如 batch_size、阈值等。
功能更新：
使用 save_to_xxx() 方法保存预测结果时，若 save_path 为目录，存储文件命名方式更新。
CV类模型预测结果新增 page_index 字段，仅当输入的预测样本为PDF文件时，标志当前预测结果的页码序号。
模型产线预测结果新增产线推理参数字段，如 OCR 产线中新增 text_det_params 字段，值为文本检测模型的后处理设置。
配置文件格式更新：

产线配置文件内容更新后，分为三部分：产线名称、产线相关参数设置、子产线与子模块构成。例如：

pipeline_name: pipeline # 产线名称
threshold: 0.5 # 产线推理相关参数
SubPipelines: # 子产线
  DocPreprocessor:
    pipeline_name: doc_preprocessor
    use_doc_unwarping: True # 子产线 DocPreprocessor 的相关设置
SubModules: # 子模块
  TextDetection:
    module_name: text_detection
    model_name: PP-OCRv4_mobile_det
    model_dir: null
    limit_side_len: 960 # 子模块 TextDetection 的相关设置
    limit_type: max
    max_side_limit: 4000
    thresh: 0.3
    box_thresh: 0.6
    unclip_ratio: 1.5

三、产线功能变更¶

3.1 OCR 产线¶

新增功能：
文档预处理：支持整图方向分类与矫正，可通过配置文件 OCR.yaml 中相关参数控制。
文本行方向分类：可通过配置文件中相关参数控制。
支持修改模型推理超参数，如文本检测模型的后处理参数，可通过配置文件中相关参数控制。

3.2 印章识别与公式识别产线¶

新增功能：
文档预处理：支持整图方向分类与矫正，可通过配置文件中相关参数控制。
是否使用版面检测模型：可通过配置文件中相关参数控制。

3.3 表格识别产线¶

新增功能：
文档预处理：支持整图方向分类与矫正，可通过配置文件中相关参数控制。
是否使用 OCR 产线进行文本检测与识别：可通过配置文件中相关参数控制。

3.4 版面解析产线¶

更新功能：
支持更多推理超参数设置，如文档预处理、文本识别及模型后处理参数设置，均可在产线配置文件中进行设置。

3.5 PP-ChatOCRv3-doc 产线¶

新增功能：
支持标准 OpenAI API 接口调用，可通过配置文件中相关参数控制。
支持在 Chat 接口调用时更换大语言模型，可通过接口调用参数传入相关配置。
更新功能：
推理模块初始化：支持推理模块首次调用时进行初始化，无需在产线启动时全部初始化。
向量库：支持设置长文本分块大小，去除了调用向量库间隔时长控制。

接口变化说明文档¶

一、模型模块相关¶

1.1 模型配置文件¶

1.2 模型推理¶

1. create_model()¶

二、模型产线相关¶

2.1 产线配置文件¶

2.2 产线推理¶

1. 模型产线命令行推理¶

2. create_pipeline()¶

三、产线功能变更¶

3.1 OCR 产线¶

3.2 印章识别与公式识别产线¶

3.3 表格识别产线¶

3.4 版面解析产线¶

3.5 PP-ChatOCRv3-doc 产线¶

1. `create_model()`¶

2. `create_pipeline()`¶