接口变化说明文档¶
一、模型模块相关¶
1.1 模型配置文件¶
- 存储目录变更:paddlex/configs更新为paddlex/configs/modules。
- 模块名变更,相关配置文件路径同样更新:
- anomaly_detection更新为- image_anomaly_detection
- face_recognition更新为- face_feature
- general_recognition更新为- image_feature
- multilabel_classification更新为- image_multilabel_classification
- pedestrian_attribute更新为- pedestrian_attribute_recognition
- structure_analysis更新为- layout_detection
- table_recognition更新为- table_structure_recognition
- text_detection_seal更新为- seal_text_detection
- vehicle_attribute更新为- vehicle_attribute_recognition
1.2 模型推理¶
1. create_model()¶
- 参数修改:
- model_name:只能传入字符串类型的模型名。
- 
新增参数: - model_dir:指定本地推理模型文件目录,默认为- None,表示自动下载官方模型并使用。
- batch_size:指定推理时批处理的大小,默认为- 1。
- 支持指定模型常见超参数,具体参数与模型任务相关,详见模型文档。例如,图像分类模型支持 topk。
- use_hpip和- hpi_params:用于支持高性能推理,默认不开启。
 
- 
功能更新: 
- 支持 CV 类模型使用 PDF 文件作为输入样本。
- 预测结果仍为 dict类型,但格式有所变化:{'key1': val}改为{"res": {'key': val}},即以"res"作为键,原结果数据作为值。
- 使用 save_to_xxx()方法保存预测结果时,若save_path为目录,存储文件命名方式有变更。例如,保存为 JSON 格式时为输入文件前缀名_res.json;保存为图像格式时为输入文件前缀名_res_img.输入文件后缀名。
二、模型产线相关¶
2.1 产线配置文件¶
- 配置文件存储目录变更:paddlex/pipelines更新为paddlex/configs/pipelines。
- 产线名称变更:
- ts_fc更新为- ts_forecast
- ts_ad更新为- ts_anomaly_detection
- ts_cls更新为- ts_classification
2.2 产线推理¶
1. 模型产线命令行推理¶
- 新增支持:
- 推理超参数,具体参数与产线相关,详见产线文档。例如,图像分类产线支持 --topk参数,指定返回的前 n 个结果。
- 删除:
- --serial_number,高性能推理不再需要传入序列号。
2. create_pipeline()¶
- 删除:
- 高性能推理 hpi_params参数中的serial_number参数,高性能推理不再需要传入序列号。
- 不再支持:
- 产线推理超参数设置,相关参数设置均需通过产线配置文件完成,如 batch_size、阈值等。
- 功能更新:
- 使用 save_to_xxx()方法保存预测结果时,若save_path为目录,存储文件命名方式更新。
- CV类模型预测结果新增 page_index字段,仅当输入的预测样本为PDF文件时,标志当前预测结果的页码序号。
- 模型产线预测结果新增产线推理参数字段,如 OCR 产线中新增 text_det_params字段,值为文本检测模型的后处理设置。
- 配置文件格式更新:
- 
产线配置文件内容更新后,分为三部分:产线名称、产线相关参数设置、子产线与子模块构成。例如: pipeline_name: pipeline # 产线名称 threshold: 0.5 # 产线推理相关参数 SubPipelines: # 子产线 DocPreprocessor: pipeline_name: doc_preprocessor use_doc_unwarping: True # 子产线 DocPreprocessor 的相关设置 SubModules: # 子模块 TextDetection: module_name: text_detection model_name: PP-OCRv4_mobile_det model_dir: null limit_side_len: 960 # 子模块 TextDetection 的相关设置 limit_type: max max_side_limit: 4000 thresh: 0.3 box_thresh: 0.6 unclip_ratio: 1.5
三、产线功能变更¶
3.1 OCR 产线¶
- 新增功能:
- 文档预处理:支持整图方向分类与矫正,可通过配置文件 OCR.yaml中相关参数控制。
- 文本行方向分类:可通过配置文件中相关参数控制。
- 支持修改模型推理超参数,如文本检测模型的后处理参数,可通过配置文件中相关参数控制。
3.2 印章识别与公式识别产线¶
- 新增功能:
- 文档预处理:支持整图方向分类与矫正,可通过配置文件中相关参数控制。
- 是否使用版面检测模型:可通过配置文件中相关参数控制。
3.3 表格识别产线¶
- 新增功能:
- 文档预处理:支持整图方向分类与矫正,可通过配置文件中相关参数控制。
- 是否使用 OCR 产线进行文本检测与识别:可通过配置文件中相关参数控制。
3.4 版面解析产线¶
- 更新功能:
- 支持更多推理超参数设置,如文档预处理、文本识别及模型后处理参数设置,均可在产线配置文件中进行设置。
3.5 PP-ChatOCRv3-doc 产线¶
- 新增功能:
- 支持标准 OpenAI API 接口调用,可通过配置文件中相关参数控制。
- 
支持在 Chat 接口调用时更换大语言模型,可通过接口调用参数传入相关配置。 
- 
更新功能: 
- 推理模块初始化:支持推理模块首次调用时进行初始化,无需在产线启动时全部初始化。
- 向量库:支持设置长文本分块大小,去除了调用向量库间隔时长控制。