跳转至

PaddleX模型列表(CPU/GPU)

PaddleX 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型推理速度,请选择推理速度较快的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。

图像分类模块

模型名称 Top1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
CLIP_vit_base_patch16_224 85.36 12.03 / 2.49 60.86 / 42.69 331 CLIP_vit_base_patch16_224.yaml 推理模型/训练模型
CLIP_vit_large_patch14_224 88.1 49.15 / 9.75 223.16 / 206.49 1040 CLIP_vit_large_patch14_224.yaml 推理模型/训练模型
ConvNeXt_base_224 83.84 11.37 / 5.65 143.98 / 52.31 313.9 ConvNeXt_base_224.yaml 推理模型/训练模型
ConvNeXt_base_384 84.90 29.48 / 11.17 293.76 / 134.27 313.9 ConvNeXt_base_384.yaml 推理模型/训练模型
ConvNeXt_large_224 84.26 22.99 / 12.73 220.79 / 113.24 700.7 ConvNeXt_large_224.yaml 推理模型/训练模型
ConvNeXt_large_384 85.27 58.90 / 24.63 509.48 / 260.27 700.7 ConvNeXt_large_384.yaml 推理模型/训练模型
ConvNeXt_small 83.13 7.72 / 4.35 95.92 / 33.34 178.0 ConvNeXt_small.yaml 推理模型/训练模型
ConvNeXt_tiny 82.03 6.00 / 2.47 63.59 / 18.23 101.4 ConvNeXt_tiny.yaml 推理模型/训练模型
FasterNet-L 83.5 11.96 / 2.68 51.93 / 35.33 357.1 FasterNet-L.yaml 推理模型/训练模型
FasterNet-M 83.0 11.17 / 2.16 38.49 / 21.17 204.6 FasterNet-M.yaml 推理模型/训练模型
FasterNet-S 81.3 7.70 / 1.24 19.51 / 11.22 119.3 FasterNet-S.yaml 推理模型/训练模型
FasterNet-T0 71.9 4.73 / 0.82 6.40 / 1.96 15.1 FasterNet-T0.yaml 推理模型/训练模型
FasterNet-T1 75.9 4.80 / 0.80 8.14 / 3.13 29.2 FasterNet-T1.yaml 推理模型/训练模型
FasterNet-T2 79.1 6.10 / 0.88 12.71 / 5.35 57.4 FasterNet-T2.yaml 推理模型/训练模型
MobileNetV1_x0_5 63.5 1.98 / 0.51 2.50 / 1.04 4.8 MobileNetV1_x0_5.yaml 推理模型/训练模型
MobileNetV1_x0_25 51.4 1.99 / 0.45 1.82 / 0.73 1.8 MobileNetV1_x0_25.yaml 推理模型/训练模型
MobileNetV1_x0_75 68.8 2.33 / 0.41 3.33 / 1.34 9.3 MobileNetV1_x0_75.yaml 推理模型/训练模型
MobileNetV1_x1_0 71.0 2.31 / 0.45 3.91 / 1.89 15.2 MobileNetV1_x1_0.yaml 推理模型/训练模型
MobileNetV2_x0_5 65.0 3.58 / 0.62 3.86 / 1.23 7.1 MobileNetV2_x0_5.yaml 推理模型/训练模型
MobileNetV2_x0_25 53.2 3.05 / 0.66 3.30 / 0.98 5.5 MobileNetV2_x0_25.yaml 推理模型/训练模型
MobileNetV2_x1_0 72.2 3.85 / 0.63 5.50 / 1.87 12.6 MobileNetV2_x1_0.yaml 推理模型/训练模型
MobileNetV2_x1_5 74.1 3.93 / 0.73 8.84 / 3.12 25.0 MobileNetV2_x1_5.yaml 推理模型/训练模型
MobileNetV2_x2_0 75.2 3.89 / 0.79 10.36 / 4.50 41.2 MobileNetV2_x2_0.yaml 推理模型/训练模型
MobileNetV3_large_x0_5 69.2 4.60 / 0.77 5.32 / 1.58 9.6 MobileNetV3_large_x0_5.yaml 推理模型/训练模型
MobileNetV3_large_x0_35 64.3 4.44 / 0.75 5.20 / 1.50 7.5 MobileNetV3_large_x0_35.yaml 推理模型/训练模型
MobileNetV3_large_x0_75 73.1 5.30 / 0.85 6.02 / 1.93 14.0 MobileNetV3_large_x0_75.yaml 推理模型/训练模型
MobileNetV3_large_x1_0 75.3 5.38 / 0.81 7.16 / 2.19 19.5 MobileNetV3_large_x1_0.yaml 推理模型/训练模型
MobileNetV3_large_x1_25 76.4 5.54 / 0.84 7.06 / 2.84 26.5 MobileNetV3_large_x1_25.yaml 推理模型/训练模型
MobileNetV3_small_x0_5 59.2 3.87 / 0.77 4.90 / 1.32 6.8 MobileNetV3_small_x0_5.yaml 推理模型/训练模型
MobileNetV3_small_x0_35 53.0 3.68 / 0.77 3.94 / 1.27 6.0 MobileNetV3_small_x0_35.yaml 推理模型/训练模型
MobileNetV3_small_x0_75 66.0 3.92 / 0.77 4.68 / 1.39 8.5 MobileNetV3_small_x0_75.yaml 推理模型/训练模型
MobileNetV3_small_x1_0 68.2 4.23 / 0.78 5.24 / 1.48 10.5 MobileNetV3_small_x1_0.yaml 推理模型/训练模型
MobileNetV3_small_x1_25 70.7 4.59 / 0.79 5.36 / 1.63 13.0 MobileNetV3_small_x1_25.yaml 推理模型/训练模型
MobileNetV4_conv_large 83.4 9.04 / 2.28 34.34 / 22.01 125.2 MobileNetV4_conv_large.yaml 推理模型/训练模型
MobileNetV4_conv_medium 79.9 5.70 / 1.05 13.78 / 5.64 37.6 MobileNetV4_conv_medium.yaml 推理模型/训练模型
MobileNetV4_conv_small 74.6 3.81 / 0.55 5.24 / 1.50 14.7 MobileNetV4_conv_small.yaml 推理模型/训练模型
MobileNetV4_hybrid_large 83.8 13.43 / 4.28 61.16 / 31.06 145.1 MobileNetV4_hybrid_large.yaml 推理模型/训练模型
MobileNetV4_hybrid_medium 80.5 11.82 / 1.30 22.01 / 6.06 42.9 MobileNetV4_hybrid_medium.yaml 推理模型/训练模型
PP-HGNet_base 85.0 13.43 / 3.81 71.24 / 51.48 249.4 PP-HGNet_base.yaml 推理模型/训练模型
PP-HGNet_small 81.51 5.87 / 1.68 25.58 / 18.50 86.5 PP-HGNet_small.yaml 推理模型/训练模型
PP-HGNet_tiny 79.83 5.84 / 1.38 17.03 / 10.58 52.4 PP-HGNet_tiny.yaml 推理模型/训练模型
PP-HGNetV2-B0 77.77 4.41 / 0.87 10.58 / 1.87 21.4 PP-HGNetV2-B0.yaml 推理模型/训练模型
PP-HGNetV2-B1 79.18 4.52 / 0.73 11.98 / 2.28 22.6 PP-HGNetV2-B1.yaml 推理模型/训练模型
PP-HGNetV2-B2 81.74 6.67 / 0.96 14.22 / 4.04 39.9 PP-HGNetV2-B2.yaml 推理模型/训练模型
PP-HGNetV2-B3 82.98 7.47 / 1.94 17.73 / 5.63 57.9 PP-HGNetV2-B3.yaml 推理模型/训练模型
PP-HGNetV2-B4 83.57 7.05 / 1.16 16.23 / 7.55 70.4 PP-HGNetV2-B4.yaml 推理模型/训练模型
PP-HGNetV2-B5 84.75 10.38 / 1.95 31.53 / 18.02 140.8 PP-HGNetV2-B5.yaml 推理模型/训练模型
PP-HGNetV2-B6 86.30 13.86 / 3.28 67.25 / 56.70 268.4 PP-HGNetV2-B6.yaml 推理模型/训练模型
PP-LCNet_x0_5 63.14 2.41 / 0.60 2.54 / 0.90 6.7 PP-LCNet_x0_5.yaml 推理模型/训练模型
PP-LCNet_x0_25 51.86 2.16 / 0.60 2.73 / 0.77 5.5 PP-LCNet_x0_25.yaml 推理模型/训练模型
PP-LCNet_x0_35 58.09 2.18 / 0.60 2.32 / 0.89 5.9 PP-LCNet_x0_35.yaml 推理模型/训练模型
PP-LCNet_x0_75 68.18 2.61 / 0.58 3.00 / 1.09 8.4 PP-LCNet_x0_75.yaml 推理模型/训练模型
PP-LCNet_x1_0 71.32 2.59 / 0.68 3.18 / 1.19 10.5 PP-LCNet_x1_0.yaml 推理模型/训练模型
PP-LCNet_x1_5 73.71 2.60 / 0.68 3.98 / 1.66 16.0 PP-LCNet_x1_5.yaml 推理模型/训练模型
PP-LCNet_x2_0 75.18 2.53 / 0.68 5.21 / 2.24 23.2 PP-LCNet_x2_0.yaml 推理模型/训练模型
PP-LCNet_x2_5 76.60 2.76 / 0.67 6.78 / 3.20 32.1 PP-LCNet_x2_5.yaml 推理模型/训练模型
PP-LCNetV2_base 77.05 4.04 / 0.62 6.80 / 2.67 23.7 PP-LCNetV2_base.yaml 推理模型/训练模型
PP-LCNetV2_large 78.51 4.91 / 0.85 10.30 / 5.38 37.3 PP-LCNetV2_large.yaml 推理模型/训练模型
PP-LCNetV2_small 73.97 3.07 / 0.60 4.28 / 1.58 14.6 PP-LCNetV2_small.yaml 推理模型/训练模型
ResNet18_vd 72.3 2.87 / 0.77 7.91 / 4.64 41.5 ResNet18_vd.yaml 推理模型/训练模型
ResNet18 71.0 2.63 / 0.74 6.30 / 4.16 41.5 ResNet18.yaml 推理模型/训练模型
ResNet34_vd 76.0 4.47 / 1.09 14.30 / 8.33 77.3 ResNet34_vd.yaml 推理模型/训练模型
ResNet34 74.6 4.20 / 1.07 12.53 / 7.83 77.3 ResNet34.yaml 推理模型/训练模型
ResNet50_vd 79.1 6.66 / 1.23 16.34 / 10.00 90.8 ResNet50_vd.yaml 推理模型/训练模型
ResNet50 76.5 6.25 / 1.17 15.93 / 9.72 90.8 ResNet50.yaml 推理模型/训练模型
ResNet101_vd 80.2 11.93 / 2.07 32.47 / 23.62 158.4 ResNet101_vd.yaml 推理模型/训练模型
ResNet101 77.6 13.73 / 2.06 29.69 / 17.72 158.7 ResNet101.yaml 推理模型/训练模型
ResNet152_vd 80.6 20.70 / 2.82 43.90 / 27.91 214.3 ResNet152_vd.yaml 推理模型/训练模型
ResNet152 78.3 17.86 / 2.79 46.19 / 26.00 214.2 ResNet152.yaml 推理模型/训练模型
ResNet200_vd 80.9 22.55 / 3.54 58.54 / 35.70 266.0 ResNet200_vd.yaml 推理模型/训练模型
StarNet-S1 73.6 6.24 / 0.96 8.78 / 2.44 11.2 StarNet-S1.yaml 推理模型/训练模型
StarNet-S2 74.8 4.78 / 0.85 7.24 / 2.48 14.3 StarNet-S2.yaml 推理模型/训练模型
StarNet-S3 77.0 6.77 / 1.07 9.69 / 3.35 22.2 StarNet-S3.yaml 推理模型/训练模型
StarNet-S4 79.0 9.01 / 1.48 14.79 / 4.58 28.9 StarNet-S4.yaml 推理模型/训练模型
SwinTransformer_base_patch4_window7_224 83.37 13.04 / 10.77 133.79 / 118.45 340 SwinTransformer_base_patch4_window7_224.yaml 推理模型/训练模型
SwinTransformer_base_patch4_window12_384 84.17 33.99 / 28.42 400.19 / 317.36 311.4 SwinTransformer_base_patch4_window12_384.yaml 推理模型/训练模型
SwinTransformer_large_patch4_window7_224 86.19 23.69 / 6.18 198.60 / 177.18 694.8 SwinTransformer_large_patch4_window7_224.yaml 推理模型/训练模型
SwinTransformer_large_patch4_window12_384 87.06 68.07 / 14.84 609.07 / 525.72 696.1 SwinTransformer_large_patch4_window12_384.yaml 推理模型/训练模型
SwinTransformer_small_patch4_window7_224 83.21 12.17 / 3.51 111.03 / 92.51 175.6 SwinTransformer_small_patch4_window7_224.yaml 推理模型/训练模型
SwinTransformer_tiny_patch4_window7_224 81.10 7.11 / 2.01 62.72 / 47.35 100.1 SwinTransformer_tiny_patch4_window7_224.yaml 推理模型/训练模型

注:以上精度指标为 ImageNet-1k 验证集 Top1 Acc。

图像多标签分类模块

模型名称 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
CLIP_vit_base_patch16_448_ML 89.15 48.87 / 8.10 275.33 / 188.48 325.6 CLIP_vit_base_patch16_448_ML.yaml 推理模型/训练模型
PP-HGNetV2-B0_ML 80.98 7.15 / 1.77 21.35 / 8.19 39.6 PP-HGNetV2-B0_ML.yaml 推理模型/训练模型
PP-HGNetV2-B4_ML 87.96 8.11 / 2.82 44.76 / 29.38 88.5 PP-HGNetV2-B4_ML.yaml 推理模型/训练模型
PP-HGNetV2-B6_ML 91.06 34.54 / 8.22 189.17 / 189.17 286.5 PP-HGNetV2-B6_ML.yaml 推理模型/训练模型
PP-LCNet_x1_0_ML 77.96 5.28 / 1.62 13.16 / 5.61 29.4 PP-LCNet_x1_0_ML.yaml 推理模型/训练模型
ResNet50_ML 83.42 10.54 / 2.97 55.39 / 35.52 108.9 ResNet50_ML.yaml 推理模型/训练模型

注:以上精度指标为COCO2017的多标签分类任务mAP。

行人属性模块

模型名称 mA(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-LCNet_x1_0_pedestrian_attribute 92.2 2.52 / 0.66 2.60 / 1.07 6.7 PP-LCNet_x1_0_pedestrian_attribute.yaml 推理模型/训练模型

注:以上精度指标为 PaddleX 内部自建数据集mA。

车辆属性模块

模型名称 mA(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-LCNet_x1_0_vehicle_attribute 91.7 2.53 / 0.67 2.73 / 1.10 6.7 PP-LCNet_x1_0_vehicle_attribute.yaml 推理模型/训练模型

注:以上精度指标为 VeRi 数据集 mA。

图像特征模块

模型名称 recall@1(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-ShiTuV2_rec 84.2 3.91 / 1.06 6.82 / 2.89 16.3 PP-ShiTuV2_rec.yaml 推理模型/训练模型
PP-ShiTuV2_rec_CLIP_vit_base 88.69 12.57 / 11.62 67.09 / 67.09 306.6 PP-ShiTuV2_rec_CLIP_vit_base.yaml 推理模型/训练模型
PP-ShiTuV2_rec_CLIP_vit_large 91.03 49.85 / 49.85 229.14 / 229.14 1050 PP-ShiTuV2_rec_CLIP_vit_large.yaml 推理模型/训练模型

注:以上精度指标为 AliProducts recall@1。

人脸特征模块

模型名称 输出特征维度 Acc (%)
AgeDB-30/CFP-FP/LFW
GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
MobileFaceNet 128 96.28/96.71/99.58 3.31 / 0.73 5.93 / 1.30 4.1 MobileFaceNet.yaml 推理模型/训练模型
ResNet50_face 512 98.12/98.56/99.77 6.12 / 3.11 15.85 / 9.44 87.2 ResNet50_face.yaml 推理模型/训练模型

注:以上精度指标是分别在AgeDB-30、CFP-FP和LFW数据集上测得的Accuracy。

主体检测模块

模型名称 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-ShiTuV2_det 41.5 11.81 / 4.53 43.03 / 25.31 27.54 PP-ShiTuV2_det.yaml 推理模型/训练模型

注:以上精度指标为 PaddleClas主体检测数据集 mAP(0.5:0.95)。

目标检测模块

模型名称 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
Cascade-FasterRCNN-ResNet50-FPN 41.1 120.28 / 120.28 - / 6514.61 245.4 Cascade-FasterRCNN-ResNet50-FPN.yaml 推理模型/训练模型
Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN 45.0 124.10 / 124.10 - / 6709.52 246.2 Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN.yaml 推理模型/训练模型
CenterNet-DLA-34 37.6 67.19 / 67.19 6622.61 / 6622.61 75.4 CenterNet-DLA-34.yaml 推理模型/训练模型
CenterNet-ResNet50 38.9 216.06 / 216.06 2545.79 / 2545.79 319.7 CenterNet-ResNet50.yaml 推理模型/训练模型
DETR-R50 42.3 58.80 / 26.90 370.96 / 208.77 159.3 DETR-R50.yaml 推理模型/训练模型
FasterRCNN-ResNet34-FPN 37.8 76.90 / 76.90 - / 4136.79 137.5 FasterRCNN-ResNet34-FPN.yaml 推理模型/训练模型
FasterRCNN-ResNet50-FPN 38.4 95.48 / 95.48 - / 3693.90 148.1 FasterRCNN-ResNet50-FPN.yaml 推理模型/训练模型
FasterRCNN-ResNet50-vd-FPN 39.5 98.03 / 98.03 - / 4278.36 148.1 FasterRCNN-ResNet50-vd-FPN.yaml 推理模型/训练模型
FasterRCNN-ResNet50-vd-SSLDv2-FPN 41.4 99.23 / 99.23 - / 4415.68 148.1 FasterRCNN-ResNet50-vd-SSLDv2-FPN.yaml 推理模型/训练模型
FasterRCNN-ResNet50 36.7 129.10 / 129.10 - / 3868.44 120.2 FasterRCNN-ResNet50.yaml 推理模型/训练模型
FasterRCNN-ResNet101-FPN 41.4 131.48 / 131.48 - / 4380.00 216.3 FasterRCNN-ResNet101-FPN.yaml 推理模型/训练模型
FasterRCNN-ResNet101 39.0 216.71 / 216.71 - / 5376.45 188.1 FasterRCNN-ResNet101.yaml 推理模型/训练模型
FasterRCNN-ResNeXt101-vd-FPN 43.4 234.38 / 234.38 - / 6154.61 360.6 FasterRCNN-ResNeXt101-vd-FPN.yaml 推理模型/训练模型
FasterRCNN-Swin-Tiny-FPN 42.6 65.92 / 65.92 - / 2468.98 159.8 FasterRCNN-Swin-Tiny-FPN.yaml 推理模型/训练模型
FCOS-ResNet50 39.6 101.02 / 34.42 752.15 / 752.15 124.2 FCOS-ResNet50.yaml 推理模型/训练模型
PicoDet-L 42.6 14.31 / 11.06 45.95 / 25.06 20.9 PicoDet-L.yaml 推理模型/训练模型
PicoDet-M 37.5 10.48 / 5.00 22.88 / 9.03 16.8 PicoDet-M.yaml 推理模型/训练模型
PicoDet-S 29.1 9.15 / 3.26 16.06 / 4.04 4.4 PicoDet-S.yaml 推理模型/训练模型
PicoDet-XS 26.2 9.54 / 3.52 17.96 / 5.38 5.7 PicoDet-XS.yaml 推理模型/训练模型
PP-YOLOE_plus-L 52.9 32.06 / 28.00 185.32 / 116.21 185.3 PP-YOLOE_plus-L.yaml 推理模型/训练模型
PP-YOLOE_plus-M 49.8 18.37 / 15.04 108.77 / 63.48 83.2 PP-YOLOE_plus-M.yaml 推理模型/训练模型
PP-YOLOE_plus-S 43.7 11.43 / 7.52 60.16 / 26.94 28.3 PP-YOLOE_plus-S.yaml 推理模型/训练模型
PP-YOLOE_plus-X 54.7 56.28 / 50.60 292.08 / 212.24 349.4 PP-YOLOE_plus-X.yaml 推理模型/训练模型
RT-DETR-H 56.3 114.57 / 101.56 938.20 / 938.20 435.8 RT-DETR-H.yaml 推理模型/训练模型
RT-DETR-L 53.0 34.76 / 27.60 495.39 / 247.68 113.7 RT-DETR-L.yaml 推理模型/训练模型
RT-DETR-R18 46.5 19.11 / 14.82 263.13 / 143.05 70.7 RT-DETR-R18.yaml 推理模型/训练模型
RT-DETR-R50 53.1 41.11 / 10.12 536.20 / 482.86 149.1 RT-DETR-R50.yaml 推理模型/训练模型
RT-DETR-X 54.8 61.91 / 51.41 639.79 / 639.79 232.9 RT-DETR-X.yaml 推理模型/训练模型
YOLOv3-DarkNet53 39.1 39.62 / 35.54 166.57 / 136.34 219.7 YOLOv3-DarkNet53.yaml 推理模型/训练模型
YOLOv3-MobileNetV3 31.4 16.54 / 6.21 64.37 / 45.55 83.8 YOLOv3-MobileNetV3.yaml 推理模型/训练模型
YOLOv3-ResNet50_vd_DCN 40.6 31.64 / 26.72 226.75 / 226.75 163.0 YOLOv3-ResNet50_vd_DCN.yaml 推理模型/训练模型
YOLOX-L 50.1 49.68 / 45.03 232.52 / 156.24 192.5 YOLOX-L.yaml 推理模型/训练模型
YOLOX-M 46.9 43.46 / 29.52 147.64 / 80.06 90.0 YOLOX-M.yaml 推理模型/训练模型
YOLOX-N 26.1 42.94 / 17.79 64.15 / 7.19 3.4 YOLOX-N.yaml 推理模型/训练模型
YOLOX-S 40.4 46.53 / 29.34 98.37 / 35.02 32.0 YOLOX-S.yaml 推理模型/训练模型
YOLOX-T 32.9 31.81 / 18.91 55.34 / 11.63 18.1 YOLOX-T.yaml 推理模型/训练模型
YOLOX-X 51.8 84.06 / 77.28 390.38 / 272.88 351.5 YOLOX-X.yaml 推理模型/训练模型
Co-Deformable-DETR-R50 49.7 259.62 / 259.62 32413.76 / 32413.76 184 Co-Deformable-DETR-R50.yaml.yaml 推理模型/训练模型
Co-Deformable-DETR-Swin-T 48.0 (640x640 输入尺寸下) 120.17 / 120.17 - / 15620.29 187 Co-Deformable-Swin-T.yaml 推理模型/训练模型
Co-DINO-R50 52.0 1123.23 / 1123.23 - / - 186 Co-DINO-R50.yaml 推理模型/训练模型
Co-DINO-Swin-L 55.9 (640x640 输入尺寸下) - / - - / - 840 Co-DINO-Swin-L.yaml 推理模型/训练模型

注:以上精度指标为 COCO2017 验证集 mAP(0.5:0.95)。

小目标检测模块

模型名称 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-YOLOE_plus_SOD-S 25.1 116.07 / 20.10 176.44 / 40.21 77.3 PP-YOLOE_plus_SOD-S.yaml 推理模型/训练模型
PP-YOLOE_plus_SOD-L 31.9 100.02 / 48.33 271.29 / 151.20 325.0 PP-YOLOE_plus_SOD-L.yaml 推理模型/训练模型
PP-YOLOE_plus_SOD-largesize-L 42.7 515.69 / 460.17 2816.08 / 1736.00 340.5 PP-YOLOE_plus_SOD-largesize-L.yaml 推理模型/训练模型

注:以上精度指标为 VisDrone-DET 验证集 mAP(0.5:0.95)。

开放词汇目标检测

模型 mAP(0.5:0.95) mAP(0.5) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
GroundingDINO-T 49.4 64.4 - / - - / - 658.3 GroundingDINO-T.yaml 推理模型
YOLO-Worldv2-L 44.4 59.8 - / - 292.14 / 292.14 421.4 YOLO-Worldv2-L.yaml 推理模型

注:以上精度指标为 COCO val2017 验证集 mAP(0.5:0.95)。

开放词汇分割

模型 GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
SAM-H_box - / - - / - 2433.7 SAM-H_box.yaml 推理模型
SAM-H_point - / - - / - 2433.7 SAM-H_point.yaml 推理模型

旋转目标检测

模型 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-YOLOE-R-L 78.14 67.50 / 61.15 414.79 / 414.79 211.0 PP-YOLOE-R-L.yaml 推理模型/训练模型

注:以上精度指标为DOTA验证集 mAP(0.5:0.95)。

行人检测模块

模型名称 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-YOLOE-L_human 48.0 30.59 / 26.64 180.05 / 112.70 196.1 PP-YOLOE-L_human.yaml 推理模型/训练模型
PP-YOLOE-S_human 42.5 10.26 / 6.66 54.01 / 23.48 28.8 PP-YOLOE-S_human.yaml 推理模型/训练模型

注:以上精度指标为 CrowdHuman 验证集 mAP(0.5:0.95)。

车辆检测模块

模型名称 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-YOLOE-L_vehicle 63.9 30.30 / 26.27 169.28 / 111.88 196.1 PP-YOLOE-L_vehicle.yaml 推理模型/训练模型
PP-YOLOE-S_vehicle 61.3 10.54 / 6.69 52.73 / 23.58 28.8 PP-YOLOE-S_vehicle.yaml 推理模型/训练模型

注:以上精度指标为 PPVehicle 验证集 mAP(0.5:0.95)。

人脸检测模块

模型名称 AP (%)
Easy/Medium/Hard
GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
BlazeFace 77.7/73.4/49.5 50.90 / 45.74 71.92 / 71.92 0.447 BlazeFace.yaml 推理模型/训练模型
BlazeFace-FPN-SSH 83.2/80.5/60.5 58.99 / 51.75 87.39 / 87.39 0.606 BlazeFace-FPN-SSH.yaml 推理模型/训练模型
PicoDet_LCNet_x2_5_face 93.7/90.7/68.1 33.91 / 26.53 153.56 / 79.21 28.9 PicoDet_LCNet_x2_5_face.yaml 推理模型/训练模型
PP-YOLOE_plus-S_face 93.9/91.8/79.8 21.28 / 11.09 137.26 / 72.09 26.5 PP-YOLOE_plus-S_face.yaml 推理模型/训练模型

注:以上精度指标是在WIDER-FACE验证集上,以640*640作为输入尺寸评估得到的。

异常检测模块

模型名称 mIoU GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
STFPM 0.9901 4.94 / 1.63 34.88 / 34.88 22.5 STFPM.yaml 推理模型/训练模型

注:以上精度指标为 MVTec AD 验证集 平均异常分数。

人体关键点检测模块

模型 方案 输入尺寸 AP(0.5:0.95) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-TinyPose_128x96 Top-Down 24.22 / 4.34 - / 6.19 24.22 / 4.34 - / 6.19 4.9 PP-TinyPose_128x96.yaml 推理模型/训练模型
PP-TinyPose_256x192 Top-Down 68.3 21.73 / 3.59 - / 10.18 4.9 PP-TinyPose_256x192.yaml 推理模型/训练模型

注:以上精度指标为COCO数据集 AP(0.5:0.95),所依赖的检测框为ground truth标注得到。

3D多模态融合检测模块

模型 mAP(%) NDS yaml文件 模型下载链接
BEVFusion 53.9 60.9 BEVFusion.yaml 推理模型/训练模型

注:以上精度指标为nuscenes验证集 mAP(0.5:0.95), NDS 60.9, 精度类型为 FP32。

语义分割模块

模型名称 mloU(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
Deeplabv3_Plus-R50 80.36 481.33 / 446.18 2952.95 / 1907.07 94.9 Deeplabv3_Plus-R50.yaml 推理模型/训练模型
Deeplabv3_Plus-R101 81.10 766.70 / 194.42 4441.56 / 2984.19 162.5 Deeplabv3_Plus-R101.yaml 推理模型/训练模型
Deeplabv3-R50 79.90 681.65 / 602.10 3786.41 / 3093.10 138.3 Deeplabv3-R50.yaml 推理模型/训练模型
Deeplabv3-R101 80.85 974.62 / 896.99 5222.60 / 4230.79 205.9 Deeplabv3-R101.yaml 推理模型/训练模型
OCRNet_HRNet-W18 80.67 271.02 / 221.38 1791.52 / 1061.62 43.1 OCRNet_HRNet-W18.yaml 推理模型/训练模型
OCRNet_HRNet-W48 82.15 582.92 / 536.28 3513.72 / 2543.10 270 OCRNet_HRNet-W48.yaml 推理模型/训练模型
PP-LiteSeg-T 73.10 28.12 / 23.84 398.31 / 398.31 28.5 PP-LiteSeg-T.yaml 推理模型/训练模型
PP-LiteSeg-B 75.25 35.69 / 35.69 485.10 / 485.10 47.0 PP-LiteSeg-B.yaml 推理模型/训练模型
SegFormer-B0 (slice) 76.73 11.1946 268.929 13.2 SegFormer-B0.yaml 推理模型/训练模型
SegFormer-B1 (slice) 78.35 17.9998 403.393 48.5 SegFormer-B1.yaml 推理模型/训练模型
SegFormer-B2 (slice) 81.60 48.0371 1248.52 96.9 SegFormer-B2.yaml 推理模型/训练模型
SegFormer-B3 (slice) 82.47 64.341 1666.35 167.3 SegFormer-B3.yaml 推理模型/训练模型
SegFormer-B4 (slice) 82.38 82.4336 1995.42 226.7 SegFormer-B4.yaml 推理模型/训练模型
SegFormer-B5 (slice) 82.58 97.3717 2420.19 229.7 SegFormer-B5.yaml 推理模型/训练模型

注:以上精度指标为 Cityscapes 数据集 mloU。

模型名称 mloU(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
SeaFormer_base(slice) 40.92 24.4073 397.574 30.8 SeaFormer_base.yaml 推理模型/训练模型
SeaFormer_large (slice) 43.66 27.8123 550.464 49.8 SeaFormer_large.yaml 推理模型/训练模型
SeaFormer_small (slice) 38.73 19.2295 358.343 14.3 SeaFormer_small.yaml 推理模型/训练模型
SeaFormer_tiny (slice) 34.58 13.9496 330.132 6.1 SeaFormer_tiny.yaml 推理模型/训练模型
MaskFormer_small 49.70 65.21 / 65.21 - / 629.85 242.5 MaskFormer_small.yaml 推理模型/训练模型
MaskFormer_tiny 46.69 47.95 / 47.95 - / 492.67 160.5 MaskFormer_tiny.yaml 推理模型/训练模型

注:以上精度指标为 ADE20k 数据集, slice 表示对输入图像进行了切图操作。

实例分割模块

模型名称 Mask AP GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
Mask-RT-DETR-H 50.6 180.83 / 180.83 1711.24 / 1711.24 449.9 Mask-RT-DETR-H.yaml 推理模型/训练模型
Mask-RT-DETR-L 45.7 113.20 / 113.20 1179.56 / 1179.56 113.6 Mask-RT-DETR-L.yaml 推理模型/训练模型
Mask-RT-DETR-M 42.7 87.08 / 87.08 - / 2090.73 66.6 Mask-RT-DETR-M.yaml 推理模型/训练模型
Mask-RT-DETR-S 41.0 120.86 / 120.86 - / 2163.07 51.8 Mask-RT-DETR-S.yaml 推理模型/训练模型
Mask-RT-DETR-X 47.5 141.43 / 141.43 1379.14 / 1379.14 237.5 Mask-RT-DETR-X.yaml 推理模型/训练模型
Cascade-MaskRCNN-ResNet50-FPN 36.3 136.79 / 136.79 - / 5935.41 254.8 Cascade-MaskRCNN-ResNet50-FPN.yaml 推理模型/训练模型
Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN 39.1 137.40 / 137.40 - / 6816.68 254.7 Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN.yaml 推理模型/训练模型
MaskRCNN-ResNet50-FPN 35.6 112.79 / 112.79 - / 4912.37 157.5 MaskRCNN-ResNet50-FPN.yaml 推理模型/训练模型
MaskRCNN-ResNet50-vd-FPN 36.4 112.88 / 112.88 - / 5204.97 157.5 MaskRCNN-ResNet50-vd-FPN.yaml 推理模型/训练模型
MaskRCNN-ResNet50 32.8 181.60 / 181.60 - / 5523.45 127.8 MaskRCNN-ResNet50.yaml 推理模型/训练模型
MaskRCNN-ResNet101-FPN 36.6 138.84 / 138.84 - / 5107.74 225.4 MaskRCNN-ResNet101-FPN.yaml 推理模型/训练模型
MaskRCNN-ResNet101-vd-FPN 38.1 141.73 / 141.73 - / 5592.76 225.1 MaskRCNN-ResNet101-vd-FPN.yaml 推理模型/训练模型
MaskRCNN-ResNeXt101-vd-FPN 39.5 220.83 / 220.83 - / 5932.59 370.0 MaskRCNN-ResNeXt101-vd-FPN.yaml 推理模型/训练模型
PP-YOLOE_seg-S 32.5 243.41 / 222.30 2507.70 / 1282.35 31.5 PP-YOLOE_seg-S.yaml 推理模型/训练模型
SOLOv2 35.5 131.99 / 131.99 - / 2369.98 179.1 SOLOv2.yaml 推理模型/训练模型

注:以上精度指标为 COCO2017 验证集 Mask AP(0.5:0.95)。

文本检测模块

模型 检测Hmean(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-OCRv5_server_det 83.8 89.55 / 70.19 383.15 / 383.15 84.3 PP-OCRv5_server_det.yaml 推理模型/训练模型
PP-OCRv5_mobile_det 79.0 10.67 / 6.36 57.77 / 28.15 4.7 PP-OCRv5_mobile_det.yaml 推理模型/训练模型
PP-OCRv4_server_det 82.56 127.82 / 98.87 585.95 / 489.77 109 PP-OCRv4_server_det.yaml 推理模型/训练模型
PP-OCRv4_mobile_det 63.8 9.87 / 4.17 56.60 / 20.79 4.7 PP-OCRv4_mobile_det.yaml 推理模型/训练模型
PP-OCRv3_mobile_det 精度接近 PP-OCRv4_mobile_det 9.90 / 3.60 41.93 / 20.76 2.1 PP-OCRv3_mobile_det.yaml 推理模型/训练模型
PP-OCRv3_server_det 80.11 119.50 / 75.00 379.35 / 318.35 102.1 PP-OCRv3_server_det.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的中英文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 593 张图片。

印章文本检测模块

模型名称 检测Hmean(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-OCRv4_mobile_seal_det 96.36 9.70 / 3.56 50.38 / 19.64 4.7 PP-OCRv4_mobile_seal_det.yaml 推理模型/训练模型
PP-OCRv4_server_seal_det 98.40 124.64 / 91.57 545.68 / 439.86 109 PP-OCRv4_server_seal_det.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleX 自建的印章数据集,包含500印章图像。

文本识别模块

  • 中文识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
PP-OCRv5_server_rec 86.38 8.46 / 2.36 31.21 / 31.21 81 PP-OCRv5_server_rec.yaml 推理模型/训练模型
PP-OCRv5_mobile_rec 81.29 5.43 / 1.46 21.20 / 5.32 16 PP-OCRv5_mobile_rec.yaml 推理模型/训练模型
PP-OCRv4_server_rec_doc 86.58 8.69 / 2.78 37.93 / 37.93 182 PP-OCRv4_server_rec_doc.yaml 推理模型/训练模型
PP-OCRv4_mobile_rec 78.74 5.26 / 1.12 17.48 / 3.61 10.5 PP-OCRv4_mobile_rec.yaml 推理模型/训练模型
PP-OCRv4_server_rec 85.19 8.75 / 2.49 36.93 / 36.93 173 PP-OCRv4_server_rec.yaml 推理模型/训练模型
PP-OCRv3_mobile_rec 72.96 3.89 / 1.16 8.72 / 3.56 10.3 PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 8367 张图片。

模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
ch_SVTRv2_rec 68.81 10.38 / 8.31 66.52 / 30.83 80.5 ch_SVTRv2_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。

模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
ch_RepSVTR_rec 65.07 6.29 / 1.57 20.64 / 5.40 48.8 ch_RepSVTR_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。

  • 英文识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
en_PP-OCRv4_mobile_rec 70.39 4.81 / 1.23 17.20 / 4.18 7.5 en_PP-OCRv4_mobile_rec.yaml 推理模型/训练模型
en_PP-OCRv3_mobile_rec 70.69 3.56 / 0.78 8.44 / 5.78 17.3 en_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleX 自建的英文数据集。

  • 多语言识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
korean_PP-OCRv3_mobile_rec 60.21 3.73 / 0.98 8.76 / 2.91 9.6 korean_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
japan_PP-OCRv3_mobile_rec 45.69 3.86 / 1.01 8.62 / 2.92 9.8 japan_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
chinese_cht_PP-OCRv3_mobile_rec 82.06 3.90 / 1.16 9.24 / 3.18 10.8 chinese_cht_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
te_PP-OCRv3_mobile_rec 95.88 3.59 / 0.81 8.28 / 6.21 8.7 te_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
ka_PP-OCRv3_mobile_rec 96.96 3.49 / 0.89 8.63 / 2.77 17.4 ka_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
ta_PP-OCRv3_mobile_rec 76.83 3.49 / 0.86 8.35 / 3.41 8.7 ta_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
latin_PP-OCRv3_mobile_rec 76.93 3.53 / 0.78 8.50 / 6.83 8.7 latin_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
arabic_PP-OCRv3_mobile_rec 73.55 3.60 / 0.83 8.44 / 4.69 17.3 arabic_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
cyrillic_PP-OCRv3_mobile_rec 94.28 3.56 / 0.79 8.22 / 2.76 8.7 cyrillic_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
devanagari_PP-OCRv3_mobile_rec 96.44 3.60 / 0.78 6.95 / 2.87 8.7 devanagari_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleX 自建的多语种数据集。

公式识别模块

模型 En-BLEU(%) Zh-BLEU(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
UniMERNet 85.91 43.50 1311.84 / 1311.84 - / 8288.07 1530 UniMERNet.yaml 推理模型/训练模型
PP-FormulaNet-S 87.00 45.71 182.25 / 182.25 - / 254.39 224 PP-FormulaNet-S.yaml 推理模型/训练模型
PP-FormulaNet-L 90.36 45.78 1482.03 / 1482.03 - / 3131.54 695
PP-FormulaNet-L.yaml 推理模型/训练模型
PP-FormulaNet_plus-S 88.71 53.32 179.20 / 179.20 - / 260.99 248 PP-FormulaNet_plus-S.yaml 推理模型/训练模型
PP-FormulaNet_plus-M 91.45 89.76 1040.27 / 1040.27 - / 1615.80 592 PP-FormulaNet_plus-M.yaml 推理模型/训练模型
PP-FormulaNet_plus-L 92.22 90.64 1476.07 / 1476.07 - / 3125.58 698 PP-FormulaNet_plus-L.yaml 推理模型/训练模型
LaTeX_OCR_rec 74.55 39.96 1088.89 / 1088.89 - / - 99 LaTeX_OCR_rec.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建公式识别测试集。LaTeX_OCR_rec在LaTeX-OCR公式识别测试集的BLEU score为 0.8821。

表格结构识别模块

模型 精度(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
SLANet 59.52 23.96 / 21.75 - / 43.12 6.9 SLANet.yaml 推理模型/训练模型
SLANet_plus 63.69 23.43 / 22.16 - / 41.80 6.9 SLANet_plus.yaml 推理模型/训练模型
SLANeXt_wired 69.65 85.92 / 85.92 - / 501.66 351 SLANeXt_wired.yaml 推理模型/训练模型
SLANeXt_wireless SLANeXt_wireless.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建高难度中文表格识别数据集。

表格单元格检测模块

模型 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
RT-DETR-L_wired_table_cell_det 82.7 33.47 / 27.02 402.55 / 256.56 124M RT-DETR-L_wired_table_cell_det.yaml 推理模型/训练模型
RT-DETR-L_wireless_table_cell_det RT-DETR-L_wireless_table_cell_det.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建表格单元格检测数据集。

表格分类模块

模型 Top1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-LCNet_x1_0_table_cls 94.2 2.62 / 0.60 3.17 / 1.14 6.6 PP-LCNet_x1_0_table_cls.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建表格分类数据集。

文本图像矫正模块

模型名称 CER GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
UVDoc 0.179 19.05 / 19.05 - / 869.82 30.3 UVDoc.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX自建的图像矫正数据集

版面区域检测模块

  • 版面检测模型,包含20个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、表格、图和表标题(图标题、表格标题和图表标题)、印章、图表、侧栏文本和参考文献内容
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-DocLayout_plus-L 83.2 53.03 / 17.23 634.62 / 378.32 126.01 PP-DocLayout_plus-L.yaml 推理模型/训练模型

注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1300 张文档类型图片。

  • 文档图像版面子模块检测,包含1个 版面区域 类别,能检测多栏的报纸、杂志的每个子文章的文本区域:
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-DocBlockLayout 95.9 34.60 / 28.54 506.43 / 256.83 123.92 PP-DocBlockLayout.yaml 推理模型/训练模型

注:以上精度指标的评估集是自建的版面子区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1000 张文档类型图片。

  • 版面检测模型,包含23个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、图表标题、表格、表格标题、印章、图表标题、图表、页眉图像、页脚图像、侧栏文本
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-DocLayout-L 90.4 33.59 / 33.59 503.01 / 251.08 123.76 PP-DocLayout-L.yaml 推理模型/训练模型
PP-DocLayout-M 75.2 13.03 / 4.72 43.39 / 24.44 22.578 PP-DocLayout-M.yaml 推理模型/训练模型
PP-DocLayout-S 70.9 11.54 / 3.86 18.53 / 6.29 4.834 PP-DocLayout-S.yaml 推理模型/训练模型

注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 500 张文档类型图片。

  • 表格版面检测模型
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PicoDet_layout_1x_table 97.5 9.57 / 6.63 27.66 / 16.75 7.4 PicoDet_layout_1x_table.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的版面表格区域检测数据集,包含中英文 7835 张带有表格的论文文档类型图片。

  • 3类版面检测模型,包含表格、图像、印章
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PicoDet-S_layout_3cls 88.2 8.43 / 3.44 17.60 / 6.51 4.8 PicoDet-S_layout_3cls.yaml 推理模型/训练模型
PicoDet-L_layout_3cls 89.0 12.80 / 9.57 45.04 / 23.86 22.6 PicoDet-L_layout_3cls.yaml 推理模型/训练模型
RT-DETR-H_layout_3cls 95.8 114.80 / 25.65 924.38 / 924.38 470.1 RT-DETR-H_layout_3cls.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 1154 张文档类型图片。

  • 5类英文文档区域检测模型,包含文字、标题、表格、图片以及列表
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PicoDet_layout_1x 97.8 9.62 / 6.75 26.96 / 12.77 7.4 PicoDet_layout_1x.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PubLayNet 的评估数据集,包含英文文档的 11245 张图片。

  • 17类区域检测模型,包含17个版面常见类别,分别是:段落标题、图片、文本、数字、摘要、内容、图表标题、公式、表格、表格标题、参考文献、文档标题、脚注、页眉、算法、页脚、印章
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PicoDet-S_layout_17cls 87.4 8.80 / 3.62 17.51 / 6.35 4.8 PicoDet-S_layout_17cls.yaml 推理模型/训练模型
PicoDet-L_layout_17cls 89.0 12.60 / 10.27 43.70 / 24.42 22.6 PicoDet-L_layout_17cls.yaml 推理模型/训练模型
RT-DETR-H_layout_17cls 98.3 115.29 / 101.18 964.75 / 964.75 470.2 RT-DETR-H_layout_17cls.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 892 张文档类型图片。

文档图像方向分类模块

模型 Top-1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml文件 模型下载链接
PP-LCNet_x1_0_doc_ori 99.06 2.62 / 0.59 3.24 / 1.19 7 PP-LCNet_x1_0_doc_ori.yaml 推理模型/训练模型

注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。

文本行方向分类模块

模型 模型下载链接 Top-1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
GPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) 介绍
PP-LCNet_x0_25_textline_ori 推理模型/训练模型 98.85 2.16 / 0.41 2.37 / 0.73 0.96 基于PP-LCNet_x0_25的文本行分类模型,含有两个类别,即0度,180度
PP-LCNet_x1_0_textline_ori 推理模型/训练模型 99.42 - / - 2.98 / 2.98 6.5 基于PP-LCNet_x1_0的文本行分类模型,含有两个类别,即0度,180度

注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。

时序预测模块

模型名称 mse mae GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(MB) yaml 文件 模型下载链接
DLinear 0.382 0.394 0.34 / 0.12 0.64 / 0.06 0.072 DLinear.yaml 推理模型/训练模型
NLinear 0.386 0.392 0.27 / 0.10 0.49 / 0.08 0.04 NLinear.yaml 推理模型/训练模型
Nonstationary 0.600 0.515 3.92 / 2.59 18.09 / 13.36 55.5 Nonstationary.yaml 推理模型/训练模型
PatchTST 0.379 0.391 1.81 / 0.45 5.79 / 0.77 2.0 PatchTST.yaml 推理模型/训练模型
RLinear 0.385 0.392 0.39 / 0.18 0.82 / 0.08 0.04 RLinear.yaml 推理模型/训练模型
TiDE 0.407 0.414 - / - 4.54 / 1.09 31.7 TiDE.yaml 推理模型/训练模型
TimesNet 0.416 0.429 15.19 / 13.77 23.14 / 12.42 4.9 TimesNet.yaml 推理模型/训练模型

注:以上精度指标测量自 ETTH1 数据集 (在测试集test.csv上的评测结果)

时序异常检测模块

模型名称 precision recall f1_score 模型存储大小(MB) yaml 文件 模型下载链接
AutoEncoder_ad 99.36 0.24 / 0.13 0.41 / 0.05 0.052 AutoEncoder_ad.yaml 推理模型/训练模型
DLinear_ad 98.98 0.39 / 0.16 0.69 / 0.08 0.112 DLinear_ad.yaml 推理模型/训练模型
Nonstationary_ad 98.55 1.94 / 1.16 5.31 / 1.66 1.8 Nonstationary_ad.yaml 推理模型/训练模型
PatchTST_ad 98.78 2.10 / 0.55 6.98 / 0.63 0.32 PatchTST_ad.yaml 推理模型/训练模型

注:以上精度指标测量自 PSM 数据集。

时序分类模块

模型名称 acc(%) 模型存储大小(MB) yaml 文件 模型下载链接
TimesNet_cls 87.5 0.792 TimesNet_cls.yaml 推理模型/训练模型

注:以上精度指标测量自 UWaveGestureLibrary数据集。

多语种语音识别模块

模型 训练数据 模型存储大小(MB) 词错率 yaml文件 模型下载链接
whisper_large 680kh 5800 2.7 (Librispeech) whisper_large.yaml 推理模型
whisper_medium 680kh 2900 - whisper_medium.yaml 推理模型
whisper_small 680kh 923 - whisper_small.yaml 推理模型
whisper_base 680kh 277 - whisper_base.yaml 推理模型
whisper_tiny 680kh 145 - whisper_tiny.yaml 推理模型

视频分类模块

模型 Top1 Acc(%) 模型存储大小(MB) yaml文件 模型下载链接
PP-TSM-R50_8frames_uniform 74.36 93.4 PP-TSM-R50_8frames_uniform.yaml 推理模型/训练模型
PP-TSMv2-LCNetV2_8frames_uniform 71.71 22.5 PP-TSMv2-LCNetV2_8frames_uniform.yaml 推理模型/训练模型
PP-TSMv2-LCNetV2_16frames_uniform 73.11 22.5 PP-TSMv2-LCNetV2_16frames_uniform.yaml 推理模型/训练模型

注:以上精度指标为 K400 验证集 Top1 Acc。

视频检测模块

模型 Frame-mAP(@ IoU 0.5) 模型存储大小(MB) yaml文件 模型下载链接
YOWO 80.94 462.891 YOWO.yaml 推理模型/训练模型

注:以上精度指标为 UCF101-24 test数据集上的测试指标Frame-mAP (@ IoU 0.5)

文档类视觉语言模型模块

模型 模型参数尺寸(B) 模型存储大小(GB) yaml文件 模型下载链接
PP-DocBee-2B 2 4.2 PP-DocBee-2B.yaml 推理模型
PP-DocBee-7B 7 15.8 PP-DocBee-7B.yaml 推理模型
PP-DocBee2-3B 3 7.6 PP-DocBee2-3B.yaml 推理模型

图表解析模型模块

模型 模型参数尺寸(B) 模型存储大小(GB) yaml文件 模型下载链接
PP-Chart2Table 0.58 1.4 PP-Chart2Table.yaml 推理模型

测试环境说明:

  • 性能测试环境
    • 硬件配置:
      • GPU:NVIDIA Tesla T4
      • CPU:Intel Xeon Gold 6271C @ 2.60GHz
      • 其他环境:Ubuntu 20.04 / CUDA 11.8 / cuDNN 8.9 / TensorRT 8.6.1.6
  • 推理模式说明
模式 GPU配置 CPU配置 加速技术组合
常规模式 FP32精度 / 无TRT加速 FP32精度 / 8线程 PaddleInference
高性能模式 选择先验精度类型和加速策略的最优组合 FP32精度 / 8线程 选择先验最优后端(Paddle/OpenVINO/TRT等)

评论