PaddleX模型列表(CPU/GPU)¶
PaddleX 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型推理速度,请选择推理速度较快的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。
图像分类模块¶
模型名称 | Top1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
CLIP_vit_base_patch16_224 | 85.36 | 12.03 / 2.49 | 60.86 / 42.69 | 331 | CLIP_vit_base_patch16_224.yaml | 推理模型/训练模型 |
CLIP_vit_large_patch14_224 | 88.1 | 49.15 / 9.75 | 223.16 / 206.49 | 1040 | CLIP_vit_large_patch14_224.yaml | 推理模型/训练模型 |
ConvNeXt_base_224 | 83.84 | 11.37 / 5.65 | 143.98 / 52.31 | 313.9 | ConvNeXt_base_224.yaml | 推理模型/训练模型 |
ConvNeXt_base_384 | 84.90 | 29.48 / 11.17 | 293.76 / 134.27 | 313.9 | ConvNeXt_base_384.yaml | 推理模型/训练模型 |
ConvNeXt_large_224 | 84.26 | 22.99 / 12.73 | 220.79 / 113.24 | 700.7 | ConvNeXt_large_224.yaml | 推理模型/训练模型 |
ConvNeXt_large_384 | 85.27 | 58.90 / 24.63 | 509.48 / 260.27 | 700.7 | ConvNeXt_large_384.yaml | 推理模型/训练模型 |
ConvNeXt_small | 83.13 | 7.72 / 4.35 | 95.92 / 33.34 | 178.0 | ConvNeXt_small.yaml | 推理模型/训练模型 |
ConvNeXt_tiny | 82.03 | 6.00 / 2.47 | 63.59 / 18.23 | 101.4 | ConvNeXt_tiny.yaml | 推理模型/训练模型 |
FasterNet-L | 83.5 | 11.96 / 2.68 | 51.93 / 35.33 | 357.1 | FasterNet-L.yaml | 推理模型/训练模型 |
FasterNet-M | 83.0 | 11.17 / 2.16 | 38.49 / 21.17 | 204.6 | FasterNet-M.yaml | 推理模型/训练模型 |
FasterNet-S | 81.3 | 7.70 / 1.24 | 19.51 / 11.22 | 119.3 | FasterNet-S.yaml | 推理模型/训练模型 |
FasterNet-T0 | 71.9 | 4.73 / 0.82 | 6.40 / 1.96 | 15.1 | FasterNet-T0.yaml | 推理模型/训练模型 |
FasterNet-T1 | 75.9 | 4.80 / 0.80 | 8.14 / 3.13 | 29.2 | FasterNet-T1.yaml | 推理模型/训练模型 |
FasterNet-T2 | 79.1 | 6.10 / 0.88 | 12.71 / 5.35 | 57.4 | FasterNet-T2.yaml | 推理模型/训练模型 |
MobileNetV1_x0_5 | 63.5 | 1.98 / 0.51 | 2.50 / 1.04 | 4.8 | MobileNetV1_x0_5.yaml | 推理模型/训练模型 |
MobileNetV1_x0_25 | 51.4 | 1.99 / 0.45 | 1.82 / 0.73 | 1.8 | MobileNetV1_x0_25.yaml | 推理模型/训练模型 |
MobileNetV1_x0_75 | 68.8 | 2.33 / 0.41 | 3.33 / 1.34 | 9.3 | MobileNetV1_x0_75.yaml | 推理模型/训练模型 |
MobileNetV1_x1_0 | 71.0 | 2.31 / 0.45 | 3.91 / 1.89 | 15.2 | MobileNetV1_x1_0.yaml | 推理模型/训练模型 |
MobileNetV2_x0_5 | 65.0 | 3.58 / 0.62 | 3.86 / 1.23 | 7.1 | MobileNetV2_x0_5.yaml | 推理模型/训练模型 |
MobileNetV2_x0_25 | 53.2 | 3.05 / 0.66 | 3.30 / 0.98 | 5.5 | MobileNetV2_x0_25.yaml | 推理模型/训练模型 |
MobileNetV2_x1_0 | 72.2 | 3.85 / 0.63 | 5.50 / 1.87 | 12.6 | MobileNetV2_x1_0.yaml | 推理模型/训练模型 |
MobileNetV2_x1_5 | 74.1 | 3.93 / 0.73 | 8.84 / 3.12 | 25.0 | MobileNetV2_x1_5.yaml | 推理模型/训练模型 |
MobileNetV2_x2_0 | 75.2 | 3.89 / 0.79 | 10.36 / 4.50 | 41.2 | MobileNetV2_x2_0.yaml | 推理模型/训练模型 |
MobileNetV3_large_x0_5 | 69.2 | 4.60 / 0.77 | 5.32 / 1.58 | 9.6 | MobileNetV3_large_x0_5.yaml | 推理模型/训练模型 |
MobileNetV3_large_x0_35 | 64.3 | 4.44 / 0.75 | 5.20 / 1.50 | 7.5 | MobileNetV3_large_x0_35.yaml | 推理模型/训练模型 |
MobileNetV3_large_x0_75 | 73.1 | 5.30 / 0.85 | 6.02 / 1.93 | 14.0 | MobileNetV3_large_x0_75.yaml | 推理模型/训练模型 |
MobileNetV3_large_x1_0 | 75.3 | 5.38 / 0.81 | 7.16 / 2.19 | 19.5 | MobileNetV3_large_x1_0.yaml | 推理模型/训练模型 |
MobileNetV3_large_x1_25 | 76.4 | 5.54 / 0.84 | 7.06 / 2.84 | 26.5 | MobileNetV3_large_x1_25.yaml | 推理模型/训练模型 |
MobileNetV3_small_x0_5 | 59.2 | 3.87 / 0.77 | 4.90 / 1.32 | 6.8 | MobileNetV3_small_x0_5.yaml | 推理模型/训练模型 |
MobileNetV3_small_x0_35 | 53.0 | 3.68 / 0.77 | 3.94 / 1.27 | 6.0 | MobileNetV3_small_x0_35.yaml | 推理模型/训练模型 |
MobileNetV3_small_x0_75 | 66.0 | 3.92 / 0.77 | 4.68 / 1.39 | 8.5 | MobileNetV3_small_x0_75.yaml | 推理模型/训练模型 |
MobileNetV3_small_x1_0 | 68.2 | 4.23 / 0.78 | 5.24 / 1.48 | 10.5 | MobileNetV3_small_x1_0.yaml | 推理模型/训练模型 |
MobileNetV3_small_x1_25 | 70.7 | 4.59 / 0.79 | 5.36 / 1.63 | 13.0 | MobileNetV3_small_x1_25.yaml | 推理模型/训练模型 |
MobileNetV4_conv_large | 83.4 | 9.04 / 2.28 | 34.34 / 22.01 | 125.2 | MobileNetV4_conv_large.yaml | 推理模型/训练模型 |
MobileNetV4_conv_medium | 79.9 | 5.70 / 1.05 | 13.78 / 5.64 | 37.6 | MobileNetV4_conv_medium.yaml | 推理模型/训练模型 |
MobileNetV4_conv_small | 74.6 | 3.81 / 0.55 | 5.24 / 1.50 | 14.7 | MobileNetV4_conv_small.yaml | 推理模型/训练模型 |
MobileNetV4_hybrid_large | 83.8 | 13.43 / 4.28 | 61.16 / 31.06 | 145.1 | MobileNetV4_hybrid_large.yaml | 推理模型/训练模型 |
MobileNetV4_hybrid_medium | 80.5 | 11.82 / 1.30 | 22.01 / 6.06 | 42.9 | MobileNetV4_hybrid_medium.yaml | 推理模型/训练模型 |
PP-HGNet_base | 85.0 | 13.43 / 3.81 | 71.24 / 51.48 | 249.4 | PP-HGNet_base.yaml | 推理模型/训练模型 |
PP-HGNet_small | 81.51 | 5.87 / 1.68 | 25.58 / 18.50 | 86.5 | PP-HGNet_small.yaml | 推理模型/训练模型 |
PP-HGNet_tiny | 79.83 | 5.84 / 1.38 | 17.03 / 10.58 | 52.4 | PP-HGNet_tiny.yaml | 推理模型/训练模型 |
PP-HGNetV2-B0 | 77.77 | 4.41 / 0.87 | 10.58 / 1.87 | 21.4 | PP-HGNetV2-B0.yaml | 推理模型/训练模型 |
PP-HGNetV2-B1 | 79.18 | 4.52 / 0.73 | 11.98 / 2.28 | 22.6 | PP-HGNetV2-B1.yaml | 推理模型/训练模型 |
PP-HGNetV2-B2 | 81.74 | 6.67 / 0.96 | 14.22 / 4.04 | 39.9 | PP-HGNetV2-B2.yaml | 推理模型/训练模型 |
PP-HGNetV2-B3 | 82.98 | 7.47 / 1.94 | 17.73 / 5.63 | 57.9 | PP-HGNetV2-B3.yaml | 推理模型/训练模型 |
PP-HGNetV2-B4 | 83.57 | 7.05 / 1.16 | 16.23 / 7.55 | 70.4 | PP-HGNetV2-B4.yaml | 推理模型/训练模型 |
PP-HGNetV2-B5 | 84.75 | 10.38 / 1.95 | 31.53 / 18.02 | 140.8 | PP-HGNetV2-B5.yaml | 推理模型/训练模型 |
PP-HGNetV2-B6 | 86.30 | 13.86 / 3.28 | 67.25 / 56.70 | 268.4 | PP-HGNetV2-B6.yaml | 推理模型/训练模型 |
PP-LCNet_x0_5 | 63.14 | 2.41 / 0.60 | 2.54 / 0.90 | 6.7 | PP-LCNet_x0_5.yaml | 推理模型/训练模型 |
PP-LCNet_x0_25 | 51.86 | 2.16 / 0.60 | 2.73 / 0.77 | 5.5 | PP-LCNet_x0_25.yaml | 推理模型/训练模型 |
PP-LCNet_x0_35 | 58.09 | 2.18 / 0.60 | 2.32 / 0.89 | 5.9 | PP-LCNet_x0_35.yaml | 推理模型/训练模型 |
PP-LCNet_x0_75 | 68.18 | 2.61 / 0.58 | 3.00 / 1.09 | 8.4 | PP-LCNet_x0_75.yaml | 推理模型/训练模型 |
PP-LCNet_x1_0 | 71.32 | 2.59 / 0.68 | 3.18 / 1.19 | 10.5 | PP-LCNet_x1_0.yaml | 推理模型/训练模型 |
PP-LCNet_x1_5 | 73.71 | 2.60 / 0.68 | 3.98 / 1.66 | 16.0 | PP-LCNet_x1_5.yaml | 推理模型/训练模型 |
PP-LCNet_x2_0 | 75.18 | 2.53 / 0.68 | 5.21 / 2.24 | 23.2 | PP-LCNet_x2_0.yaml | 推理模型/训练模型 |
PP-LCNet_x2_5 | 76.60 | 2.76 / 0.67 | 6.78 / 3.20 | 32.1 | PP-LCNet_x2_5.yaml | 推理模型/训练模型 |
PP-LCNetV2_base | 77.05 | 4.04 / 0.62 | 6.80 / 2.67 | 23.7 | PP-LCNetV2_base.yaml | 推理模型/训练模型 |
PP-LCNetV2_large | 78.51 | 4.91 / 0.85 | 10.30 / 5.38 | 37.3 | PP-LCNetV2_large.yaml | 推理模型/训练模型 |
PP-LCNetV2_small | 73.97 | 3.07 / 0.60 | 4.28 / 1.58 | 14.6 | PP-LCNetV2_small.yaml | 推理模型/训练模型 |
ResNet18_vd | 72.3 | 2.87 / 0.77 | 7.91 / 4.64 | 41.5 | ResNet18_vd.yaml | 推理模型/训练模型 |
ResNet18 | 71.0 | 2.63 / 0.74 | 6.30 / 4.16 | 41.5 | ResNet18.yaml | 推理模型/训练模型 |
ResNet34_vd | 76.0 | 4.47 / 1.09 | 14.30 / 8.33 | 77.3 | ResNet34_vd.yaml | 推理模型/训练模型 |
ResNet34 | 74.6 | 4.20 / 1.07 | 12.53 / 7.83 | 77.3 | ResNet34.yaml | 推理模型/训练模型 |
ResNet50_vd | 79.1 | 6.66 / 1.23 | 16.34 / 10.00 | 90.8 | ResNet50_vd.yaml | 推理模型/训练模型 |
ResNet50 | 76.5 | 6.25 / 1.17 | 15.93 / 9.72 | 90.8 | ResNet50.yaml | 推理模型/训练模型 |
ResNet101_vd | 80.2 | 11.93 / 2.07 | 32.47 / 23.62 | 158.4 | ResNet101_vd.yaml | 推理模型/训练模型 |
ResNet101 | 77.6 | 13.73 / 2.06 | 29.69 / 17.72 | 158.7 | ResNet101.yaml | 推理模型/训练模型 |
ResNet152_vd | 80.6 | 20.70 / 2.82 | 43.90 / 27.91 | 214.3 | ResNet152_vd.yaml | 推理模型/训练模型 |
ResNet152 | 78.3 | 17.86 / 2.79 | 46.19 / 26.00 | 214.2 | ResNet152.yaml | 推理模型/训练模型 |
ResNet200_vd | 80.9 | 22.55 / 3.54 | 58.54 / 35.70 | 266.0 | ResNet200_vd.yaml | 推理模型/训练模型 |
StarNet-S1 | 73.6 | 6.24 / 0.96 | 8.78 / 2.44 | 11.2 | StarNet-S1.yaml | 推理模型/训练模型 |
StarNet-S2 | 74.8 | 4.78 / 0.85 | 7.24 / 2.48 | 14.3 | StarNet-S2.yaml | 推理模型/训练模型 |
StarNet-S3 | 77.0 | 6.77 / 1.07 | 9.69 / 3.35 | 22.2 | StarNet-S3.yaml | 推理模型/训练模型 |
StarNet-S4 | 79.0 | 9.01 / 1.48 | 14.79 / 4.58 | 28.9 | StarNet-S4.yaml | 推理模型/训练模型 |
SwinTransformer_base_patch4_window7_224 | 83.37 | 13.04 / 10.77 | 133.79 / 118.45 | 340 | SwinTransformer_base_patch4_window7_224.yaml | 推理模型/训练模型 |
SwinTransformer_base_patch4_window12_384 | 84.17 | 33.99 / 28.42 | 400.19 / 317.36 | 311.4 | SwinTransformer_base_patch4_window12_384.yaml | 推理模型/训练模型 |
SwinTransformer_large_patch4_window7_224 | 86.19 | 23.69 / 6.18 | 198.60 / 177.18 | 694.8 | SwinTransformer_large_patch4_window7_224.yaml | 推理模型/训练模型 |
SwinTransformer_large_patch4_window12_384 | 87.06 | 68.07 / 14.84 | 609.07 / 525.72 | 696.1 | SwinTransformer_large_patch4_window12_384.yaml | 推理模型/训练模型 |
SwinTransformer_small_patch4_window7_224 | 83.21 | 12.17 / 3.51 | 111.03 / 92.51 | 175.6 | SwinTransformer_small_patch4_window7_224.yaml | 推理模型/训练模型 |
SwinTransformer_tiny_patch4_window7_224 | 81.10 | 7.11 / 2.01 | 62.72 / 47.35 | 100.1 | SwinTransformer_tiny_patch4_window7_224.yaml | 推理模型/训练模型 |
注:以上精度指标为 ImageNet-1k 验证集 Top1 Acc。
图像多标签分类模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
CLIP_vit_base_patch16_448_ML | 89.15 | 48.87 / 8.10 | 275.33 / 188.48 | 325.6 | CLIP_vit_base_patch16_448_ML.yaml | 推理模型/训练模型 |
PP-HGNetV2-B0_ML | 80.98 | 7.15 / 1.77 | 21.35 / 8.19 | 39.6 | PP-HGNetV2-B0_ML.yaml | 推理模型/训练模型 |
PP-HGNetV2-B4_ML | 87.96 | 8.11 / 2.82 | 44.76 / 29.38 | 88.5 | PP-HGNetV2-B4_ML.yaml | 推理模型/训练模型 |
PP-HGNetV2-B6_ML | 91.06 | 34.54 / 8.22 | 189.17 / 189.17 | 286.5 | PP-HGNetV2-B6_ML.yaml | 推理模型/训练模型 |
PP-LCNet_x1_0_ML | 77.96 | 5.28 / 1.62 | 13.16 / 5.61 | 29.4 | PP-LCNet_x1_0_ML.yaml | 推理模型/训练模型 |
ResNet50_ML | 83.42 | 10.54 / 2.97 | 55.39 / 35.52 | 108.9 | ResNet50_ML.yaml | 推理模型/训练模型 |
注:以上精度指标为COCO2017的多标签分类任务mAP。
行人属性模块¶
模型名称 | mA(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_pedestrian_attribute | 92.2 | 2.52 / 0.66 | 2.60 / 1.07 | 6.7 | PP-LCNet_x1_0_pedestrian_attribute.yaml | 推理模型/训练模型 |
注:以上精度指标为 PaddleX 内部自建数据集mA。
车辆属性模块¶
模型名称 | mA(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_vehicle_attribute | 91.7 | 2.53 / 0.67 | 2.73 / 1.10 | 6.7 | PP-LCNet_x1_0_vehicle_attribute.yaml | 推理模型/训练模型 |
注:以上精度指标为 VeRi 数据集 mA。
图像特征模块¶
模型名称 | recall@1(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-ShiTuV2_rec | 84.2 | 3.91 / 1.06 | 6.82 / 2.89 | 16.3 | PP-ShiTuV2_rec.yaml | 推理模型/训练模型 |
PP-ShiTuV2_rec_CLIP_vit_base | 88.69 | 12.57 / 11.62 | 67.09 / 67.09 | 306.6 | PP-ShiTuV2_rec_CLIP_vit_base.yaml | 推理模型/训练模型 |
PP-ShiTuV2_rec_CLIP_vit_large | 91.03 | 49.85 / 49.85 | 229.14 / 229.14 | 1050 | PP-ShiTuV2_rec_CLIP_vit_large.yaml | 推理模型/训练模型 |
注:以上精度指标为 AliProducts recall@1。
人脸特征模块¶
模型名称 | 输出特征维度 | Acc (%) AgeDB-30/CFP-FP/LFW |
GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|
MobileFaceNet | 128 | 96.28/96.71/99.58 | 3.31 / 0.73 | 5.93 / 1.30 | 4.1 | MobileFaceNet.yaml | 推理模型/训练模型 |
ResNet50_face | 512 | 98.12/98.56/99.77 | 6.12 / 3.11 | 15.85 / 9.44 | 87.2 | ResNet50_face.yaml | 推理模型/训练模型 |
注:以上精度指标是分别在AgeDB-30、CFP-FP和LFW数据集上测得的Accuracy。
主体检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-ShiTuV2_det | 41.5 | 11.81 / 4.53 | 43.03 / 25.31 | 27.54 | PP-ShiTuV2_det.yaml | 推理模型/训练模型 |
注:以上精度指标为 PaddleClas主体检测数据集 mAP(0.5:0.95)。
目标检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
Cascade-FasterRCNN-ResNet50-FPN | 41.1 | 120.28 / 120.28 | - / 6514.61 | 245.4 | Cascade-FasterRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN | 45.0 | 124.10 / 124.10 | - / 6709.52 | 246.2 | Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN.yaml | 推理模型/训练模型 |
CenterNet-DLA-34 | 37.6 | 67.19 / 67.19 | 6622.61 / 6622.61 | 75.4 | CenterNet-DLA-34.yaml | 推理模型/训练模型 |
CenterNet-ResNet50 | 38.9 | 216.06 / 216.06 | 2545.79 / 2545.79 | 319.7 | CenterNet-ResNet50.yaml | 推理模型/训练模型 |
DETR-R50 | 42.3 | 58.80 / 26.90 | 370.96 / 208.77 | 159.3 | DETR-R50.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet34-FPN | 37.8 | 76.90 / 76.90 | - / 4136.79 | 137.5 | FasterRCNN-ResNet34-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50-FPN | 38.4 | 95.48 / 95.48 | - / 3693.90 | 148.1 | FasterRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50-vd-FPN | 39.5 | 98.03 / 98.03 | - / 4278.36 | 148.1 | FasterRCNN-ResNet50-vd-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50-vd-SSLDv2-FPN | 41.4 | 99.23 / 99.23 | - / 4415.68 | 148.1 | FasterRCNN-ResNet50-vd-SSLDv2-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50 | 36.7 | 129.10 / 129.10 | - / 3868.44 | 120.2 | FasterRCNN-ResNet50.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet101-FPN | 41.4 | 131.48 / 131.48 | - / 4380.00 | 216.3 | FasterRCNN-ResNet101-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet101 | 39.0 | 216.71 / 216.71 | - / 5376.45 | 188.1 | FasterRCNN-ResNet101.yaml | 推理模型/训练模型 |
FasterRCNN-ResNeXt101-vd-FPN | 43.4 | 234.38 / 234.38 | - / 6154.61 | 360.6 | FasterRCNN-ResNeXt101-vd-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-Swin-Tiny-FPN | 42.6 | 65.92 / 65.92 | - / 2468.98 | 159.8 | FasterRCNN-Swin-Tiny-FPN.yaml | 推理模型/训练模型 |
FCOS-ResNet50 | 39.6 | 101.02 / 34.42 | 752.15 / 752.15 | 124.2 | FCOS-ResNet50.yaml | 推理模型/训练模型 |
PicoDet-L | 42.6 | 14.31 / 11.06 | 45.95 / 25.06 | 20.9 | PicoDet-L.yaml | 推理模型/训练模型 |
PicoDet-M | 37.5 | 10.48 / 5.00 | 22.88 / 9.03 | 16.8 | PicoDet-M.yaml | 推理模型/训练模型 |
PicoDet-S | 29.1 | 9.15 / 3.26 | 16.06 / 4.04 | 4.4 | PicoDet-S.yaml | 推理模型/训练模型 |
PicoDet-XS | 26.2 | 9.54 / 3.52 | 17.96 / 5.38 | 5.7 | PicoDet-XS.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-L | 52.9 | 32.06 / 28.00 | 185.32 / 116.21 | 185.3 | PP-YOLOE_plus-L.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-M | 49.8 | 18.37 / 15.04 | 108.77 / 63.48 | 83.2 | PP-YOLOE_plus-M.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-S | 43.7 | 11.43 / 7.52 | 60.16 / 26.94 | 28.3 | PP-YOLOE_plus-S.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-X | 54.7 | 56.28 / 50.60 | 292.08 / 212.24 | 349.4 | PP-YOLOE_plus-X.yaml | 推理模型/训练模型 |
RT-DETR-H | 56.3 | 114.57 / 101.56 | 938.20 / 938.20 | 435.8 | RT-DETR-H.yaml | 推理模型/训练模型 |
RT-DETR-L | 53.0 | 34.76 / 27.60 | 495.39 / 247.68 | 113.7 | RT-DETR-L.yaml | 推理模型/训练模型 |
RT-DETR-R18 | 46.5 | 19.11 / 14.82 | 263.13 / 143.05 | 70.7 | RT-DETR-R18.yaml | 推理模型/训练模型 |
RT-DETR-R50 | 53.1 | 41.11 / 10.12 | 536.20 / 482.86 | 149.1 | RT-DETR-R50.yaml | 推理模型/训练模型 |
RT-DETR-X | 54.8 | 61.91 / 51.41 | 639.79 / 639.79 | 232.9 | RT-DETR-X.yaml | 推理模型/训练模型 |
YOLOv3-DarkNet53 | 39.1 | 39.62 / 35.54 | 166.57 / 136.34 | 219.7 | YOLOv3-DarkNet53.yaml | 推理模型/训练模型 |
YOLOv3-MobileNetV3 | 31.4 | 16.54 / 6.21 | 64.37 / 45.55 | 83.8 | YOLOv3-MobileNetV3.yaml | 推理模型/训练模型 |
YOLOv3-ResNet50_vd_DCN | 40.6 | 31.64 / 26.72 | 226.75 / 226.75 | 163.0 | YOLOv3-ResNet50_vd_DCN.yaml | 推理模型/训练模型 |
YOLOX-L | 50.1 | 49.68 / 45.03 | 232.52 / 156.24 | 192.5 | YOLOX-L.yaml | 推理模型/训练模型 |
YOLOX-M | 46.9 | 43.46 / 29.52 | 147.64 / 80.06 | 90.0 | YOLOX-M.yaml | 推理模型/训练模型 |
YOLOX-N | 26.1 | 42.94 / 17.79 | 64.15 / 7.19 | 3.4 | YOLOX-N.yaml | 推理模型/训练模型 |
YOLOX-S | 40.4 | 46.53 / 29.34 | 98.37 / 35.02 | 32.0 | YOLOX-S.yaml | 推理模型/训练模型 |
YOLOX-T | 32.9 | 31.81 / 18.91 | 55.34 / 11.63 | 18.1 | YOLOX-T.yaml | 推理模型/训练模型 |
YOLOX-X | 51.8 | 84.06 / 77.28 | 390.38 / 272.88 | 351.5 | YOLOX-X.yaml | 推理模型/训练模型 |
Co-Deformable-DETR-R50 | 49.7 | 259.62 / 259.62 | 32413.76 / 32413.76 | 184 | Co-Deformable-DETR-R50.yaml.yaml | 推理模型/训练模型 |
Co-Deformable-DETR-Swin-T | 48.0 (640x640 输入尺寸下) | 120.17 / 120.17 | - / 15620.29 | 187 | Co-Deformable-Swin-T.yaml | 推理模型/训练模型 |
Co-DINO-R50 | 52.0 | 1123.23 / 1123.23 | - / - | 186 | Co-DINO-R50.yaml | 推理模型/训练模型 |
Co-DINO-Swin-L | 55.9 (640x640 输入尺寸下) | - / - | - / - | 840 | Co-DINO-Swin-L.yaml | 推理模型/训练模型 |
注:以上精度指标为 COCO2017 验证集 mAP(0.5:0.95)。
小目标检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE_plus_SOD-S | 25.1 | 116.07 / 20.10 | 176.44 / 40.21 | 77.3 | PP-YOLOE_plus_SOD-S.yaml | 推理模型/训练模型 |
PP-YOLOE_plus_SOD-L | 31.9 | 100.02 / 48.33 | 271.29 / 151.20 | 325.0 | PP-YOLOE_plus_SOD-L.yaml | 推理模型/训练模型 |
PP-YOLOE_plus_SOD-largesize-L | 42.7 | 515.69 / 460.17 | 2816.08 / 1736.00 | 340.5 | PP-YOLOE_plus_SOD-largesize-L.yaml | 推理模型/训练模型 |
注:以上精度指标为 VisDrone-DET 验证集 mAP(0.5:0.95)。
开放词汇目标检测¶
模型 | mAP(0.5:0.95) | mAP(0.5) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|
GroundingDINO-T | 49.4 | 64.4 | - / - | - / - | 658.3 | GroundingDINO-T.yaml | 推理模型 |
YOLO-Worldv2-L | 44.4 | 59.8 | - / - | 292.14 / 292.14 | 421.4 | YOLO-Worldv2-L.yaml | 推理模型 |
注:以上精度指标为 COCO val2017 验证集 mAP(0.5:0.95)。。
开放词汇分割¶
模型 | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|
SAM-H_box | - / - | - / - | 2433.7 | SAM-H_box.yaml | 推理模型 |
SAM-H_point | - / - | - / - | 2433.7 | SAM-H_point.yaml | 推理模型 |
旋转目标检测¶
模型 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE-R-L | 78.14 | 67.50 / 61.15 | 414.79 / 414.79 | 211.0 | PP-YOLOE-R-L.yaml | 推理模型/训练模型 |
注:以上精度指标为DOTA验证集 mAP(0.5:0.95)。
行人检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE-L_human | 48.0 | 30.59 / 26.64 | 180.05 / 112.70 | 196.1 | PP-YOLOE-L_human.yaml | 推理模型/训练模型 |
PP-YOLOE-S_human | 42.5 | 10.26 / 6.66 | 54.01 / 23.48 | 28.8 | PP-YOLOE-S_human.yaml | 推理模型/训练模型 |
注:以上精度指标为 CrowdHuman 验证集 mAP(0.5:0.95)。
车辆检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE-L_vehicle | 63.9 | 30.30 / 26.27 | 169.28 / 111.88 | 196.1 | PP-YOLOE-L_vehicle.yaml | 推理模型/训练模型 |
PP-YOLOE-S_vehicle | 61.3 | 10.54 / 6.69 | 52.73 / 23.58 | 28.8 | PP-YOLOE-S_vehicle.yaml | 推理模型/训练模型 |
注:以上精度指标为 PPVehicle 验证集 mAP(0.5:0.95)。
人脸检测模块¶
模型名称 | AP (%) Easy/Medium/Hard |
GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
BlazeFace | 77.7/73.4/49.5 | 50.90 / 45.74 | 71.92 / 71.92 | 0.447 | BlazeFace.yaml | 推理模型/训练模型 |
BlazeFace-FPN-SSH | 83.2/80.5/60.5 | 58.99 / 51.75 | 87.39 / 87.39 | 0.606 | BlazeFace-FPN-SSH.yaml | 推理模型/训练模型 |
PicoDet_LCNet_x2_5_face | 93.7/90.7/68.1 | 33.91 / 26.53 | 153.56 / 79.21 | 28.9 | PicoDet_LCNet_x2_5_face.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-S_face | 93.9/91.8/79.8 | 21.28 / 11.09 | 137.26 / 72.09 | 26.5 | PP-YOLOE_plus-S_face.yaml | 推理模型/训练模型 |
注:以上精度指标是在WIDER-FACE验证集上,以640*640作为输入尺寸评估得到的。
异常检测模块¶
模型名称 | mIoU | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
STFPM | 0.9901 | 4.94 / 1.63 | 34.88 / 34.88 | 22.5 | STFPM.yaml | 推理模型/训练模型 |
注:以上精度指标为 MVTec AD 验证集 平均异常分数。
人体关键点检测模块¶
模型 | 方案 | 输入尺寸 | AP(0.5:0.95) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|---|
PP-TinyPose_128x96 | Top-Down | 24.22 / 4.34 | - / 6.19 | 24.22 / 4.34 | - / 6.19 | 4.9 | PP-TinyPose_128x96.yaml | 推理模型/训练模型 |
PP-TinyPose_256x192 | Top-Down | 68.3 | 21.73 / 3.59 | - / 10.18 | 4.9 | PP-TinyPose_256x192.yaml | 推理模型/训练模型 |
注:以上精度指标为COCO数据集 AP(0.5:0.95),所依赖的检测框为ground truth标注得到。
3D多模态融合检测模块¶
模型 | mAP(%) | NDS | yaml文件 | 模型下载链接 |
---|---|---|---|---|
BEVFusion | 53.9 | 60.9 | BEVFusion.yaml | 推理模型/训练模型 |
注:以上精度指标为nuscenes验证集 mAP(0.5:0.95), NDS 60.9, 精度类型为 FP32。
语义分割模块¶
模型名称 | mloU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
Deeplabv3_Plus-R50 | 80.36 | 481.33 / 446.18 | 2952.95 / 1907.07 | 94.9 | Deeplabv3_Plus-R50.yaml | 推理模型/训练模型 |
Deeplabv3_Plus-R101 | 81.10 | 766.70 / 194.42 | 4441.56 / 2984.19 | 162.5 | Deeplabv3_Plus-R101.yaml | 推理模型/训练模型 |
Deeplabv3-R50 | 79.90 | 681.65 / 602.10 | 3786.41 / 3093.10 | 138.3 | Deeplabv3-R50.yaml | 推理模型/训练模型 |
Deeplabv3-R101 | 80.85 | 974.62 / 896.99 | 5222.60 / 4230.79 | 205.9 | Deeplabv3-R101.yaml | 推理模型/训练模型 |
OCRNet_HRNet-W18 | 80.67 | 271.02 / 221.38 | 1791.52 / 1061.62 | 43.1 | OCRNet_HRNet-W18.yaml | 推理模型/训练模型 |
OCRNet_HRNet-W48 | 82.15 | 582.92 / 536.28 | 3513.72 / 2543.10 | 270 | OCRNet_HRNet-W48.yaml | 推理模型/训练模型 |
PP-LiteSeg-T | 73.10 | 28.12 / 23.84 | 398.31 / 398.31 | 28.5 | PP-LiteSeg-T.yaml | 推理模型/训练模型 |
PP-LiteSeg-B | 75.25 | 35.69 / 35.69 | 485.10 / 485.10 | 47.0 | PP-LiteSeg-B.yaml | 推理模型/训练模型 |
SegFormer-B0 (slice) | 76.73 | 11.1946 | 268.929 | 13.2 | SegFormer-B0.yaml | 推理模型/训练模型 |
SegFormer-B1 (slice) | 78.35 | 17.9998 | 403.393 | 48.5 | SegFormer-B1.yaml | 推理模型/训练模型 |
SegFormer-B2 (slice) | 81.60 | 48.0371 | 1248.52 | 96.9 | SegFormer-B2.yaml | 推理模型/训练模型 |
SegFormer-B3 (slice) | 82.47 | 64.341 | 1666.35 | 167.3 | SegFormer-B3.yaml | 推理模型/训练模型 |
SegFormer-B4 (slice) | 82.38 | 82.4336 | 1995.42 | 226.7 | SegFormer-B4.yaml | 推理模型/训练模型 |
SegFormer-B5 (slice) | 82.58 | 97.3717 | 2420.19 | 229.7 | SegFormer-B5.yaml | 推理模型/训练模型 |
注:以上精度指标为 Cityscapes 数据集 mloU。
模型名称 | mloU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
SeaFormer_base(slice) | 40.92 | 24.4073 | 397.574 | 30.8 | SeaFormer_base.yaml | 推理模型/训练模型 |
SeaFormer_large (slice) | 43.66 | 27.8123 | 550.464 | 49.8 | SeaFormer_large.yaml | 推理模型/训练模型 |
SeaFormer_small (slice) | 38.73 | 19.2295 | 358.343 | 14.3 | SeaFormer_small.yaml | 推理模型/训练模型 |
SeaFormer_tiny (slice) | 34.58 | 13.9496 | 330.132 | 6.1 | SeaFormer_tiny.yaml | 推理模型/训练模型 |
MaskFormer_small | 49.70 | 65.21 / 65.21 | - / 629.85 | 242.5 | MaskFormer_small.yaml | 推理模型/训练模型 |
MaskFormer_tiny | 46.69 | 47.95 / 47.95 | - / 492.67 | 160.5 | MaskFormer_tiny.yaml | 推理模型/训练模型 |
注:以上精度指标为 ADE20k 数据集, slice 表示对输入图像进行了切图操作。
实例分割模块¶
模型名称 | Mask AP | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
Mask-RT-DETR-H | 50.6 | 180.83 / 180.83 | 1711.24 / 1711.24 | 449.9 | Mask-RT-DETR-H.yaml | 推理模型/训练模型 |
Mask-RT-DETR-L | 45.7 | 113.20 / 113.20 | 1179.56 / 1179.56 | 113.6 | Mask-RT-DETR-L.yaml | 推理模型/训练模型 |
Mask-RT-DETR-M | 42.7 | 87.08 / 87.08 | - / 2090.73 | 66.6 | Mask-RT-DETR-M.yaml | 推理模型/训练模型 |
Mask-RT-DETR-S | 41.0 | 120.86 / 120.86 | - / 2163.07 | 51.8 | Mask-RT-DETR-S.yaml | 推理模型/训练模型 |
Mask-RT-DETR-X | 47.5 | 141.43 / 141.43 | 1379.14 / 1379.14 | 237.5 | Mask-RT-DETR-X.yaml | 推理模型/训练模型 |
Cascade-MaskRCNN-ResNet50-FPN | 36.3 | 136.79 / 136.79 | - / 5935.41 | 254.8 | Cascade-MaskRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN | 39.1 | 137.40 / 137.40 | - / 6816.68 | 254.7 | Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet50-FPN | 35.6 | 112.79 / 112.79 | - / 4912.37 | 157.5 | MaskRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet50-vd-FPN | 36.4 | 112.88 / 112.88 | - / 5204.97 | 157.5 | MaskRCNN-ResNet50-vd-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet50 | 32.8 | 181.60 / 181.60 | - / 5523.45 | 127.8 | MaskRCNN-ResNet50.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet101-FPN | 36.6 | 138.84 / 138.84 | - / 5107.74 | 225.4 | MaskRCNN-ResNet101-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet101-vd-FPN | 38.1 | 141.73 / 141.73 | - / 5592.76 | 225.1 | MaskRCNN-ResNet101-vd-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNeXt101-vd-FPN | 39.5 | 220.83 / 220.83 | - / 5932.59 | 370.0 | MaskRCNN-ResNeXt101-vd-FPN.yaml | 推理模型/训练模型 |
PP-YOLOE_seg-S | 32.5 | 243.41 / 222.30 | 2507.70 / 1282.35 | 31.5 | PP-YOLOE_seg-S.yaml | 推理模型/训练模型 |
SOLOv2 | 35.5 | 131.99 / 131.99 | - / 2369.98 | 179.1 | SOLOv2.yaml | 推理模型/训练模型 |
注:以上精度指标为 COCO2017 验证集 Mask AP(0.5:0.95)。
文本检测模块¶
模型 | 检测Hmean(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv5_server_det | 83.8 | 89.55 / 70.19 | 383.15 / 383.15 | 84.3 | PP-OCRv5_server_det.yaml | 推理模型/训练模型 |
PP-OCRv5_mobile_det | 79.0 | 10.67 / 6.36 | 57.77 / 28.15 | 4.7 | PP-OCRv5_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv4_server_det | 82.56 | 127.82 / 98.87 | 585.95 / 489.77 | 109 | PP-OCRv4_server_det.yaml | 推理模型/训练模型 |
PP-OCRv4_mobile_det | 63.8 | 9.87 / 4.17 | 56.60 / 20.79 | 4.7 | PP-OCRv4_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv3_mobile_det | 精度接近 PP-OCRv4_mobile_det | 9.90 / 3.60 | 41.93 / 20.76 | 2.1 | PP-OCRv3_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv3_server_det | 80.11 | 119.50 / 75.00 | 379.35 / 318.35 | 102.1 | PP-OCRv3_server_det.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的中英文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 593 张图片。
印章文本检测模块¶
模型名称 | 检测Hmean(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv4_mobile_seal_det | 96.36 | 9.70 / 3.56 | 50.38 / 19.64 | 4.7 | PP-OCRv4_mobile_seal_det.yaml | 推理模型/训练模型 |
PP-OCRv4_server_seal_det | 98.40 | 124.64 / 91.57 | 545.68 / 439.86 | 109 | PP-OCRv4_server_seal_det.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleX 自建的印章数据集,包含500印章图像。
文本识别模块¶
- 中文识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv5_server_rec | 86.38 | 8.46 / 2.36 | 31.21 / 31.21 | 81 | PP-OCRv5_server_rec.yaml | 推理模型/训练模型 |
PP-OCRv5_mobile_rec | 81.29 | 5.43 / 1.46 | 21.20 / 5.32 | 16 | PP-OCRv5_mobile_rec.yaml | 推理模型/训练模型 |
PP-OCRv4_server_rec_doc | 86.58 | 8.69 / 2.78 | 37.93 / 37.93 | 182 | PP-OCRv4_server_rec_doc.yaml | 推理模型/训练模型 |
PP-OCRv4_mobile_rec | 78.74 | 5.26 / 1.12 | 17.48 / 3.61 | 10.5 | PP-OCRv4_mobile_rec.yaml | 推理模型/训练模型 |
PP-OCRv4_server_rec | 85.19 | 8.75 / 2.49 | 36.93 / 36.93 | 173 | PP-OCRv4_server_rec.yaml | 推理模型/训练模型 |
PP-OCRv3_mobile_rec | 72.96 | 3.89 / 1.16 | 8.72 / 3.56 | 10.3 | PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 8367 张图片。
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
ch_SVTRv2_rec | 68.81 | 10.38 / 8.31 | 66.52 / 30.83 | 80.5 | ch_SVTRv2_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
ch_RepSVTR_rec | 65.07 | 6.29 / 1.57 | 20.64 / 5.40 | 48.8 | ch_RepSVTR_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。
- 英文识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
en_PP-OCRv4_mobile_rec | 70.39 | 4.81 / 1.23 | 17.20 / 4.18 | 7.5 | en_PP-OCRv4_mobile_rec.yaml | 推理模型/训练模型 |
en_PP-OCRv3_mobile_rec | 70.69 | 3.56 / 0.78 | 8.44 / 5.78 | 17.3 | en_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleX 自建的英文数据集。
- 多语言识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
korean_PP-OCRv3_mobile_rec | 60.21 | 3.73 / 0.98 | 8.76 / 2.91 | 9.6 | korean_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
japan_PP-OCRv3_mobile_rec | 45.69 | 3.86 / 1.01 | 8.62 / 2.92 | 9.8 | japan_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
chinese_cht_PP-OCRv3_mobile_rec | 82.06 | 3.90 / 1.16 | 9.24 / 3.18 | 10.8 | chinese_cht_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
te_PP-OCRv3_mobile_rec | 95.88 | 3.59 / 0.81 | 8.28 / 6.21 | 8.7 | te_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
ka_PP-OCRv3_mobile_rec | 96.96 | 3.49 / 0.89 | 8.63 / 2.77 | 17.4 | ka_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
ta_PP-OCRv3_mobile_rec | 76.83 | 3.49 / 0.86 | 8.35 / 3.41 | 8.7 | ta_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
latin_PP-OCRv3_mobile_rec | 76.93 | 3.53 / 0.78 | 8.50 / 6.83 | 8.7 | latin_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
arabic_PP-OCRv3_mobile_rec | 73.55 | 3.60 / 0.83 | 8.44 / 4.69 | 17.3 | arabic_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
cyrillic_PP-OCRv3_mobile_rec | 94.28 | 3.56 / 0.79 | 8.22 / 2.76 | 8.7 | cyrillic_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
devanagari_PP-OCRv3_mobile_rec | 96.44 | 3.60 / 0.78 | 6.95 / 2.87 | 8.7 | devanagari_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleX 自建的多语种数据集。
公式识别模块¶
模型 | En-BLEU(%) | Zh-BLEU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 | UniMERNet | 85.91 | 43.50 | 1311.84 / 1311.84 | - / 8288.07 | 1530 | UniMERNet.yaml | 推理模型/训练模型 |
---|---|---|---|---|---|---|---|
PP-FormulaNet-S | 87.00 | 45.71 | 182.25 / 182.25 | - / 254.39 | 224 | PP-FormulaNet-S.yaml | 推理模型/训练模型 |
PP-FormulaNet-L | 90.36 | 45.78 | 1482.03 / 1482.03 | - / 3131.54 | 695 | PP-FormulaNet-L.yaml | 推理模型/训练模型 |
PP-FormulaNet_plus-S | 88.71 | 53.32 | 179.20 / 179.20 | - / 260.99 | 248 | PP-FormulaNet_plus-S.yaml | 推理模型/训练模型 |
PP-FormulaNet_plus-M | 91.45 | 89.76 | 1040.27 / 1040.27 | - / 1615.80 | 592 | PP-FormulaNet_plus-M.yaml | 推理模型/训练模型 |
PP-FormulaNet_plus-L | 92.22 | 90.64 | 1476.07 / 1476.07 | - / 3125.58 | 698 | PP-FormulaNet_plus-L.yaml | 推理模型/训练模型 |
LaTeX_OCR_rec | 74.55 | 39.96 | 1088.89 / 1088.89 | - / - | 99 | LaTeX_OCR_rec.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建公式识别测试集。LaTeX_OCR_rec在LaTeX-OCR公式识别测试集的BLEU score为 0.8821。
表格结构识别模块¶
模型 | 精度(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
SLANet | 59.52 | 23.96 / 21.75 | - / 43.12 | 6.9 | SLANet.yaml | 推理模型/训练模型 |
SLANet_plus | 63.69 | 23.43 / 22.16 | - / 41.80 | 6.9 | SLANet_plus.yaml | 推理模型/训练模型 |
SLANeXt_wired | 69.65 | 85.92 / 85.92 | - / 501.66 | 351 | SLANeXt_wired.yaml | 推理模型/训练模型 |
SLANeXt_wireless | SLANeXt_wireless.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建高难度中文表格识别数据集。
表格单元格检测模块¶
模型 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
RT-DETR-L_wired_table_cell_det | 82.7 | 33.47 / 27.02 | 402.55 / 256.56 | 124M | RT-DETR-L_wired_table_cell_det.yaml | 推理模型/训练模型 |
RT-DETR-L_wireless_table_cell_det | RT-DETR-L_wireless_table_cell_det.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建表格单元格检测数据集。
表格分类模块¶
模型 | Top1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_table_cls | 94.2 | 2.62 / 0.60 | 3.17 / 1.14 | 6.6 | PP-LCNet_x1_0_table_cls.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建表格分类数据集。
文本图像矫正模块¶
模型名称 | CER | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
UVDoc | 0.179 | 19.05 / 19.05 | - / 869.82 | 30.3 | UVDoc.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX自建的图像矫正数据集。
版面区域检测模块¶
- 版面检测模型,包含20个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、表格、图和表标题(图标题、表格标题和图表标题)、印章、图表、侧栏文本和参考文献内容
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-DocLayout_plus-L | 83.2 | 53.03 / 17.23 | 634.62 / 378.32 | 126.01 | PP-DocLayout_plus-L.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1300 张文档类型图片。
- 文档图像版面子模块检测,包含1个 版面区域 类别,能检测多栏的报纸、杂志的每个子文章的文本区域:
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-DocBlockLayout | 95.9 | 34.60 / 28.54 | 506.43 / 256.83 | 123.92 | PP-DocBlockLayout.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的版面子区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1000 张文档类型图片。
- 版面检测模型,包含23个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、图表标题、表格、表格标题、印章、图表标题、图表、页眉图像、页脚图像、侧栏文本
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-DocLayout-L | 90.4 | 33.59 / 33.59 | 503.01 / 251.08 | 123.76 | PP-DocLayout-L.yaml | 推理模型/训练模型 |
PP-DocLayout-M | 75.2 | 13.03 / 4.72 | 43.39 / 24.44 | 22.578 | PP-DocLayout-M.yaml | 推理模型/训练模型 |
PP-DocLayout-S | 70.9 | 11.54 / 3.86 | 18.53 / 6.29 | 4.834 | PP-DocLayout-S.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 500 张文档类型图片。
- 表格版面检测模型
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet_layout_1x_table | 97.5 | 9.57 / 6.63 | 27.66 / 16.75 | 7.4 | PicoDet_layout_1x_table.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的版面表格区域检测数据集,包含中英文 7835 张带有表格的论文文档类型图片。
- 3类版面检测模型,包含表格、图像、印章
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet-S_layout_3cls | 88.2 | 8.43 / 3.44 | 17.60 / 6.51 | 4.8 | PicoDet-S_layout_3cls.yaml | 推理模型/训练模型 |
PicoDet-L_layout_3cls | 89.0 | 12.80 / 9.57 | 45.04 / 23.86 | 22.6 | PicoDet-L_layout_3cls.yaml | 推理模型/训练模型 |
RT-DETR-H_layout_3cls | 95.8 | 114.80 / 25.65 | 924.38 / 924.38 | 470.1 | RT-DETR-H_layout_3cls.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 1154 张文档类型图片。
- 5类英文文档区域检测模型,包含文字、标题、表格、图片以及列表
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet_layout_1x | 97.8 | 9.62 / 6.75 | 26.96 / 12.77 | 7.4 | PicoDet_layout_1x.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PubLayNet 的评估数据集,包含英文文档的 11245 张图片。
- 17类区域检测模型,包含17个版面常见类别,分别是:段落标题、图片、文本、数字、摘要、内容、图表标题、公式、表格、表格标题、参考文献、文档标题、脚注、页眉、算法、页脚、印章
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet-S_layout_17cls | 87.4 | 8.80 / 3.62 | 17.51 / 6.35 | 4.8 | PicoDet-S_layout_17cls.yaml | 推理模型/训练模型 |
PicoDet-L_layout_17cls | 89.0 | 12.60 / 10.27 | 43.70 / 24.42 | 22.6 | PicoDet-L_layout_17cls.yaml | 推理模型/训练模型 |
RT-DETR-H_layout_17cls | 98.3 | 115.29 / 101.18 | 964.75 / 964.75 | 470.2 | RT-DETR-H_layout_17cls.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 892 张文档类型图片。
文档图像方向分类模块¶
模型 | Top-1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_doc_ori | 99.06 | 2.62 / 0.59 | 3.24 / 1.19 | 7 | PP-LCNet_x1_0_doc_ori.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。
文本行方向分类模块¶
模型 | 模型下载链接 | Top-1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
GPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | 介绍 |
---|---|---|---|---|---|---|
PP-LCNet_x0_25_textline_ori | 推理模型/训练模型 | 98.85 | 2.16 / 0.41 | 2.37 / 0.73 | 0.96 | 基于PP-LCNet_x0_25的文本行分类模型,含有两个类别,即0度,180度 |
PP-LCNet_x1_0_textline_ori | 推理模型/训练模型 | 99.42 | - / - | 2.98 / 2.98 | 6.5 | 基于PP-LCNet_x1_0的文本行分类模型,含有两个类别,即0度,180度 |
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。
时序预测模块¶
模型名称 | mse | mae | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|
DLinear | 0.382 | 0.394 | 0.34 / 0.12 | 0.64 / 0.06 | 0.072 | DLinear.yaml | 推理模型/训练模型 |
NLinear | 0.386 | 0.392 | 0.27 / 0.10 | 0.49 / 0.08 | 0.04 | NLinear.yaml | 推理模型/训练模型 |
Nonstationary | 0.600 | 0.515 | 3.92 / 2.59 | 18.09 / 13.36 | 55.5 | Nonstationary.yaml | 推理模型/训练模型 |
PatchTST | 0.379 | 0.391 | 1.81 / 0.45 | 5.79 / 0.77 | 2.0 | PatchTST.yaml | 推理模型/训练模型 |
RLinear | 0.385 | 0.392 | 0.39 / 0.18 | 0.82 / 0.08 | 0.04 | RLinear.yaml | 推理模型/训练模型 |
TiDE | 0.407 | 0.414 | - / - | 4.54 / 1.09 | 31.7 | TiDE.yaml | 推理模型/训练模型 |
TimesNet | 0.416 | 0.429 | 15.19 / 13.77 | 23.14 / 12.42 | 4.9 | TimesNet.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 ETTH1 数据集 (在测试集test.csv上的评测结果)。
时序异常检测模块¶
模型名称 | precision | recall | f1_score | 模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
AutoEncoder_ad | 99.36 | 0.24 / 0.13 | 0.41 / 0.05 | 0.052 | AutoEncoder_ad.yaml | 推理模型/训练模型 |
DLinear_ad | 98.98 | 0.39 / 0.16 | 0.69 / 0.08 | 0.112 | DLinear_ad.yaml | 推理模型/训练模型 |
Nonstationary_ad | 98.55 | 1.94 / 1.16 | 5.31 / 1.66 | 1.8 | Nonstationary_ad.yaml | 推理模型/训练模型 |
PatchTST_ad | 98.78 | 2.10 / 0.55 | 6.98 / 0.63 | 0.32 | PatchTST_ad.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PSM 数据集。
时序分类模块¶
模型名称 | acc(%) | 模型存储大小(MB) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|
TimesNet_cls | 87.5 | 0.792 | TimesNet_cls.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 UWaveGestureLibrary数据集。
多语种语音识别模块¶
模型 | 训练数据 | 模型存储大小(MB) | 词错率 | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|
whisper_large | 680kh | 5800 | 2.7 (Librispeech) | whisper_large.yaml | 推理模型 |
whisper_medium | 680kh | 2900 | - | whisper_medium.yaml | 推理模型 |
whisper_small | 680kh | 923 | - | whisper_small.yaml | 推理模型 |
whisper_base | 680kh | 277 | - | whisper_base.yaml | 推理模型 |
whisper_tiny | 680kh | 145 | - | whisper_tiny.yaml | 推理模型 |
视频分类模块¶
模型 | Top1 Acc(%) | 模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
PP-TSM-R50_8frames_uniform | 74.36 | 93.4 | PP-TSM-R50_8frames_uniform.yaml | 推理模型/训练模型 |
PP-TSMv2-LCNetV2_8frames_uniform | 71.71 | 22.5 | PP-TSMv2-LCNetV2_8frames_uniform.yaml | 推理模型/训练模型 |
PP-TSMv2-LCNetV2_16frames_uniform | 73.11 | 22.5 | PP-TSMv2-LCNetV2_16frames_uniform.yaml | 推理模型/训练模型 |
注:以上精度指标为 K400 验证集 Top1 Acc。
视频检测模块¶
模型 | Frame-mAP(@ IoU 0.5) | 模型存储大小(MB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
YOWO | 80.94 | 462.891 | YOWO.yaml | 推理模型/训练模型 |
注:以上精度指标为 UCF101-24 test数据集上的测试指标Frame-mAP (@ IoU 0.5)
文档类视觉语言模型模块¶
模型 | 模型参数尺寸(B) | 模型存储大小(GB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
PP-DocBee-2B | 2 | 4.2 | PP-DocBee-2B.yaml | 推理模型 |
PP-DocBee-7B | 7 | 15.8 | PP-DocBee-7B.yaml | 推理模型 |
PP-DocBee2-3B | 3 | 7.6 | PP-DocBee2-3B.yaml | 推理模型 |
图表解析模型模块¶
模型 | 模型参数尺寸(B) | 模型存储大小(GB) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
PP-Chart2Table | 0.58 | 1.4 | PP-Chart2Table.yaml | 推理模型 |
测试环境说明:
- 性能测试环境
- 硬件配置:
- GPU:NVIDIA Tesla T4
- CPU:Intel Xeon Gold 6271C @ 2.60GHz
- 其他环境:Ubuntu 20.04 / CUDA 11.8 / cuDNN 8.9 / TensorRT 8.6.1.6
- 硬件配置:
- 推理模式说明
模式 | GPU配置 | CPU配置 | 加速技术组合 |
---|---|---|---|
常规模式 | FP32精度 / 无TRT加速 | FP32精度 / 8线程 | PaddleInference |
高性能模式 | 选择先验精度类型和加速策略的最优组合 | FP32精度 / 8线程 | 选择先验最优后端(Paddle/OpenVINO/TRT等) |