PaddleX模型列表(CPU/GPU)¶
PaddleX 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型推理速度,请选择推理速度较快的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。
图像分类模块¶
模型名称 | Top1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
CLIP_vit_base_patch16_224 | 85.36 | 12.84 / 2.82 | 60.52 / 60.52 | 306.5 M | CLIP_vit_base_patch16_224.yaml | 推理模型/训练模型 |
CLIP_vit_large_patch14_224 | 88.1 | 51.72 / 11.13 | 238.07 / 238.07 | 1.04 G | CLIP_vit_large_patch14_224.yaml | 推理模型/训练模型 |
ConvNeXt_base_224 | 83.84 | 13.18 / 12.14 | 128.39 / 81.78 | 313.9 M | ConvNeXt_base_224.yaml | 推理模型/训练模型 |
ConvNeXt_base_384 | 84.90 | 32.15 / 30.52 | 279.36 / 220.35 | 313.9 M | ConvNeXt_base_384.yaml | 推理模型/训练模型 |
ConvNeXt_large_224 | 84.26 | 26.51 / 7.21 | 213.32 / 157.22 | 700.7 M | ConvNeXt_large_224.yaml | 推理模型/训练模型 |
ConvNeXt_large_384 | 85.27 | 67.07 / 65.26 | 494.04 / 438.97 | 700.7 M | ConvNeXt_large_384.yaml | 推理模型/训练模型 |
ConvNeXt_small | 83.13 | 9.05 / 8.21 | 97.94 / 55.29 | 178.0 M | ConvNeXt_small.yaml | 推理模型/训练模型 |
ConvNeXt_tiny | 82.03 | 5.12 / 2.06 | 63.96 / 29.77 | 101.4 M | ConvNeXt_tiny.yaml | 推理模型/训练模型 |
FasterNet-L | 83.5 | 15.67 / 3.10 | 52.24 / 52.24 | 357.1 M | FasterNet-L.yaml | 推理模型/训练模型 |
FasterNet-M | 83.0 | 9.72 / 2.30 | 35.29 / 35.29 | 204.6 M | FasterNet-M.yaml | 推理模型/训练模型 |
FasterNet-S | 81.3 | 5.46 / 1.27 | 20.46 / 18.03 | 119.3 M | FasterNet-S.yaml | 推理模型/训练模型 |
FasterNet-T0 | 71.9 | 4.18 / 0.60 | 6.34 / 3.44 | 15.1 M | FasterNet-T0.yaml | 推理模型/训练模型 |
FasterNet-T1 | 75.9 | 4.24 / 0.64 | 9.57 / 5.20 | 29.2 M | FasterNet-T1.yaml | 推理模型/训练模型 |
FasterNet-T2 | 79.1 | 3.87 / 0.78 | 11.14 / 9.98 | 57.4 M | FasterNet-T2.yaml | 推理模型/训练模型 |
MobileNetV1_x0_5 | 63.5 | 1.39 / 0.28 | 2.74 / 1.02 | 4.8 M | MobileNetV1_x0_5.yaml | 推理模型/训练模型 |
MobileNetV1_x0_25 | 51.4 | 1.32 / 0.30 | 2.04 / 0.58 | 1.8 M | MobileNetV1_x0_25.yaml | 推理模型/训练模型 |
MobileNetV1_x0_75 | 68.8 | 1.75 / 0.33 | 3.41 / 1.57 | 9.3 M | MobileNetV1_x0_75.yaml | 推理模型/训练模型 |
MobileNetV1_x1_0 | 71.0 | 1.89 / 0.34 | 4.01 / 2.17 | 15.2 M | MobileNetV1_x1_0.yaml | 推理模型/训练模型 |
MobileNetV2_x0_5 | 65.0 | 3.17 / 0.48 | 4.52 / 1.35 | 7.1 M | MobileNetV2_x0_5.yaml | 推理模型/训练模型 |
MobileNetV2_x0_25 | 53.2 | 2.80 / 0.46 | 3.92 / 0.98 | 5.5 M | MobileNetV2_x0_25.yaml | 推理模型/训练模型 |
MobileNetV2_x1_0 | 72.2 | 3.57 / 0.49 | 5.63 / 2.51 | 12.6 M | MobileNetV2_x1_0.yaml | 推理模型/训练模型 |
MobileNetV2_x1_5 | 74.1 | 3.58 / 0.62 | 8.02 / 4.49 | 25.0 M | MobileNetV2_x1_5.yaml | 推理模型/训练模型 |
MobileNetV2_x2_0 | 75.2 | 3.56 / 0.74 | 10.24 / 6.83 | 41.2 M | MobileNetV2_x2_0.yaml | 推理模型/训练模型 |
MobileNetV3_large_x0_5 | 69.2 | 3.79 / 0.62 | 6.76 / 1.61 | 9.6 M | MobileNetV3_large_x0_5.yaml | 推理模型/训练模型 |
MobileNetV3_large_x0_35 | 64.3 | 3.70 / 0.60 | 5.54 / 1.41 | 7.5 M | MobileNetV3_large_x0_35.yaml | 推理模型/训练模型 |
MobileNetV3_large_x0_75 | 73.1 | 4.82 / 0.66 | 7.45 / 2.00 | 14.0 M | MobileNetV3_large_x0_75.yaml | 推理模型/训练模型 |
MobileNetV3_large_x1_0 | 75.3 | 4.86 / 0.68 | 6.88 / 2.61 | 19.5 M | MobileNetV3_large_x1_0.yaml | 推理模型/训练模型 |
MobileNetV3_large_x1_25 | 76.4 | 5.08 / 0.71 | 7.37 / 3.58 | 26.5 M | MobileNetV3_large_x1_25.yaml | 推理模型/训练模型 |
MobileNetV3_small_x0_5 | 59.2 | 3.41 / 0.57 | 5.60 / 1.14 | 6.8 M | MobileNetV3_small_x0_5.yaml | 推理模型/训练模型 |
MobileNetV3_small_x0_35 | 53.0 | 3.49 / 0.60 | 4.63 / 1.07 | 6.0 M | MobileNetV3_small_x0_35.yaml | 推理模型/训练模型 |
MobileNetV3_small_x0_75 | 66.0 | 3.49 / 0.60 | 5.19 / 1.28 | 8.5 M | MobileNetV3_small_x0_75.yaml | 推理模型/训练模型 |
MobileNetV3_small_x1_0 | 68.2 | 3.76 / 0.53 | 5.11 / 1.43 | 10.5 M | MobileNetV3_small_x1_0.yaml | 推理模型/训练模型 |
MobileNetV3_small_x1_25 | 70.7 | 4.23 / 0.58 | 6.48 / 1.68 | 13.0 M | MobileNetV3_small_x1_25.yaml | 推理模型/训练模型 |
MobileNetV4_conv_large | 83.4 | 8.33 / 2.24 | 33.56 / 23.70 | 125.2 M | MobileNetV4_conv_large.yaml | 推理模型/训练模型 |
MobileNetV4_conv_medium | 79.9 | 6.81 / 0.92 | 12.47 / 6.27 | 37.6 M | MobileNetV4_conv_medium.yaml | 推理模型/训练模型 |
MobileNetV4_conv_small | 74.6 | 3.25 / 0.46 | 4.42 / 1.54 | 14.7 M | MobileNetV4_conv_small.yaml | 推理模型/训练模型 |
MobileNetV4_hybrid_large | 83.8 | 12.27 / 4.18 | 58.64 / 58.64 | 145.1 M | MobileNetV4_hybrid_large.yaml | 推理模型/训练模型 |
MobileNetV4_hybrid_medium | 80.5 | 12.08 / 1.34 | 24.69 / 8.10 | 42.9 M | MobileNetV4_hybrid_medium.yaml | 推理模型/训练模型 |
PP-HGNet_base | 85.0 | 14.10 / 4.19 | 68.92 / 68.92 | 249.4 M | PP-HGNet_base.yaml | 推理模型/训练模型 |
PP-HGNet_small | 81.51 | 5.12 / 1.73 | 25.01 / 25.01 | 86.5 M | PP-HGNet_small.yaml | 推理模型/训练模型 |
PP-HGNet_tiny | 79.83 | 3.28 / 1.29 | 16.40 / 15.97 | 52.4 M | PP-HGNet_tiny.yaml | 推理模型/训练模型 |
PP-HGNetV2-B0 | 77.77 | 3.83 / 0.57 | 9.95 / 2.37 | 21.4 M | PP-HGNetV2-B0.yaml | 推理模型/训练模型 |
PP-HGNetV2-B1 | 79.18 | 3.87 / 0.62 | 8.77 / 3.79 | 22.6 M | PP-HGNetV2-B1.yaml | 推理模型/训练模型 |
PP-HGNetV2-B2 | 81.74 | 5.73 / 0.86 | 15.11 / 7.05 | 39.9 M | PP-HGNetV2-B2.yaml | 推理模型/训练模型 |
PP-HGNetV2-B3 | 82.98 | 6.26 / 1.01 | 18.47 / 10.34 | 57.9 M | PP-HGNetV2-B3.yaml | 推理模型/训练模型 |
PP-HGNetV2-B4 | 83.57 | 5.47 / 1.10 | 14.42 / 9.89 | 70.4 M | PP-HGNetV2-B4.yaml | 推理模型/训练模型 |
PP-HGNetV2-B5 | 84.75 | 10.24 / 1.96 | 29.71 / 29.71 | 140.8 M | PP-HGNetV2-B5.yaml | 推理模型/训练模型 |
PP-HGNetV2-B6 | 86.30 | 12.25 / 3.76 | 62.29 / 62.29 | 268.4 M | PP-HGNetV2-B6.yaml | 推理模型/训练模型 |
PP-LCNet_x0_5 | 63.14 | 2.28 / 0.42 | 2.86 / 0.83 | 6.7 M | PP-LCNet_x0_5.yaml | 推理模型/训练模型 |
PP-LCNet_x0_25 | 51.86 | 1.89 / 0.45 | 2.49 / 0.68 | 5.5 M | PP-LCNet_x0_25.yaml | 推理模型/训练模型 |
PP-LCNet_x0_35 | 58.09 | 1.94 / 0.41 | 2.73 / 0.77 | 5.9 M | PP-LCNet_x0_35.yaml | 推理模型/训练模型 |
PP-LCNet_x0_75 | 68.18 | 2.30 / 0.41 | 2.95 / 1.07 | 8.4 M | PP-LCNet_x0_75.yaml | 推理模型/训练模型 |
PP-LCNet_x1_0 | 71.32 | 2.35 / 0.47 | 4.03 / 1.35 | 10.5 M | PP-LCNet_x1_0.yaml | 推理模型/训练模型 |
PP-LCNet_x1_5 | 73.71 | 2.33 / 0.53 | 4.17 / 2.29 | 16.0 M | PP-LCNet_x1_5.yaml | 推理模型/训练模型 |
PP-LCNet_x2_0 | 75.18 | 2.40 / 0.51 | 5.37 / 3.46 | 23.2 M | PP-LCNet_x2_0.yaml | 推理模型/训练模型 |
PP-LCNet_x2_5 | 76.60 | 2.36 / 0.61 | 6.29 / 5.05 | 32.1 M | PP-LCNet_x2_5.yaml | 推理模型/训练模型 |
PP-LCNetV2_base | 77.05 | 3.33 / 0.55 | 6.86 / 3.77 | 23.7 M | PP-LCNetV2_base.yaml | 推理模型/训练模型 |
PP-LCNetV2_large | 78.51 | 4.37 / 0.71 | 9.43 / 8.07 | 37.3 M | PP-LCNetV2_large.yaml | 推理模型/训练模型 |
PP-LCNetV2_small | 73.97 | 2.53 / 0.41 | 5.14 / 1.98 | 14.6 M | PP-LCNetV2_small.yaml | 推理模型/训练模型 |
ResNet18_vd | 72.3 | 2.47 / 0.61 | 6.97 / 5.15 | 41.5 M | ResNet18_vd.yaml | 推理模型/训练模型 |
ResNet18 | 71.0 | 2.35 / 0.67 | 6.35 / 4.61 | 41.5 M | ResNet18.yaml | 推理模型/训练模型 |
ResNet34_vd | 76.0 | 4.01 / 1.03 | 11.99 / 9.86 | 77.3 M | ResNet34_vd.yaml | 推理模型/训练模型 |
ResNet34 | 74.6 | 3.99 / 1.02 | 12.42 / 9.81 | 77.3 M | ResNet34.yaml | 推理模型/训练模型 |
ResNet50_vd | 79.1 | 6.04 / 1.16 | 16.08 / 12.07 | 90.8 M | ResNet50_vd.yaml | 推理模型/训练模型 |
ResNet50 | 76.5 | 6.44 / 1.16 | 15.04 / 11.63 | 90.8 M | ResNet50.yaml | 推理模型/训练模型 |
ResNet101_vd | 80.2 | 11.16 / 2.07 | 32.14 / 32.14 | 158.4 M | ResNet101_vd.yaml | 推理模型/训练模型 |
ResNet101 | 77.6 | 10.91 / 2.06 | 31.14 / 22.93 | 158.7 M | ResNet101.yaml | 推理模型/训练模型 |
ResNet152_vd | 80.6 | 15.96 / 2.99 | 49.33 / 49.33 | 214.3 M | ResNet152_vd.yaml | 推理模型/训练模型 |
ResNet152 | 78.3 | 15.61 / 2.90 | 47.33 / 36.60 | 214.2 M | ResNet152.yaml | 推理模型/训练模型 |
ResNet200_vd | 80.9 | 24.20 / 3.69 | 62.62 / 62.62 | 266.0 M | ResNet200_vd.yaml | 推理模型/训练模型 |
StarNet-S1 | 73.6 | 6.33 / 1.98 | 7.56 / 3.26 | 11.2 M | StarNet-S1.yaml | 推理模型/训练模型 |
StarNet-S2 | 74.8 | 4.49 / 1.55 | 7.38 / 3.38 | 14.3 M | StarNet-S2.yaml | 推理模型/训练模型 |
StarNet-S3 | 77.0 | 6.70 / 1.62 | 11.05 / 4.76 | 22.2 M | StarNet-S3.yaml | 推理模型/训练模型 |
StarNet-S4 | 79.0 | 8.50 / 2.86 | 15.40 / 6.76 | 28.9 M | StarNet-S4.yaml | 推理模型/训练模型 |
SwinTransformer_base_patch4_window7_224 | 83.37 | 14.29 / 5.13 | 130.89 / 130.89 | 310.5 M | SwinTransformer_base_patch4_window7_224.yaml | 推理模型/训练模型 |
SwinTransformer_base_patch4_window12_384 | 84.17 | 37.74 / 10.10 | 362.56 / 362.56 | 311.4 M | SwinTransformer_base_patch4_window12_384.yaml | 推理模型/训练模型 |
SwinTransformer_large_patch4_window7_224 | 86.19 | 26.48 / 7.94 | 228.23 / 228.23 | 694.8 M | SwinTransformer_large_patch4_window7_224.yaml | 推理模型/训练模型 |
SwinTransformer_large_patch4_window12_384 | 87.06 | 74.72 / 18.16 | 652.04 / 652.04 | 696.1 M | SwinTransformer_large_patch4_window12_384.yaml | 推理模型/训练模型 |
SwinTransformer_small_patch4_window7_224 | 83.21 | 10.37 / 3.90 | 94.20 / 94.20 | 175.6 M | SwinTransformer_small_patch4_window7_224.yaml | 推理模型/训练模型 |
SwinTransformer_tiny_patch4_window7_224 | 81.10 | 6.66 / 2.15 | 60.45 / 60.45 | 100.1 M | SwinTransformer_tiny_patch4_window7_224.yaml | 推理模型/训练模型 |
注:以上精度指标为 ImageNet-1k 验证集 Top1 Acc。
图像多标签分类模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
CLIP_vit_base_patch16_448_ML | 89.15 | 54.75 / 14.30 | 280.23 / 280.23 | 325.6 M | CLIP_vit_base_patch16_448_ML.yaml | 推理模型/训练模型 |
PP-HGNetV2-B0_ML | 80.98 | 6.47 / 1.38 | 21.56 / 13.69 | 39.6 M | PP-HGNetV2-B0_ML.yaml | 推理模型/训练模型 |
PP-HGNetV2-B4_ML | 87.96 | 9.63 / 2.79 | 43.98 / 36.63 | 88.5 M | PP-HGNetV2-B4_ML.yaml | 推理模型/训练模型 |
PP-HGNetV2-B6_ML | 91.06 | 37.07 / 9.43 | 188.58 / 188.58 | 286.5 M | PP-HGNetV2-B6_ML.yaml | 推理模型/训练模型 |
PP-LCNet_x1_0_ML | 77.96 | 4.04 / 1.15 | 11.76 / 8.32 | 29.4 M | PP-LCNet_x1_0_ML.yaml | 推理模型/训练模型 |
ResNet50_ML | 83.42 | 12.12 / 3.27 | 51.79 / 44.36 | 108.9 M | ResNet50_ML.yaml | 推理模型/训练模型 |
注:以上精度指标为COCO2017的多标签分类任务mAP。
行人属性模块¶
模型名称 | mA(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_pedestrian_attribute | 92.2 | 2.35 / 0.49 | 3.17 / 1.25 | 6.7 M | PP-LCNet_x1_0_pedestrian_attribute.yaml | 推理模型/训练模型 |
注:以上精度指标为 PaddleX 内部自建数据集mA。
车辆属性模块¶
模型名称 | mA(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_vehicle_attribute | 91.7 | 2.32 / 2.32 | 3.22 / 1.26 | 6.7 M | PP-LCNet_x1_0_vehicle_attribute.yaml | 推理模型/训练模型 |
注:以上精度指标为 VeRi 数据集 mA。
图像特征模块¶
模型名称 | recall@1(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-ShiTuV2_rec | 84.2 | 3.48 / 0.55 | 8.04 / 4.04 | 16.3 M | PP-ShiTuV2_rec.yaml | 推理模型/训练模型 |
PP-ShiTuV2_rec_CLIP_vit_base | 88.69 | 12.94 / 2.88 | 58.36 / 58.36 | 306.6 M | PP-ShiTuV2_rec_CLIP_vit_base.yaml | 推理模型/训练模型 |
PP-ShiTuV2_rec_CLIP_vit_large | 91.03 | 51.65 / 11.18 | 255.78 / 255.78 | 1.05 G | PP-ShiTuV2_rec_CLIP_vit_large.yaml | 推理模型/训练模型 |
注:以上精度指标为 AliProducts recall@1。
人脸特征模块¶
模型名称 | 输出特征维度 | Acc (%) AgeDB-30/CFP-FP/LFW |
GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 (M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|
MobileFaceNet | 128 | 96.28/96.71/99.58 | 3.16 / 0.48 | 6.49 / 6.49 | 4.1 | MobileFaceNet.yaml | 推理模型/训练模型 |
ResNet50_face | 512 | 98.12/98.56/99.77 | 5.68 / 1.09 | 14.96 / 11.90 | 87.2 | ResNet50_face.yaml | 推理模型/训练模型 |
注:以上精度指标是分别在AgeDB-30、CFP-FP和LFW数据集上测得的Accuracy。
主体检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-ShiTuV2_det | 41.5 | 12.79 / 4.51 | 44.14 / 44.14 | 27.54 | PP-ShiTuV2_det.yaml | 推理模型/训练模型 |
注:以上精度指标为 PaddleClas主体检测数据集 mAP(0.5:0.95)。
目标检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
Cascade-FasterRCNN-ResNet50-FPN | 41.1 | 135.92 / 135.92 | - | 245.4 M | Cascade-FasterRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN | 45.0 | 138.23 / 138.23 | - | 246.2 M | Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN.yaml | 推理模型/训练模型 |
CenterNet-DLA-34 | 37.6 | - | - | 75.4 M | CenterNet-DLA-34.yaml | 推理模型/训练模型 |
CenterNet-ResNet50 | 38.9 | - | - | 319.7 M | CenterNet-ResNet50.yaml | 推理模型/训练模型 |
DETR-R50 | 42.3 | 62.91 / 17.33 | 392.63 / 392.63 | 159.3 M | DETR-R50.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet34-FPN | 37.8 | 83.33 / 31.64 | - | 137.5 M | FasterRCNN-ResNet34-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50-FPN | 38.4 | 107.08 / 35.40 | - | 148.1 M | FasterRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50-vd-FPN | 39.5 | 109.36 / 36.00 | - | 148.1 M | FasterRCNN-ResNet50-vd-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50-vd-SSLDv2-FPN | 41.4 | 109.06 / 36.19 | - | 148.1 M | FasterRCNN-ResNet50-vd-SSLDv2-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet50 | 36.7 | 496.33 / 109.12 | - | 120.2 M | FasterRCNN-ResNet50.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet101-FPN | 41.4 | 148.21 / 42.21 | - | 216.3 M | FasterRCNN-ResNet101-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-ResNet101 | 39.0 | 538.58 / 120.88 | - | 188.1 M | FasterRCNN-ResNet101.yaml | 推理模型/训练模型 |
FasterRCNN-ResNeXt101-vd-FPN | 43.4 | 258.01 / 58.25 | - | 360.6 M | FasterRCNN-ResNeXt101-vd-FPN.yaml | 推理模型/训练模型 |
FasterRCNN-Swin-Tiny-FPN | 42.6 | - | - | 159.8 M | FasterRCNN-Swin-Tiny-FPN.yaml | 推理模型/训练模型 |
FCOS-ResNet50 | 39.6 | 106.13 / 28.32 | 721.79 / 721.79 | 124.2 M | FCOS-ResNet50.yaml | 推理模型/训练模型 |
PicoDet-L | 42.6 | 14.68 / 5.81 | 47.32 / 47.32 | 20.9 M | PicoDet-L.yaml | 推理模型/训练模型 |
PicoDet-M | 37.5 | 9.62 / 3.23 | 23.75 / 14.88 | 16.8 M | PicoDet-M.yaml | 推理模型/训练模型 |
PicoDet-S | 29.1 | 7.98 / 2.33 | 14.82 / 5.60 | 4.4 M | PicoDet-S.yaml | 推理模型/训练模型 |
PicoDet-XS | 26.2 | 9.66 / 2.75 | 19.15 / 7.24 | 5.7M | PicoDet-XS.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-L | 52.9 | 33.55 / 10.46 | 189.05 / 189.05 | 185.3 M | PP-YOLOE_plus-L.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-M | 49.8 | 19.52 / 7.46 | 113.36 / 113.36 | 83.2 M | PP-YOLOE_plus-M.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-S | 43.7 | 12.16 / 4.58 | 73.86 / 52.90 | 28.3 M | PP-YOLOE_plus-S.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-X | 54.7 | 58.87 / 15.84 | 292.93 / 292.93 | 349.4 M | PP-YOLOE_plus-X.yaml | 推理模型/训练模型 |
RT-DETR-H | 56.3 | 115.92 / 28.16 | 971.32 / 971.32 | 435.8 M | RT-DETR-H.yaml | 推理模型/训练模型 |
RT-DETR-L | 53.0 | 35.00 / 10.45 | 495.51 / 495.51 | 113.7 M | RT-DETR-L.yaml | 推理模型/训练模型 |
RT-DETR-R18 | 46.5 | 20.21 / 6.23 | 266.01 / 266.01 | 70.7 M | RT-DETR-R18.yaml | 推理模型/训练模型 |
RT-DETR-R50 | 53.1 | 42.14 / 11.31 | 523.97 / 523.97 | 149.1 M | RT-DETR-R50.yaml | 推理模型/训练模型 |
RT-DETR-X | 54.8 | 61.24 / 15.83 | 647.08 / 647.08 | 232.9 M | RT-DETR-X.yaml | 推理模型/训练模型 |
YOLOv3-DarkNet53 | 39.1 | 41.58 / 10.10 | 158.78 / 158.78 | 219.7 M | YOLOv3-DarkNet53.yaml | 推理模型/训练模型 |
YOLOv3-MobileNetV3 | 31.4 | 16.53 / 5.70 | 60.44 / 60.44 | 83.8 M | YOLOv3-MobileNetV3.yaml | 推理模型/训练模型 |
YOLOv3-ResNet50_vd_DCN | 40.6 | 32.91 / 10.07 | 225.72 / 224.32 | 163.0 M | YOLOv3-ResNet50_vd_DCN.yaml | 推理模型/训练模型 |
YOLOX-L | 50.1 | 121.19 / 13.55 | 295.38 / 274.15 | 192.5 M | YOLOX-L.yaml | 推理模型/训练模型 |
YOLOX-M | 46.9 | 87.19 / 10.09 | 183.95 / 172.67 | 90.0 M | YOLOX-M.yaml | 推理模型/训练模型 |
YOLOX-N | 26.1 | 53.31 / 45.02 | 69.69 / 59.18 | 3.4M | YOLOX-N.yaml | 推理模型/训练模型 |
YOLOX-S | 40.4 | 129.52 / 13.19 | 181.39 / 179.01 | 32.0 M | YOLOX-S.yaml | 推理模型/训练模型 |
YOLOX-T | 32.9 | 66.81 / 61.31 | 92.30 / 83.90 | 18.1 M | YOLOX-T.yaml | 推理模型/训练模型 |
YOLOX-X | 51.8 | 156.40 / 20.17 | 480.14 / 454.35 | 351.5 M | YOLOX-X.yaml | 推理模型/训练模型 |
注:以上精度指标为 COCO2017 验证集 mAP(0.5:0.95)。
小目标检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE_plus_SOD-S | 25.1 | 135.68 / 122.94 | 188.09 / 107.74 | 77.3 M | PP-YOLOE_plus_SOD-S.yaml | 推理模型/训练模型 |
PP-YOLOE_plus_SOD-L | 31.9 | 114.24 / 93.98 | 285.39 / 285.39 | 325.0 M | PP-YOLOE_plus_SOD-L.yaml | 推理模型/训练模型 |
PP-YOLOE_plus_SOD-largesize-L | 42.7 | 639.57 / 332.79 | 2807.12 / 2807.12 | 340.5 M | PP-YOLOE_plus_SOD-largesize-L.yaml | 推理模型/训练模型 |
注:以上精度指标为 VisDrone-DET 验证集 mAP(0.5:0.95)。
开放词汇目标检测¶
模型 | mAP(0.5:0.95) | mAP(0.5) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | 模型下载链接 |
---|---|---|---|---|---|---|
GroundingDINO-T | 49.4 | 64.4 | 253.72 | 1807.4 | 658.3 | 推理模型 |
注:以上精度指标为 COCO val2017 验证集 mAP(0.5:0.95)。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
开放词汇分割¶
模型 | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | 模型下载链接 |
---|---|---|---|---|
SAM-H_box | 144.9 | 33920.7 | 2433.7 | 推理模型 |
SAM-H_point | 144.9 | 33920.7 | 2433.7 | 推理模型 |
注:所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
旋转目标检测¶
模型 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 (M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE-R-L | 78.14 | 20.7039 | 157.942 | 211.0 M | PP-YOLOE-R.yaml | 推理模型/训练模型 |
注:以上精度指标为DOTA验证集 mAP(0.5:0.95)。所有模型 GPU 推理耗时基于 NVIDIA TRX2080 Ti 机器,精度类型为 F16, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
行人检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE-L_human | 48.0 | 33.27 / 9.19 | 173.72 / 173.72 | 196.1 M | PP-YOLOE-L_human.yaml | 推理模型/训练模型 |
PP-YOLOE-S_human | 42.5 | 9.94 / 3.42 | 54.48 / 46.52 | 28.8 M | PP-YOLOE-S_human.yaml | 推理模型/训练模型 |
注:以上精度指标为 CrowdHuman 验证集 mAP(0.5:0.95)。
车辆检测模块¶
模型名称 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-YOLOE-L_vehicle | 63.9 | 32.84 / 9.03 | 176.60 / 176.60 | 196.1 M | PP-YOLOE-L_vehicle.yaml | 推理模型/训练模型 |
PP-YOLOE-S_vehicle | 61.3 | 9.79 / 3.48 | 54.14 / 46.69 | 28.8 M | PP-YOLOE-S_vehicle.yaml | 推理模型/训练模型 |
注:以上精度指标为 PPVehicle 验证集 mAP(0.5:0.95)。
人脸检测模块¶
模型名称 | AP (%) Easy/Medium/Hard |
GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
BlazeFace | 77.7/73.4/49.5 | 60.34 / 54.76 | 84.18 / 84.18 | 0.447 M | BlazeFace.yaml | 推理模型/训练模型 |
BlazeFace-FPN-SSH | 83.2/80.5/60.5 | 69.29 / 63.42 | 86.96 / 86.96 | 0.606 M | BlazeFace-FPN-SSH.yaml | 推理模型/训练模型 |
PicoDet_LCNet_x2_5_face | 93.7/90.7/68.1 | 35.37 / 12.88 | 126.24 / 126.24 | 28.9 M | PicoDet_LCNet_x2_5_face.yaml | 推理模型/训练模型 |
PP-YOLOE_plus-S_face | 93.9/91.8/79.8 | 22.54 / 8.33 | 138.67 / 138.67 | 26.5 M | PP-YOLOE_plus-S_face | 推理模型/训练模型 |
注:以上精度指标是在WIDER-FACE验证集上,以640*640作为输入尺寸评估得到的。
异常检测模块¶
模型名称 | mIoU | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
STFPM | 0.9901 | 2.97 / 1.57 | 38.86 / 13.24 | 22.5 M | STFPM.yaml | 推理模型/训练模型 |
注:以上精度指标为 MVTec AD 验证集 平均异常分数。
人体关键点检测模块¶
模型 | 方案 | 输入尺寸 | AP(0.5:0.95) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|---|---|
PP-TinyPose_128x96 | Top-Down | 128*96 | 58.4 | 4.9 | PP-TinyPose_128x96.yaml | 推理模型/训练模型 | ||
PP-TinyPose_256x192 | Top-Down | 256*192 | 68.3 | 4.9 | PP-TinyPose_256x192.yaml | 推理模型/训练模型 |
注:以上精度指标为COCO数据集 AP(0.5:0.95),所依赖的检测框为ground truth标注得到。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
3D多模态融合检测模块¶
模型 | mAP(%) | NDS | yaml文件 | 模型下载链接 |
---|---|---|---|---|
BEVFusion | 53.9 | 60.9 | BEVFusion.yaml | 推理模型/训练模型 |
注:以上精度指标为nuscenes验证集 mAP(0.5:0.95), NDS 60.9, 精度类型为 FP32。
语义分割模块¶
模型名称 | mloU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
Deeplabv3_Plus-R50 | 80.36 | 503.51 / 122.30 | 3543.91 / 3543.91 | 94.9 M | Deeplabv3_Plus-R50.yaml | 推理模型/训练模型 |
Deeplabv3_Plus-R101 | 81.10 | 803.79 / 175.45 | 5136.21 / 5136.21 | 162.5 M | Deeplabv3_Plus-R101.yaml | 推理模型/训练模型 |
Deeplabv3-R50 | 79.90 | 647.56 / 121.67 | 3803.09 / 3803.09 | 138.3 M | Deeplabv3-R50.yaml | 推理模型/训练模型 |
Deeplabv3-R101 | 80.85 | 950.43 / 178.50 | 5517.14 / 5517.14 | 205.9 M | Deeplabv3-R101.yaml | 推理模型/训练模型 |
OCRNet_HRNet-W18 | 80.67 | 286.12 / 80.76 | 1794.03 / 1794.03 | 43.1 M | OCRNet_HRNet-W18.yaml | 推理模型/训练模型 |
OCRNet_HRNet-W48 | 82.15 | 627.36 / 170.76 | 3531.61 / 3531.61 | 249.8 M | OCRNet_HRNet-W48.yaml | 推理模型/训练模型 |
PP-LiteSeg-T | 73.10 | 30.16 / 14.03 | 420.07 / 235.01 | 28.5 M | PP-LiteSeg-T.yaml | 推理模型/训练模型 |
PP-LiteSeg-B | 75.25 | 40.92 / 20.18 | 494.32 / 310.34 | 47.0 M | PP-LiteSeg-B.yaml | 推理模型/训练模型 |
SegFormer-B0 (slice) | 76.73 | 11.1946 | 268.929 | 13.2 M | SegFormer-B0.yaml | 推理模型/训练模型 |
SegFormer-B1 (slice) | 78.35 | 17.9998 | 403.393 | 48.5 M | SegFormer-B1.yaml | 推理模型/训练模型 |
SegFormer-B2 (slice) | 81.60 | 48.0371 | 1248.52 | 96.9 M | SegFormer-B2.yaml | 推理模型/训练模型 |
SegFormer-B3 (slice) | 82.47 | 64.341 | 1666.35 | 167.3 M | SegFormer-B3.yaml | 推理模型/训练模型 |
SegFormer-B4 (slice) | 82.38 | 82.4336 | 1995.42 | 226.7 M | SegFormer-B4.yaml | 推理模型/训练模型 |
SegFormer-B5 (slice) | 82.58 | 97.3717 | 2420.19 | 229.7 M | SegFormer-B5.yaml | 推理模型/训练模型 |
注:以上精度指标为 Cityscapes 数据集 mloU。
模型名称 | mloU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
SeaFormer_base(slice) | 40.92 | 24.4073 | 397.574 | 30.8 M | SeaFormer_base.yaml | 推理模型/训练模型 |
SeaFormer_large (slice) | 43.66 | 27.8123 | 550.464 | 49.8 M | SeaFormer_large.yaml | 推理模型/训练模型 |
SeaFormer_small (slice) | 38.73 | 19.2295 | 358.343 | 14.3 M | SeaFormer_small.yaml | 推理模型/训练模型 |
SeaFormer_tiny (slice) | 34.58 | 13.9496 | 330.132 | 6.1M | SeaFormer_tiny.yaml | 推理模型/训练模型 |
注:以上精度指标为 ADE20k 数据集, slice 表示对输入图像进行了切图操作。
实例分割模块¶
模型名称 | Mask AP | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
Mask-RT-DETR-H | 50.6 | 172.36 / 172.36 | 1615.75 / 1615.75 | 449.9 M | Mask-RT-DETR-H.yaml | 推理模型/训练模型 |
Mask-RT-DETR-L | 45.7 | 88.18 / 88.18 | 1090.84 / 1090.84 | 113.6 M | Mask-RT-DETR-L.yaml | 推理模型/训练模型 |
Mask-RT-DETR-M | 42.7 | 78.69 / 78.69 | - | 66.6 M | Mask-RT-DETR-M.yaml | 推理模型/训练模型 |
Mask-RT-DETR-S | 41.0 | 33.5007 | - | 51.8 M | Mask-RT-DETR-S.yaml | 推理模型/训练模型 |
Mask-RT-DETR-X | 47.5 | 114.16 / 114.16 | 1240.92 / 1240.92 | 237.5 M | Mask-RT-DETR-X.yaml | 推理模型/训练模型 |
Cascade-MaskRCNN-ResNet50-FPN | 36.3 | 141.69 / 141.69 | - | 254.8 M | Cascade-MaskRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN | 39.1 | 147.62 / 147.62 | - | 254.7 M | Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet50-FPN | 35.6 | 118.30 / 118.30 | - | 157.5 M | MaskRCNN-ResNet50-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet50-vd-FPN | 36.4 | 118.34 / 118.34 | - | 157.5 M | MaskRCNN-ResNet50-vd-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet50 | 32.8 | 228.83 / 228.83 | - | 127.8 M | MaskRCNN-ResNet50.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet101-FPN | 36.6 | 148.14 / 148.14 | - | 225.4 M | MaskRCNN-ResNet101-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNet101-vd-FPN | 38.1 | 151.12 / 151.12 | - | 225.1 M | MaskRCNN-ResNet101-vd-FPN.yaml | 推理模型/训练模型 |
MaskRCNN-ResNeXt101-vd-FPN | 39.5 | 237.55 / 237.55 | - | 370.0 M | MaskRCNN-ResNeXt101-vd-FPN.yaml | 推理模型/训练模型 |
PP-YOLOE_seg-S | 32.5 | - | - | 31.5 M | PP-YOLOE_seg-S.yaml | 推理模型/训练模型 |
SOLOv2 | 35.5 | - | - | 179.1 M | SOLOv2.yaml | 推理模型/训练模型 |
注:以上精度指标为 COCO2017 验证集 Mask AP(0.5:0.95)。
文本检测模块¶
模型 | 检测Hmean(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv4_server_det | 82.56 | 83.34 / 80.91 | 442.58 / 442.58 | 109 | PP-OCRv4_server_det.yaml | 推理模型/训练模型 |
PP-OCRv4_mobile_det | 77.35 | 8.79 / 3.13 | 51.00 / 28.58 | 4.7 | PP-OCRv4_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv3_mobile_det | 78.68 | 8.44 / 2.91 | 27.87 / 27.87 | 2.1 | PP-OCRv3_mobile_det.yaml | 推理模型/训练模型 |
PP-OCRv3_server_det | 80.11 | 65.41 / 13.67 | 305.07 / 305.07 | 102.1 | PP-OCRv3_server_det.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的中英文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 593 张图片。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
印章文本检测模块¶
模型名称 | 检测Hmean(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv4_mobile_seal_det | 96.47 | 7.82 / 3.09 | 48.28 / 23.97 | 4.7M | PP-OCRv4_mobile_seal_det.yaml | 推理模型/训练模型 |
PP-OCRv4_server_seal_det | 98.21 | 74.75 / 67.72 | 382.55 / 382.55 | 108.3 M | PP-OCRv4_server_seal_det.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleX 自建的印章数据集,包含500印章图像。
文本识别模块¶
- 中文识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-OCRv4_server_rec_doc | 81.53 | 6.65 / 2.38 | 32.92 / 32.92 | 74.7 M | PP-OCRv4_server_rec_doc.yaml | 推理模型/训练模型 |
PP-OCRv4_mobile_rec | 78.74 | 4.82 / 1.20 | 16.74 / 4.64 | 10.6 M | PP-OCRv4_mobile_rec.yaml | 推理模型/训练模型 |
PP-OCRv4_server_rec | 80.61 | 6.58 / 2.43 | 33.17 / 33.17 | 71.2 M | PP-OCRv4_server_rec.yaml | 推理模型/训练模型 |
PP-OCRv3_mobile_rec | 72.96 | 5.87 / 1.19 | 9.07 / 4.28 | 9.2 M | PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 8367 张图片。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
ch_SVTRv2_rec | 68.81 | 8.08 / 2.74 | 50.17 / 42.50 | 73.9 M | ch_SVTRv2_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。 所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
ch_RepSVTR_rec | 65.07 | 5.93 / 1.62 | 20.73 / 7.32 | 22.1 M | ch_RepSVTR_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。 所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
- 英文识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
en_PP-OCRv4_mobile_rec | 70.39 | 4.81 / 0.75 | 16.10 / 5.31 | 6.8 M | en_PP-OCRv4_mobile_rec.yaml | 推理模型/训练模型 |
en_PP-OCRv3_mobile_rec | 70.69 | 5.44 / 0.75 | 8.65 / 5.57 | 7.8 M | en_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleX 自建的英文数据集。 所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
- 多语言识别模型
模型 | 识别 Avg Accuracy(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
korean_PP-OCRv3_mobile_rec | 60.21 | 5.40 / 0.97 | 9.11 / 4.05 | 8.6 M | korean_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
japan_PP-OCRv3_mobile_rec | 45.69 | 5.70 / 1.02 | 8.48 / 4.07 | 8.8 M | japan_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
chinese_cht_PP-OCRv3_mobile_rec | 82.06 | 5.90 / 1.28 | 9.28 / 4.34 | 9.7 M | chinese_cht_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
te_PP-OCRv3_mobile_rec | 95.88 | 5.42 / 0.82 | 8.10 / 6.91 | 7.8 M | te_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
ka_PP-OCRv3_mobile_rec | 96.96 | 5.25 / 0.79 | 9.09 / 3.86 | 8.0 M | ka_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
ta_PP-OCRv3_mobile_rec | 76.83 | 5.23 / 0.75 | 10.13 / 4.30 | 8.0 M | ta_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
latin_PP-OCRv3_mobile_rec | 76.93 | 5.20 / 0.79 | 8.83 / 7.15 | 7.8 M | latin_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
arabic_PP-OCRv3_mobile_rec | 73.55 | 5.35 / 0.79 | 8.80 / 4.56 | 7.8 M | arabic_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
cyrillic_PP-OCRv3_mobile_rec | 94.28 | 5.23 / 0.76 | 8.89 / 3.88 | 7.9 M | cyrillic_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
devanagari_PP-OCRv3_mobile_rec | 96.44 | 5.22 / 0.79 | 8.56 / 4.06 | 7.9 M | devanagari_PP-OCRv3_mobile_rec.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleX 自建的多语种数据集。 所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
公式识别模块¶
模型 | Avg-BLEU(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 (M) | yaml 文件 | 模型下载链接 | UniMERNet | 86.13 | 2266.96/- | -/- | 1.4 G | UniMERNet.yaml | 推理模型/训练模型 |
---|---|---|---|---|---|---|
PP-FormulaNet-S | 87.12 | 202.25/- | -/- | 167.9 M | PP-FormulaNet-S.yaml | 推理模型/训练模型 | PP-FormulaNet-L | 92.13 | 1976.52/- | -/- | 535.2 M | PP-FormulaNet-L.yaml | 推理模型/训练模型 |
LaTeX_OCR_rec | 71.63 | -/- | -/- | 89.7 M | LaTeX_OCR_rec.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建公式识别测试集。LaTeX_OCR_rec在LaTeX-OCR公式识别测试集的BLEU score为 0.8821。所有模型 GPU 推理耗时基于 Tesla V100 GPUs 机器,精度类型为 FP32。
表格结构识别模块¶
模型 | 精度(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 (M) | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
SLANet | 59.52 | 103.08 / 103.08 | 197.99 / 197.99 | 6.9 M | SLANet.yaml | 推理模型/训练模型 |
SLANet_plus | 63.69 | 140.29 / 140.29 | 195.39 / 195.39 | 6.9 M | SLANet_plus.yaml | 推理模型/训练模型 |
SLANeXt_wired | 69.65 | -- | -- | -- | SLANeXt_wired.yaml | 推理模型/训练模型 |
SLANeXt_wireless | SLANeXt_wireless.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建高难度中文表格识别数据集。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
表格单元格检测模块¶
模型 | 模型下载链接 | mAP(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 (M) | 介绍 |
---|---|---|---|---|---|---|
RT-DETR-L_wired_table_cell_det | 推理模型/训练模型 | 82.7 | 35.00 / 10.45 | 495.51 / 495.51 | 124M | RT-DETR 是第一个实时的端到端目标检测模型。百度飞桨视觉团队基于 RT-DETR-L 作为基础模型,在自建表格单元格检测数据集上完成预训练,实现了对有线表格、无线表格均有较好性能的表格单元格检测。 |
RT-DETR-L_wireless_table_cell_det | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建表格单元格检测数据集。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
表格分类模块¶
模型 | Top1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 (M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_table_cls | -- | -- | -- | -- | PP-LCNet_x1_0_table_cls.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX 内部自建表格分类数据集。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
文本图像矫正模块¶
模型名称 | MS-SSIM (%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
UVDoc | 54.40 | 16.27 / 7.76 | 176.97 / 80.60 | 30.3 M | UVDoc.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PaddleX自建的图像矫正数据集。
版面区域检测模块¶
- 表格版面检测模型
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet_layout_1x_table | 97.5 | 8.02 / 3.09 | 23.70 / 20.41 | 7.4 M | PicoDet_layout_1x_table.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的版面表格区域检测数据集,包含中英文 7835 张带有表格的论文文档类型图片。GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为 8,精度类型为 FP32。
- 3类版面检测模型,包含表格、图像、印章
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet-S_layout_3cls | 88.2 | 8.99 / 2.22 | 16.11 / 8.73 | 4.8 | PicoDet-S_layout_3cls.yaml | 推理模型/训练模型 |
PicoDet-L_layout_3cls | 89.0 | 13.05 / 4.50 | 41.30 / 41.30 | 22.6 | PicoDet-L_layout_3cls.yaml | 推理模型/训练模型 |
RT-DETR-H_layout_3cls | 95.8 | 114.93 / 27.71 | 947.56 / 947.56 | 470.1 | RT-DETR-H_layout_3cls.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 1154 张文档类型图片。GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为 8,精度类型为 FP32。
- 5类英文文档区域检测模型,包含文字、标题、表格、图片以及列表
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet_layout_1x | 97.8 | 9.03 / 3.10 | 25.82 / 20.70 | 7.4 | PicoDet_layout_1x.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PubLayNet 的评估数据集,包含英文文档的 11245 张文图片。GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为 8,精度类型为 FP32。
- 17类区域检测模型,包含17个版面常见类别,分别是:段落标题、图片、文本、数字、摘要、内容、图表标题、公式、表格、表格标题、参考文献、文档标题、脚注、页眉、算法、页脚、印章
模型 | mAP(0.5)(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PicoDet-S_layout_17cls | 87.4 | 9.11 / 2.12 | 15.42 / 9.12 | 4.8 | PicoDet-S_layout_17cls.yaml | 推理模型/训练模型 |
PicoDet-L_layout_17cls | 89.0 | 13.50 / 4.69 | 43.32 / 43.32 | 22.6 | PicoDet-L_layout_17cls.yaml | 推理模型/训练模型 |
RT-DETR-H_layout_17cls | 98.3 | 115.29 / 104.09 | 995.27 / 995.27 | 470.2 | RT-DETR-H_layout_17cls.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 892 张文档类型图片。GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为 8,精度类型为 FP32。
文档图像方向分类模块¶
模型 | Top-1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_doc_ori | 99.06 | 2.31 / 0.43 | 3.37 / 1.27 | 7 | PP-LCNet_x1_0_doc_ori.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为 8,精度类型为 FP32。
文本行方向分类模块¶
模型 | Top-1 Acc(%) | GPU推理耗时(ms) [常规模式 / 高性能模式] |
CPU推理耗时(ms) [常规模式 / 高性能模式] |
模型存储大小(M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|---|
PP-LCNet_x1_0_doc_ori | 99.06 | 2.31 / 0.43 | 3.37 / 1.27 | 7 | PP-LCNet_x0_25_textline_ori.yaml | 推理模型/训练模型 |
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为 8,精度类型为 FP32。
时序预测模块¶
模型名称 | mse | mae | 模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|
DLinear | 0.382 | 0.394 | 72 K | DLinear.yaml | 推理模型/训练模型 |
NLinear | 0.386 | 0.392 | 40 K | NLinear.yaml | 推理模型/训练模型 |
Nonstationary | 0.600 | 0.515 | 55.5 M | Nonstationary.yaml | 推理模型/训练模型 |
PatchTST | 0.379 | 0.391 | 2.0 M | PatchTST.yaml | 推理模型/训练模型 |
RLinear | 0.385 | 0.392 | 40 K | RLinear.yaml | 推理模型/训练模型 |
TiDE | 0.407 | 0.414 | 31.7 M | TiDE.yaml | 推理模型/训练模型 |
TimesNet | 0.416 | 0.429 | 4.9 M | TimesNet.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 ETTH1 数据集 (在测试集test.csv上的评测结果)。
时序异常检测模块¶
模型名称 | precison | recall | f1_score | 模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|---|---|
AutoEncoder_ad | 99.36 | 84.36 | 91.25 | 52 K | AutoEncoder_ad.yaml | 推理模型/训练模型 |
DLinear_ad | 98.98 | 93.96 | 96.41 | 112 K | DLinear_ad.yaml | 推理模型/训练模型 |
Nonstationary_ad | 98.55 | 88.95 | 93.51 | 1.8 M | Nonstationary_ad.yaml | 推理模型/训练模型 |
PatchTST_ad | 98.78 | 90.70 | 94.57 | 320 K | PatchTST_ad.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 PSM 数据集。
时序分类模块¶
模型名称 | acc(%) | 模型存储大小 | yaml 文件 | 模型下载链接 |
---|---|---|---|---|
TimesNet_cls | 87.5 | 792 K | TimesNet_cls.yaml | 推理模型/训练模型 |
注:以上精度指标测量自 UWaveGestureLibrary数据集。
>注:以上所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。
多语种语音识别模块¶
模型 | 训练数据 | 模型大小 | 词错率 | yaml文件 | 模型下载链接 |
---|---|---|---|---|---|
whisper_large | 680kh | 5.8G | 2.7 (Librispeech) | whisper_large.yaml | 推理模型 |
whisper_medium | 680kh | 2.9G | - | whisper_medium.yaml | 推理模型 |
whisper_small | 680kh | 923M | - | whisper_small.yaml | 推理模型 |
whisper_base | 680kh | 277M | - | whisper_base.yaml | 推理模型 |
whisper_small | 680kh | 145M | - | whisper_small.yaml | 推理模型 |
视频分类模块¶
模型 | Top1 Acc(%) | 模型存储大小 (M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
PP-TSM-R50_8frames_uniform | 74.36 | 93.4 M | PP-TSM-R50_8frames_uniform.yaml | 推理模型/训练模型 |
PP-TSMv2-LCNetV2_8frames_uniform | 71.71 | 22.5 M | PP-TSMv2-LCNetV2_8frames_uniform.yaml | 推理模型/训练模型 |
PP-TSMv2-LCNetV2_16frames_uniform | 73.11 | 22.5 M | PP-TSMv2-LCNetV2_16frames_uniform.yaml | 推理模型/训练模型 |
注:以上精度指标为 K400 验证集 Top1 Acc。
视频检测模块¶
模型 | Frame-mAP(@ IoU 0.5) | 模型存储大小 (M) | yaml文件 | 模型下载链接 |
---|---|---|---|---|
YOWO | 80.94 | 462.891M | YOWO.yaml | 推理模型/训练模型 |
注:以上精度指标为 UCF101-24 test数据集上的测试指标Frame-mAP (@ IoU 0.5)。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz,线程数为8,精度类型为 FP32。