PP-Structure 系列模型列表
1. 版面分析模型
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
dict path |
picodet_lcnet_x1_0_fgd_layout |
基于PicoDet LCNet_x1_0和FGD蒸馏在PubLayNet 数据集训练的英文版面分析模型,可以划分文字、标题、表格、图片以及列表5类区域 |
9.7M |
推理模型 / 训练模型 |
PubLayNet dict |
ppyolov2_r50vd_dcn_365e_publaynet |
基于PP-YOLOv2在PubLayNet数据集上训练的英文版面分析模型 |
221.0M |
推理模型 / 训练模型 |
同上 |
picodet_lcnet_x1_0_fgd_layout_cdla |
CDLA数据集训练的中文版面分析模型,可以划分为表格、图片、图片标题、表格、表格标题、页眉、脚本、引用、公式10类区域 |
9.7M |
推理模型 / 训练模型 |
CDLA dict |
picodet_lcnet_x1_0_fgd_layout_table |
表格数据集训练的版面分析模型,支持中英文文档表格区域的检测 |
9.7M |
推理模型 / 训练模型 |
Table dict |
ppyolov2_r50vd_dcn_365e_tableBank_word |
基于PP-YOLOv2在TableBank Word 数据集训练的版面分析模型,支持英文文档表格区域的检测 |
221.0M |
推理模型 |
同上 |
ppyolov2_r50vd_dcn_365e_tableBank_latex |
基于PP-YOLOv2在TableBank Latex数据集训练的版面分析模型,支持英文文档表格区域的检测 |
221.0M |
推理模型 |
同上 |
2. OCR和表格识别模型
2.1 OCR
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
en_ppocr_mobile_v2.0_table_det |
PubTabNet数据集训练的英文表格场景的文字检测 |
4.7M |
推理模型 / 训练模型 |
en_ppocr_mobile_v2.0_table_rec |
PubTabNet数据集训练的英文表格场景的文字识别 |
6.9M |
推理模型 / 训练模型 |
如需要使用其他OCR模型,可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir
, rec_model_dir
两个字段即可。
2.2 表格识别模型
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
en_ppocr_mobile_v2.0_table_structure |
基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型 |
6.8M |
推理模型 / 训练模型 |
en_ppstructure_mobile_v2.0_SLANet |
基于SLANet在PubTabNet数据集上训练的英文表格识别模型 |
9.2M |
推理模型 / 训练模型 |
ch_ppstructure_mobile_v2.0_SLANet |
基于SLANet的中文表格识别模型 |
9.3M |
推理模型 / 训练模型 |
3. KIE模型
在XFUND_zh数据集上,不同模型的精度与V100 GPU上速度信息如下所示。
模型名称 |
模型简介 |
推理模型大小 |
精度(hmean) |
预测耗时(ms) |
下载地址 |
ser_VI-LayoutXLM_xfund_zh |
基于VI-LayoutXLM在xfund中文数据集上训练的SER模型 |
1.1G |
93.19% |
15.49 |
推理模型 / 训练模型 |
re_VI-LayoutXLM_xfund_zh |
基于VI-LayoutXLM在xfund中文数据集上训练的RE模型 |
1.1G |
83.92% |
15.49 |
推理模型 / 训练模型 |
ser_LayoutXLM_xfund_zh |
基于LayoutXLM在xfund中文数据集上训练的SER模型 |
1.4G |
90.38% |
19.49 |
推理模型 / 训练模型 |
re_LayoutXLM_xfund_zh |
基于LayoutXLM在xfund中文数据集上训练的RE模型 |
1.4G |
74.83% |
19.49 |
推理模型 / 训练模型 |
ser_LayoutLMv2_xfund_zh |
基于LayoutLMv2在xfund中文数据集上训练的SER模型 |
778.0M |
85.44% |
31.46 |
推理模型 / 训练模型 |
re_LayoutLMv2_xfund_zh |
基于LayoutLMv2在xfun中文数据集上训练的RE模型 |
765.0M |
67.77% |
31.46 |
推理模型 coming soon / 训练模型 |
ser_LayoutLM_xfund_zh |
基于LayoutLM在xfund中文数据集上训练的SER模型 |
430.0M |
77.31% |
- |
推理模型 / 训练模型 |
- 注:上述预测耗时信息仅包含了inference模型的推理耗时,没有统计预处理与后处理耗时,测试环境为
V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4
。
在wildreceipt数据集上,SDMGR模型精度与下载地址如下所示。