Rosetta¶
1. 算法简介¶
论文信息:
Rosetta: Large Scale System for Text Detection and Recognition in Images Borisyuk F , Gordo A , V Sivakumar KDD, 2018
使用MJSynth和SynthText两个文字识别数据集训练,在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估, 算法复现效果如下:
模型 | 骨干网络 | 配置文件 | Avg Accuracy | 下载链接 |
---|---|---|---|---|
Rosetta | Resnet34_vd | configs/rec/rec_r34_vd_none_none_ctc.yml | 79.11% | 训练模型 |
Rosetta | MobileNetV3 | configs/rec/rec_mv3_none_none_ctc.yml | 75.80% | 训练模型 |
2. 环境配置¶
请先参考《运行环境准备》配置PaddleOCR运行环境,参考《项目克隆》克隆项目代码。
3. 模型训练、评估、预测¶
请参考文本识别训练教程。PaddleOCR对代码进行了模块化,训练不同的识别模型只需要更换配置文件即可。 以基于Resnet34_vd骨干网络为例:
3.1 训练¶
3.2 评估¶
3.3 预测¶
4. 推理部署¶
4.1 Python推理¶
首先将Rosetta文本识别训练过程中保存的模型,转换成inference model。以基于Resnet34_vd骨干网络,在MJSynth和SynthText两个文字识别数据集训练得到的模型为例( 模型下载地址 ),可以使用如下命令进行转换:
Rosetta文本识别模型推理,可以执行如下命令:
推理结果如下所示:
4.2 C++推理¶
暂不支持
4.3 Serving服务化部署¶
暂不支持
4.4 更多推理部署¶
Rosetta模型还支持以下推理部署方式:
- Paddle2ONNX推理:准备好推理模型后,参考paddle2onnx教程操作。
5. FAQ¶
引用¶
@inproceedings{2018Rosetta,
title={Rosetta: Large Scale System for Text Detection and Recognition in Images},
author={ Borisyuk, Fedor and Gordo, Albert and Sivakumar, Viswanath },
booktitle={the 24th ACM SIGKDD International Conference},
year={2018},
}