一、PP-OCRv5多语种文字识别介绍¶

PP-OCRv5 是 PP-OCR 系列的最新一代文字识别解决方案，专注于多场景、多语种的文字识别任务。在文字类型支持方面，默认配置的识别模型可准确识别简体中文、中文拼音、繁体中文、英文和日文这五大主流文字类型。同时，PP-OCRv5还提供了覆盖37种语言的多语种文字识别能力，包括韩文、西班牙文、法文、葡萄牙文、德文、意大利文、俄罗斯文等（具体支持语种及缩写详见第四节）。相较于前代 PP-OCRv3 版本，PP-OCRv5 在多语言文字识别准确率上实现了超过30%的提升。

法文识别结果

德文识别结果

韩文识别结果

俄文识别结果

二、快速使用¶

您可以通过在命令行中使用 --lang 参数，来使用指定语种的文本识别模型进行通用 OCR 产线的推理：

# 通过 `--lang` 参数指定使用法语的识别模型
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_french01.png \
    --lang fr \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False \
    --save_path ./output \
    --device gpu:0

上述命令行的其他参数说明请参考通用 OCR 产线的命令行使用方式, 运行后结果会被打印到终端上：

{'res': {'input_path': '/root/.paddlex/predict_input/general_ocr_french01.png', 'page_index': None, 'model_settings': {'use_doc_preprocessor': True, 'use_textline_orientation': False}, 'doc_preprocessor_res': {'input_path': None, 'page_index': None, 'model_settings': {'use_doc_orientation_classify': False, 'use_doc_unwarping': False}, 'angle': -1}, 'dt_polys': array([[[119,  23],
        ...,
        [118,  75]],

       ...,

       [[109, 506],
        ...,
        [108, 556]]], dtype=int16), 'text_det_params': {'limit_side_len': 64, 'limit_type': 'min', 'thresh': 0.3, 'max_side_limit': 4000, 'box_thresh': 0.6, 'unclip_ratio': 1.5}, 'text_type': 'general', 'textline_orientation_angles': array([-1, ..., -1]), 'text_rec_score_thresh': 0.0, 'rec_texts': ['mifere; la profpérité & les fuccès ac-', 'compagnent l’homme induftrieux.', 'Quel eft celui qui a acquis des ri-', 'cheffes, qui eft devenu puiffant, qui', 's’eft couvert de gloire, dont l’éloge', 'retentit par-tout, qui fiege au confeil', "du Roi? C'eft celui qui bannit la pa-", "reffe de fa maifon, & qui a dit à l'oifi-", 'veté : tu es mon ennemie.'], 'rec_scores': array([0.98409832, ..., 0.98091048]), 'rec_polys': array([[[119,  23],
        ...,
        [118,  75]],

       ...,

       [[109, 506],
        ...,
        [108, 556]]], dtype=int16), 'rec_boxes': array([[118, ...,  81],
       ...,
       [108, ..., 562]], dtype=int16)}}

若指定了save_path，则会保存可视化结果在save_path下。可视化结果如下：

您也可以使用 Python 代码，在通用 OCR 产线初始化时，通过 lang 参数来使用指定语种的识别模型：

from paddleocr import PaddleOCR

ocr = PaddleOCR(
    lang="fr" # 通过 lang 参数指定使用法语的识别模型
    use_doc_orientation_classify=False, # 通过 use_doc_orientation_classify 参数指定不使用文档方向分类模型
    use_doc_unwarping=False, # 通过 use_doc_unwarping 参数指定不使用文本图像矫正模型
    use_textline_orientation=False, # 通过 use_textline_orientation 参数指定不使用文本行方向分类模型
)
result = ocr.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_french01.png")
for res in result:
    res.print()
    res.save_to_img("output")
    res.save_to_json("output")

更过关于 PaddleOCR 类参数的说明参考通用 OCR 产线的脚本方式集成。

三、指标对比¶

模型	模型下载链接	韩语数据集精度 (%)
korean_PP-OCRv5_mobile_rec	推理模型/训练模型	88.0
korean_PP-OCRv3_mobile_rec	推理模型/训练模型	23.0

模型	模型下载链接	拉丁字母语言数据集精度 (%)
latin_PP-OCRv5_mobile_rec	推理模型/训练模型	84.7
latin_PP-OCRv3_mobile_rec	推理模型/训练模型	37.9

模型	模型下载链接	东斯拉夫语言数据集精度 (%)
eslav_PP-OCRv5_mobile_rec	推理模型/训练模型	81.6
cyrillic_PP-OCRv3_mobile_rec	推理模型/训练模型	50.2

注： - 韩语数据集：PP-OCRv5 最新构建的包含了 5007 张韩语文本图片的识别数据集。 - 拉丁字母语言数据集：PP-OCRv5 最新构建的包含了 3111 张拉丁字母语言的文本图片识别数据集。 - 东斯拉夫语言数据集：PP-OCRv5 最新构建的包含了俄语、白俄罗斯语和乌克兰语共计 7031 张文本图片的识别数据集。

四、支持语种及缩写¶

语种	描述	缩写	语种	描述	缩写
中文	Chinese & English	ch	匈牙利文	Hungarian	hu
英文	English	en	塞尔维亚文（latin）	Serbian(latin)	rs_latin
法文	French	fr	印度尼西亚文	Indonesian	id
德文	German	de	欧西坦文	Occitan	oc
日文	Japanese	japan	冰岛文	Icelandic	is
韩文	Korean	korean	立陶宛文	Lithuanian	lt
中文繁体	Chinese Traditional	chinese_cht	毛利文	Maori	mi
南非荷兰文	Afrikaans	af	马来文	Malay	ms
意大利文	Italian	it	荷兰文	Dutch	nl
西班牙文	Spanish	es	挪威文	Norwegian	no
波斯尼亚文	Bosnian	bs	波兰文	Polish	pl
葡萄牙文	Portuguese	pt	斯洛伐克文	Slovak	sk
捷克文	Czech	cs	斯洛文尼亚文	Slovenian	sl
威尔士文	Welsh	cy	阿尔巴尼亚文	Albanian	sq
丹麦文	Danish	da	瑞典文	Swedish	sv
爱沙尼亚文	Estonian	et	西瓦希里文	Swahili	sw
爱尔兰文	Irish	ga	塔加洛文	Tagalog	tl
克罗地亚文	Croatian	hr	土耳其文	Turkish	tr
乌兹别克文	Uzbek	uz	拉丁文	Latin	la
俄罗斯文	Russian	ru	白俄罗斯文	Belarusian	be
乌克兰文	Ukranian	uk

五、模型及其支持的语种¶

模型	支持语种
korean_PP-OCRv5_mobile_rec	韩文
latin_PP-OCRv5_mobile_rec	英文、法文、德文、南非荷兰文、意大利文、西班牙文、波斯尼亚文、葡萄牙文、捷克文、威尔士文、丹麦文、爱沙尼亚文、爱尔兰文、克罗地亚文、乌兹别克文、匈牙利文、塞尔维亚文（latin）、印度尼西亚文、欧西坦文、冰岛文、立陶宛文、毛利文、马来文、荷兰文、挪威文、波兰文、斯洛伐克文、斯洛文尼亚文、阿尔巴尼亚文、瑞典文、西瓦希里文、塔加洛文、土耳其文、拉丁文
eslav_PP-OCRv5_mobile_rec	俄罗斯文、白俄罗斯文、乌克兰文

一、PP-OCRv5多语种文字识别介绍¶

二、快速使用¶

三、指标对比¶

四、 支持语种及缩写¶

五、模型及其支持的语种¶

评论

四、支持语种及缩写¶