概述

1. 低代码全流程开发简介¶

飞桨低代码开发工具 PaddleX，依托于 PaddleOCR 的先进技术，支持了 OCR 领域的低代码全流程开发能力。通过低代码开发，可实现简单且高效的模型使用、组合与定制。这将显著减少模型开发的时间消耗，降低其开发难度，大大加快模型在行业中的应用和推广速度。特色如下：

🎨 模型丰富一键调用：将文本图像智能分析、通用 OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的48个模型整合为 10 条模型产线，通过极简的Python API一键调用，快速体验模型效果。此外，同一套API，也支持图像分类、目标检测、图像分割、时序预测等共计200+模型，形成30+单功能模块，方便开发者进行模型组合使用。
🚀 提高效率降低门槛：提供基于统一命令和图形界面两种方式，实现模型简洁高效的使用、组合与定制。支持高性能推理、服务化部署和端侧部署等多种部署方式。此外，对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等，进行模型开发时，都可以无缝切换。

说明：PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程，其中包含能够独立完成某类任务的单模型（单功能模块）组合。

2. OCR相关能力支持¶

PaddleX 中 OCR 相关的 10 条产线均支持本地快速推理，部分产线支持在线体验，您可以快速体验各个产线的预训练模型效果，如果您对产线的预训练模型效果满意，可以直接对产线进行高性能推理/服务化部署/端侧部署，如果不满意，您也可以使用产线的二次开发能力，提升效果。完整的产线开发流程请参考PaddleX产线使用概览或各产线使用教程。

此外，PaddleX为开发者提供了基于云端图形化开发界面的全流程开发工具, 详细请参考教程《零门槛开发产业级AI模型》

模型产线	在线体验	快速推理	高性能推理	服务化部署	端侧部署	二次开发	星河零代码产线
文档图像预处理	🚧	✅	🚧	✅	🚧	✅	🚧
通用OCR	链接	✅	✅	✅	✅	✅	✅
通用表格识别	链接	✅	✅	✅	🚧	✅	✅
通用表格识别v2	🚧	✅	🚧	✅	🚧	✅	🚧
公式识别	链接	✅	✅	✅	🚧	✅	✅
印章文本识别	链接	✅	✅	✅	🚧	✅	✅
通用版面解析	🚧	✅	✅	✅	🚧	✅	🚧
通用版面解析v2	🚧	✅	🚧	✅	🚧	🚧	🚧
文档场景信息抽取v3	链接	✅	✅	✅	🚧	✅	✅
文档场景信息抽取v4	🚧	✅	✅	✅	🚧	✅	🚧

❗注：以上功能均基于GPU/CPU实现。PaddleX还可在昆仑芯、昇腾、寒武纪和海光等主流硬件上进行快速推理和二次开发。下表详细列出了模型产线的支持情况，具体支持的模型列表请参阅模型列表(NPU) // 模型列表(XPU) // 模型列表(MLU) // 模型列表DCU。同时我们也在适配更多的模型，并在主流硬件上推动高性能和服务化部署的实施。

🚀 国产化硬件能力支持

模型产线	昇腾 910B	昆仑芯 R200/R300	寒武纪 MLU370X8	海光 Z100/K100AI
通用OCR	✅	✅	✅	✅
通用表格识别	✅	🚧	🚧	🚧

3. OCR相关模型产线列表和教程¶

文档图像预处理产线: 使用教程
通用OCR产线: 使用教程
通用表格识别产线: 使用教程
通用表格识别v2产线: 使用教程
通用版面解析产线: 使用教程
通用版面解析v2产线: 使用教程
公式识别: 使用教程
印章文本识别: 使用教程
文档场景信息抽取v3产线: 使用教程
文档场景信息抽取v4产线: 使用教程

4. OCR相关单功能模块列表和教程¶

文本检测模块: 使用教程
印章文本检测模块: 使用教程
文本行方向分类模块: 使用教程
文本识别模块: 使用教程
公式识别模块: 使用教程
表格结构识别模块: 使用教程
文本图像矫正模块: 使用教程
版面区域检测模块: 使用教程
文档图像方向分类模块: 使用教程
表格单元格检测模块: 使用教程
表格分类模块: 使用教程

概述

1. 低代码全流程开发简介¶

2. OCR相关能力支持¶

3. OCR相关模型产线列表和教程¶

4. OCR相关单功能模块列表和教程¶

评论