첫 페이지
소개¶
PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투입하는데 도움을 주는 다중 언어로 된 엄청나게 멋지고 주도적이며 실용적인 OCR 툴을 만드는데 목표를 두고 있습니다.

📣최근 업데이트¶
-
🔥2022년 8월 24일에 패들 OCR 출시 출시/2.6 차이니즈 씬에 맞춘 완전 업그레이드 된 기능과 성능을 갖춘 ; PP-Structurev2 출시, 그리고 레이아웃 리커버리 ](../../ppstructure/recovery) 신규 지원 및 PDF 를 워드로 전환하는 원 라인 명령
-
🔥2022년 7월 출시OCR 씬 애플리케이션 컬렉션 디지털 튜브, LCD 스크린, 라이선스 플레이트, 수기 인식 모델, 고정밀 SVTR 모델 등등과 같은 “9수직 모델” 출시로, 일반적으로 주된 OCR 수직 애플리케이션, 제조, 금융 및 수송 산업 커버
-
🔥2022년 5월 9일에 패들 OCR 출시 출시/2.5
- PP-OCRv3출시: 5%.비교 가능한 속도로, 차이니즈 씬의 효과는 PP-OCRv2와 비교해 볼 때 추가로 5% 정도 더 개선되고, 잉글리쉬 씬 효과는 11% 개선되었으며, 80개 언어 다중 언어 모델 평균 인식 정확도는 5% 이상 개선됨.
- PPOCRLabelv2출시: 표 인식 업무, 핵심 정보 추출 업무 및 불규칙한 텍스트 이미지주석 기능 추가.
- 쌍방향e-북 출시 "OCR 뛰어들기", 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함.
🌟특징¶
패들OCR은 OCR 관련 다양한 첨단 알고리즘 지원 PP-OCR 및 PP-Structure 이를 기반으로, 그리고 전체 데이터 생산 처리, 모델 훈련, 압축, 추론 및 배치를 통해 획득.

⚡ 신속한 경험¶
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=korean
만일 당신이 파이톤 환경이 없다면 [환경 준비]를 따르기 바람(../doc_en/environment_en.md). 우리는 당신이[사용지침 프로그램]으로 시작할 것을 권장합니다.(#Tutorials).
📚 E-북: OCR로 뛰어들기¶
👫 커뮤니티로¶
국제 개발자들을 위해 우리는 PaddleOCR 논의하기 를 우리의 국제 커뮤니티로 간주. 모든 아이디어와 질문은 여기서 영어로 논의 가능.
PP-OCR 시리즈 모델 목록¶
모델 소개 | 모델 명 | 권장 씬 | 감지 모델 | 인식 모델 |
---|---|---|---|---|
한국어 초경량 PP-OCRv3 모델(14.8M) | korean_PP-OCRv3_xx | 모바일 & 서버 | 추론 모델 / 훈련 모델 | 추론 모델 / 훈련 모델 |
영어 초경량 PP-OCRv3 모델(13.4M) | en_PP-OCRv3_xx | 모바일 & 서버 | 추론 모델 / 훈련 모델 | 추론 모델 / 훈련 모델 |
중국어 및 영어 초경량 PP-OCRv3 model(16.2M) | ch_PP-OCRv3_xx | 모바일 & 서버 | 추론 모델 / 훈련 모델 | 추론 모델 / 훈련 모델 |
- (다중 언어를 포함하여)더 많은 모델을 다운로드 하려면, PP-OCR 시리즈 모델 다운로드를 참조할 것.
- 신규 언어 요청에 대해서는, 신규 언어 요청 지침을 참조할 것.
- 구조적 문서 분석 모델에 대해서는, PP-Structure models.을 참조할 것.
📖 사용 지침 프로그램¶
신규 언어 요청에 대한 유엔 가이드라인¶
만일 신규 언어 모델을 요청하고자 한다면, 다중 언어 모델 업그레이드 투표하기에서 투표하기 바람. 우리는 결과에 따라 규칙적으로 모델을 업그레이드 시킬 것임함께 투표하고자 당신의 친구들을 초대할 것!** 만일 당신이 시나리오 기반 “신규 언어 모델”을 훈련하고자 한다면, 다중 언어 모델 훈련 프로젝트 를 통해 당신의 데이터세트를 작성하는데 도움이 되고 단계별로 전체 절차를 보여줄 것입니다. 원본다중 언어 OCR 개발 계획은 여전히 수많은 유용한 말뭉치와 사전을 보여줍니다.
👀 시각화추가¶
PP-OCRv3 다중 언어 모델


PP-OCRv3 영어 모델


PP-OCRv3 중국어 모델



PP-Structurev2
1. 레이아웃 분석 + 표 인식





📄 라이선스¶
본 프로젝트는 Apache 2.0 license 하에 출시됨.