OCR

OCR (광학 문자 인식)

인쇄되거나 손으로 쓴 텍스트의 이미지를 분석하여 컴퓨터에서 편집하고 검색할 수 있는 기계 판독 가능 텍스트로 변환하는 기술입니다.

기술 세부사항

현대 OCR 파이프라인에는 이미지 전처리(기울기 보정, 이진화, 노이즈 제거), 문자 분할, CNN 또는 트랜스포머 기반 모델을 이용한 특징 추출, 그리고 후처리(사전 기반 맞춤법 교정, 맥락 분석)가 포함됩니다. Tesseract(오픈소스)와 Google Cloud Vision(클라우드)이 널리 사용되는 엔진입니다.

예시

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Categories

OCR

기술 세부사항

예시

관련 도구

관련 용어