OCR

OCR (Pengenalan Karakter Optik)

Teknologi yang menganalisis gambar teks cetak atau tulisan tangan dan mengubahnya menjadi teks yang dapat dibaca mesin, dicari, dan diedit.

Detail Teknis

Pipeline OCR modern melibatkan prapemrosesan gambar (perbaikan kemiringan, binarisasi, penghilangan noise), analisis tata letak untuk mengidentifikasi blok teks, segmentasi baris dan karakter, pengenalan fitur menggunakan model jaringan saraf konvolusional (CNN) atau transformer, dan pascapemrosesan dengan model bahasa untuk koreksi kesalahan. Mesin utama meliputi Tesseract (open-source, LSTM), layanan cloud dari Google, AWS, dan Azure, serta model berbasis transformer khusus. Akurasi diukur menggunakan Character Error Rate (CER) dan Word Error Rate (WER), dengan sistem modern mencapai akurasi >99% pada teks cetak berkualitas tinggi.

Contoh

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Alat Terkait

M Merge PDF S Split PDF C Compress PDF R Rotate PDF A Add Page Numbers P PDF to JPG W Watermark PDF R Reorder PDF Pages F Flatten PDF E Edit PDF Metadata S Sign PDF J JPG to PDF E Extract Text from PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

Istilah Terkait

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)