🍋
Menu
PDF

OCR

OCR (Pengenalan Karakter Optik)

Teknologi yang menganalisis gambar teks cetak atau tulisan tangan dan mengubahnya menjadi teks yang dapat dibaca mesin, dicari, dan diedit.

Detail Teknis

Pipeline OCR modern melibatkan prapemrosesan gambar (perbaikan kemiringan, binarisasi, penghilangan noise), analisis tata letak untuk mengidentifikasi blok teks, segmentasi baris dan karakter, pengenalan fitur menggunakan model jaringan saraf konvolusional (CNN) atau transformer, dan pascapemrosesan dengan model bahasa untuk koreksi kesalahan. Mesin utama meliputi Tesseract (open-source, LSTM), layanan cloud dari Google, AWS, dan Azure, serta model berbasis transformer khusus. Akurasi diukur menggunakan Character Error Rate (CER) dan Word Error Rate (WER), dengan sistem modern mencapai akurasi >99% pada teks cetak berkualitas tinggi.

Contoh

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Alat Terkait

Istilah Terkait