Anda mendapat tugas merangkum atau menyalin sebuah bab dari buku teks? Tidak perlu kalut dengan tugas tersebut. Dengan memanfaatkan OCR, Anda dapat men-scan buku teks dan langsung mengeditnya di aplikasi word processor.
Secara sederhana, Optical Character Recognition (OCR) adalah proses menerjemahkan meteri cetakan (buku, koran, majalah) ke dalam file teks yang dapat diedit dan disimpan. Teknologi ini memungkinkan menyimpan materi-materi cetakan ke dalam format teks yang lebih menghemat ruang di harddisk, ketimbang menyimpannya dalam bentuk gambar.
Sebelum ditemukannya teknologi ini, seseorang harus mengetik ulang materi cetakan huruf demi huruf yang jelas memakan waktu dan tenaga yang lebih besar.
OCR merupakan gabungan riset dalam bidang pengenalan pola (pattern recognition), kecerdasan buatan (artificial intelligence), dan penginderaan mesin (machine vision). Pada mulanya, optical character recognition (menggunakan scanner dan algoritma komputer) merupakan dua bidang kajian yang terpisah. Karena hanya sedikit aplikasi yang benar-benar menggunakan teknik optik, istilah OCR akhirna meluas, termasuk ke dalamnya digital image processing.
Awal Mula OCR
OCR pertama kali dipatenkan oleh Gustav Tauschek di Jerman pada tahun 1929, kemudian diikuti oleh Handel di AS tahun 1933. Mesin buatan Tauschek adalah perangkat mekanik yang menggunakan template. Sebuah photodetector ditempatkan pada mesin tersebut. Untuk mengenali sebuah karakter, template diletakkan tepat di atas mesin tersebut, kemudian disinari. Bayangan yang terbentuk pada photodetector akan dikenali sebagai karakter tertentu.
Pada 1950, David Shepard, seorang ahli sandi dari badan intelijen angkatan bersenjata AS, menemukan Intelligent Machines Research Corporation (IMR), yang kemudian hari menjelma menjadi sistem OCR pertama yang dikomersialkan. IMR menggunakan analisis image sebagai lawan dari ketepatan karakter, dan dapat mengenali beberapa varian font. Scanner yang telahg dilengkapi dengan sistem IMR mampu menganalisis karakter.
OCR komersial pertama digunakan oleh Readers Digest pada 1955. Sistem OCR kedua dijual kepada Standard Oil Company di California untuk membaca cetakan kartu kredit untuk keperluan pembayaran. Pada era 1950-an beberapa sistem OCR juga digunakan oleh Ohio Bell Telephone Company, IBM, dan Angkatan Udara AS untuk membaca dan mengirimkan pesan yang diketik melalui teletype.
Teknologi OCR Sekarang
Tingkat akurasi OCR sekarang terhadap tulisan latin yang diketik dapat dikatakan telah sempurna, mencapai 99%. Walaupun demikian, review dari manusia tetap dibutuhkan untuk mengoreksi kesalahan yang ditimbulkan selama proses penerjemahan berlangsung.
Sistem untuk mengenali tulisan tangan secara langsung (on the fly) yang dipelopori oleh The Apple Newton telah menikmati kesuksesan di pasar dalam beberapa tahun belakangan. Di antaranya adalah perangkat input untuk PDA yang bekerja pada Palm OS. Algoritma yang digunakan perangkat ini memanfaatkan fakta bahwa gerakan, kecepatan dan arah yang digunakan oleh orang, saat menulis sebuah huruf memiliki banyak kesamaan dan telah dikenali.
Metode yang digunakan pada perangkat input PDA ini tidak dapat digunakan dalam software untuk men-scan kertas dokumen. Sampai saat ini, tingkat akurasi tulisan tangan masih menjadi kendala besar dalam sistem OCR. Tingkat akurasi yang mencapai 80% hingga 90% masih dapat diterima untuk penggunaan skala kecil seperti menulis di PDA, tetapi masih belum dapat diterima untuk dokumen dalam jumlah yang besar. Varian OCR yang digunakan untuk mengenali tulisan tangan on the fly ini dikenal dengan nama ICR (Intelligent Character Recognition).
Sementara itu, pengenalan tulisan tangan sambung masih berada dalam kancah riset aktif sampai saat ini. Tingkat akurasi untuk tulisan tangan sambung yang telah dicapai masih di bawah tingkat akurasi tulisan tangan yang tidak disambung. Kenaikan peningkatan pengenalan tulisan rasanya sulit dicapai, kecuali memasukkan unsur lain dalam OCR, yakni informasi kontekstual atau gramatikal.
Sebagai contoh, pengenalan kata yang ada dalam kamus jauh lebih mudah ketimbang mencoba mengenali tulisan tangan setiap orang. Membaca kolom nilai dalam cek atau kuitansi (yang biasanya ditulis engan angka) adalah contoh sederhana bagaimana menggunakan kamus kecil dapat menaikkan tingkat akurasi secara signifikan.
Pengetahuan gramatika dari sebuah bahasa yang akan di-scan juga dapat menentukan apakah kata yang ditulis merupakan kata kerja atau kata benda. Bentuk tulisan tangan sambung sendiri sama sekali tidak memberikan informasi yang cukup untuk menaikkan tingkat akurasi.
Jika nantinya para ilmuwan benar memasukkan pengenalan gramatika bahasa, maka OCR merupakan teknologi hibrid hasil persilangan antara teknik optik, algoritma komputer, dan linguistik.
Sebelum ditemukannya teknologi ini, seseorang harus mengetik ulang materi cetakan huruf demi huruf yang jelas memakan waktu dan tenaga yang lebih besar.
OCR merupakan gabungan riset dalam bidang pengenalan pola (pattern recognition), kecerdasan buatan (artificial intelligence), dan penginderaan mesin (machine vision). Pada mulanya, optical character recognition (menggunakan scanner dan algoritma komputer) merupakan dua bidang kajian yang terpisah. Karena hanya sedikit aplikasi yang benar-benar menggunakan teknik optik, istilah OCR akhirna meluas, termasuk ke dalamnya digital image processing.
Awal Mula OCR
OCR pertama kali dipatenkan oleh Gustav Tauschek di Jerman pada tahun 1929, kemudian diikuti oleh Handel di AS tahun 1933. Mesin buatan Tauschek adalah perangkat mekanik yang menggunakan template. Sebuah photodetector ditempatkan pada mesin tersebut. Untuk mengenali sebuah karakter, template diletakkan tepat di atas mesin tersebut, kemudian disinari. Bayangan yang terbentuk pada photodetector akan dikenali sebagai karakter tertentu.
Pada 1950, David Shepard, seorang ahli sandi dari badan intelijen angkatan bersenjata AS, menemukan Intelligent Machines Research Corporation (IMR), yang kemudian hari menjelma menjadi sistem OCR pertama yang dikomersialkan. IMR menggunakan analisis image sebagai lawan dari ketepatan karakter, dan dapat mengenali beberapa varian font. Scanner yang telahg dilengkapi dengan sistem IMR mampu menganalisis karakter.
OCR komersial pertama digunakan oleh Readers Digest pada 1955. Sistem OCR kedua dijual kepada Standard Oil Company di California untuk membaca cetakan kartu kredit untuk keperluan pembayaran. Pada era 1950-an beberapa sistem OCR juga digunakan oleh Ohio Bell Telephone Company, IBM, dan Angkatan Udara AS untuk membaca dan mengirimkan pesan yang diketik melalui teletype.
Teknologi OCR Sekarang
Tingkat akurasi OCR sekarang terhadap tulisan latin yang diketik dapat dikatakan telah sempurna, mencapai 99%. Walaupun demikian, review dari manusia tetap dibutuhkan untuk mengoreksi kesalahan yang ditimbulkan selama proses penerjemahan berlangsung.
Sistem untuk mengenali tulisan tangan secara langsung (on the fly) yang dipelopori oleh The Apple Newton telah menikmati kesuksesan di pasar dalam beberapa tahun belakangan. Di antaranya adalah perangkat input untuk PDA yang bekerja pada Palm OS. Algoritma yang digunakan perangkat ini memanfaatkan fakta bahwa gerakan, kecepatan dan arah yang digunakan oleh orang, saat menulis sebuah huruf memiliki banyak kesamaan dan telah dikenali.
Metode yang digunakan pada perangkat input PDA ini tidak dapat digunakan dalam software untuk men-scan kertas dokumen. Sampai saat ini, tingkat akurasi tulisan tangan masih menjadi kendala besar dalam sistem OCR. Tingkat akurasi yang mencapai 80% hingga 90% masih dapat diterima untuk penggunaan skala kecil seperti menulis di PDA, tetapi masih belum dapat diterima untuk dokumen dalam jumlah yang besar. Varian OCR yang digunakan untuk mengenali tulisan tangan on the fly ini dikenal dengan nama ICR (Intelligent Character Recognition).
Sementara itu, pengenalan tulisan tangan sambung masih berada dalam kancah riset aktif sampai saat ini. Tingkat akurasi untuk tulisan tangan sambung yang telah dicapai masih di bawah tingkat akurasi tulisan tangan yang tidak disambung. Kenaikan peningkatan pengenalan tulisan rasanya sulit dicapai, kecuali memasukkan unsur lain dalam OCR, yakni informasi kontekstual atau gramatikal.
Sebagai contoh, pengenalan kata yang ada dalam kamus jauh lebih mudah ketimbang mencoba mengenali tulisan tangan setiap orang. Membaca kolom nilai dalam cek atau kuitansi (yang biasanya ditulis engan angka) adalah contoh sederhana bagaimana menggunakan kamus kecil dapat menaikkan tingkat akurasi secara signifikan.
Pengetahuan gramatika dari sebuah bahasa yang akan di-scan juga dapat menentukan apakah kata yang ditulis merupakan kata kerja atau kata benda. Bentuk tulisan tangan sambung sendiri sama sekali tidak memberikan informasi yang cukup untuk menaikkan tingkat akurasi.
Jika nantinya para ilmuwan benar memasukkan pengenalan gramatika bahasa, maka OCR merupakan teknologi hibrid hasil persilangan antara teknik optik, algoritma komputer, dan linguistik.