Tidak ada yang lebih buruk daripada membuka PDF dan Anda tidak dapat menggunakan fungsi pencarian atau bahkan menyorot teks. Ini biasanya terjadi ketika PDF dibuat dengan memindai dokumen kertas – ini hanyalah serangkaian gambar. Sebagian besar perangkat lunak pemindaian modern menggunakan Optical Character Recognition (OCR) sehingga kata -kata tersebut dipilih dan dapat dipilih, tetapi kadang -kadang Anda masuk ke dokumen di mana itu tidak terjadi.
Dalam hal ini, sumber gratis dan gratis Ocrmypdf Sempurna untuk tinggal di sekitar. Ini adalah aplikasi baris perintah yang dengan cepat mengonversi file PDF ke file PDF/A dengan pengakuan karakter optik dalam file, yang berarti Anda akan dapat mencari teks. Bahkan lebih baik, itu benar -benar gratis.
Menginstal Aplikasi paling baik dilakukan dengan menggunakan Paket Manajer Anda di perangkat Linux Anda dan menggunakan Mac’s Homebrue. Pengguna Windows Dapat secara teknis menginstal aplikasi Python dan instal beberapa ketergantungan lagi – lihat apakah Anda bersedia menggali sesuatu.
Setelah aplikasi diatur, Anda dapat menggunakannya dengan mengetiknya ocrmypdf
Mengikuti nama dokumen yang ingin Anda tambahkan OCR Di dekat Dan kemudian Anda ingin membuat nama dokumen. Jadi, misalnya, ocrmypdf before.pdf after.pdf
Ambil “PDF” sebelumnya, tambahkan pengenalan karakter, lalu buat dokumen baru yang disebut “PDF”.
Prosesnya akan memakan waktu tergantung pada ukuran dokumen dan mungkin tidak sepenuhnya benar jika kualitas gambarnya rendah. Bahkan setelah mengatakan ini, saya menemukan bahwa itu melakukan pekerjaan yang baik yang dapat saya gali dengan PDF terkompresi tertua dan lebih lemah.
Kredit: Justin Pot
Dan Anda dapat melakukan sesuatu yang lebih di sini: kenyataan, Buku masak dalam dokumentasi OCRMYPDF Garis besar dari banyak hal yang Anda bisa. Anda dapat mengompres gambar dalam PDF, misalnya, menambahkan --pdfa-image-compression jpeg
Halaman apa pun dengan teks samping yang dapat Anda tambahkan ke apresiasi Anda dapat secara otomatis kembali --rotate-pages
Memerintah. Atau bahwa PDF yang Anda proses sudah mengandung OCR yang menurut Anda berkualitas rendah – Anda dapat menambahkan --redo-ocr
Dalam urutan; Ini akan menghapus informasi OCR yang ada dan akan dimulai.
Anda mendapatkan idenya: ada begitu banyak hal di sini. Lihat dokumentasi untuk informasi lebih lanjut Karena hal ini bisa berbuat lebih banyak.