Chiều nay, một chiều mưa gió bão bùng vì cơn bão Usagi đổ bộ vào nên tôi ở nhà ngồi đọc sách. Dạo này bỗng dưng muốn tìm đọc các tác phẩm bàn luận về tiểu thuyết của Kim Dung, các bộ tiểu thuyết nổi tiếng của ông. Tôi có tìm mua ebook trên Ybook.vn và phát hiện ra phần mềm đọc sách này thực chất hoạt động cũng không có gì phức tạp lắm. Cái rắc rối ở chỗ là tôi chưa đủ level để tìm hiểu xem ebook (thực chất là pdf) sau khi tải về họ mã hóa nó bằng cái gì.

Thế là dù có gặp đoạn nào hay, tôi cũng chịu không cách nào copy ra được. Và những dịp như vậy, tôi lại tìm đủ cách để làm cho bằng được. Tôi nhớ ngày xưa tôi từng đọc được khái niệm về OCR – Optical Character Recognition (nhận diện ký tự quang học). Nói nôm na là bạn có một tấm hình chụp một trang sách hay một file scan sách chẳng hạn, nhưng muốn trích xuất văn bản bên trong ra để chỉnh sửa, thì có thể dùng các tool thuộc nhóm OCR này.

Tôi có thử qua một vài nơi, nhưng thấy có một địa chỉ online thực hiện công việc này khá tốt, thậm chí là sai sót chính tả tiếng Việt chỉ ở mức 1%.

https://convertio.co/ocr/

Mặc định thì nếu không đăng ký bỏ tiền ra xài, bạn chỉ được có 10 trang convert miễn phí. Nhưng tôi nghĩ nếu lướt web nhiều, chắc bạn cũng biết tới khái niệm “web ẩn danh” rồi =))))

OCR tool online.jpg

Nhưng thay vì lạm dụng quá nhiều tính năng web ẩn danh cho mục đích này, chúng ta nếu cần sử dụng với số lượng nhiều thì tốt nhất nên bỏ tiền ra mua.

VÕ TÌNH THƯƠNG

votinhthuong9@gmail.com