This tool, initially made specifically for use with Sony's Digital Paper System (DPS), is now a general-purpose DjVu to PDF converter with a focus on small output size and the ability to preserve ...
Lynx is a project combining several smaller OpenCV initiatives developed for the Hackberry YSWS event, featuring various image processing functionalities on its website. This is a bilingual OCR system ...
こんなこともできてしまうなんて、もう、「python」はすごすぎ。ん十年前まだまだWindows機だった頃の「ocr」はソフトの値段もすごかったけど、結果としては、いまいち、だったことを思い出します。文字化けしてんのかな、と思うほど文字になっていなくて ...
以前に"Tesseract OCR"というのを試しました。 今回は"Easy OCR"というのを試してみます。 この中にColabでデモができるようになっているので、日本語について少しいじってみます。 Colabを開いて、ランタイムをGPUにしてから作業を進めます。 !pip install easyocr --no ...
古典籍資料の写真からテキストデータを抽出できるツール「NDL古典籍OCR-Lite」が11月26日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。