※NDROCR-lite対応版を公開しました。こちらもご覧ください。 とある業務(※1)において、毎月作られる資料をスキャンしてPDFデータ化しています。 その際にはOCR情報を付与し、あとから検索できるようにしていますが、過去の一部のPDFにはOCR情報が無い ...
2026年2月24日、国立国会図書館のNDLラボが「NDLOCR-Lite」というOCRソフトウェアを無償で公開しました。これまで同館が提供していた「NDLOCR」はNVIDIAのGPUが必須でしたが、NDLOCR-LiteはGPU不要。一般的なノートPCでも動作し、しかもインターネット接続なしで使えます ...
- Single PDF or folder batch mode. - Extracts PDF metadata (page count, title, author, etc.). - Extracts native PDF text and OCR text (RapidOCR) page-by-page. - Saves JSON and TXT outputs. - Optional ...