最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は ...
Tesseract OCRの「easyocr」というライブラリを用いて、画像(PNG形式)の文字抽出を今回はやっていく知識のシェアです。 最近MENTAで学んだことをとりまとめました。 今回のテーマ ①コマンドプロンプトやVSCODEでの設定方法 ②画像から文字抽出して、ExcelのCSV ...