最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は ...
Tesseract OCRの「easyocr」というライブラリを用いて、画像(PNG形式)の文字抽出を今回はやっていく知識のシェアです。 最近MENTAで学んだことをとりまとめました。 今回のテーマ ①コマンドプロンプトやVSCODEでの設定方法 ②画像から文字抽出して、ExcelのCSV ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する