今回はオープンソースでマルチプラットフォームのOCRエンジンであるTesseract OCRを使用し、 読み取り精度を確認してみます。 UbuntuでOCR? 「日本語でOCR」 と聞くと、 プロプライエタリの牙城というか、 高価なソフトを購入しないと実用に耐えないという ...
Googleのエンジニアらが、かつてHewlett-Packard(HP)が開発した光学式文字認識(OCR)エンジンをよみがえらせた。 Googleは、HP Labsによって20年も前に開発され、1995年にお蔵入りとなった「Tesseract」のバグを修正し、数カ月前にオープンソースコミュニティに公開 ...
今回はブラザーのスキャナーでスキャンした結果を自動的にOCRを実行します。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成します。 紙の書類をなんとかしたい ペーパーレスなんて言葉はもう聞き飽きてしまいましたが、実際に ...
Port from developers at MIT supports dozens of languages and makes it easier and cheaper to build image-processing applications With their JavaScript port of the Tesseract optical character ...