Office
 Computer >> コンピューター >  >> ソフトウェア >> Office

OCRFeeder - 画像がテキストに移動する場所

最近、本当にクールで新しくユニークな Linux ソフトウェアを見つけるのが難しくなっています。雑用。そして最近というのは、デスクトップ分野での熱意と革新がゆっくりと衰退し始めて以来、実際にはここ 4 ~ 5 年間のことを意味していました。結局のところ、限られた量の知性にどれだけの優れたものが存在できるかには限界がありますが、焦点をモバイルに誤ってシフトし、Linux の年の夢が打ち砕かれたことを忘れてはなりません。

これにより、OCRFeder という名前の 4 年前のソフトウェアのテストが有効になると思います。理由は 2 つあります。良ければ良し。第二に、光学式文字認識の進歩と、私たちのツール (読み取り AI) がここで妥当な仕事をできるかどうかに、私は常に関心を持っていました。しばらく前にこれについて詳しく書いた後、2015 年に YAGF をレビューしました。私の後には、勇敢な Linux の戦士たち。

OCRFeeder - 画像がテキストに移動する場所

言葉を jpg にするのは簡単ではありません

プログラムをインストールしました。取得する必要があるライブラリがかなりあります。 Ubuntu 18.04 では、リストがかなりの数の行にまたがっていました。このプログラムのデフォルト キットとして Tesseract OCR エンジンを取得します。

次の追加パッケージがインストールされます:
blt gir1.2-goocanvas-2.0 gir1.2-gtkspell3-3.0 libgoocanvas-2.0-9 libgoocanvas-2.0-common libgtkspell3-3-0 liblept5 libtesseract4 libyelp0 python-bs4 python- chardet python-enchant python-html5lib python-lxml python-numpy python-olefile python-pil python-renderpm python-reportlab python-reportlab-accel python-sane python-tk python-webencodings tesseract-ocr tesseract-ocr-eng tesseract-ocr -osd tk8.6-blt2.5 unpaper yelp yelp-xsl

推奨パッケージ:
blt-demo python-gobject python-wxgtk3.0 python-genshi python-lxml-dbg python- lxml-doc gfortran python-dev python-nose python-numpy-dbg python-numpy-doc python-pil-doc python-pil-dbg python-renderpm-dbg python-egenix-mxtexttools python-reportlab-doc python-sane-dbg tix python-tk-dbg

立ち上げました。インターフェイスは少し実用的です。最初に 1 つまたは複数の画像をロードする必要があります。次に、OCR エンジンに供給するために使用します。うまくいけば、反対側で妥当な精度のテキストが生成されます。これが完了したら、テキストを LibreOffice にエクスポートできます。

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

OCR エンジン

前述したように、デフォルトでは OCRFeeder は Tesseract を使用しますが、他のエンジンを追加することもできます。実際、CuneiForm、GOCR、Ocrad を試してみたところ、プログラムはそれらすべてを正しく検出してロードしました。とてもきれいです。これにより、これらのエンジンのいくつかでよりうまくいく可能性があるため、複数の方法でドキュメントを試すことができます.

OCRFeeder - 画像がテキストに移動する場所

sudo apt-get install cuneiform gocr ocrad

OCRFeeder - 画像がテキストに移動する場所

画像からテキストへの変換

さて、肝心な部分です。ここでちょっと苦戦しました。使用可能なすべての画像のテキストをプログラムに自動検出 (すべてのページを認識) させたところ、変な色でマークされた出力が得られました。ロードされた 3 つの PNG ファイルの処理が完了するまでに約 3 分かかりました。その間、OCRFeder の CPU 使用率は約 17% で、Tesseract は約 4 ~ 5% を使用していました。したがって、アプリケーションがすべてのプロセッサ コアをより適切に使用するようになれば、時間は確実に短縮されます。次に、奇妙な出力。何をすべきかよくわかりませんでした。奇数。まったく進歩していないように見えました.

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

次に、マウスを使用して表示された画像の一部をドラッグして選択すると、別のペインが開き、目的の OCR エンジンを選択して実際の変換を実行できることに気付きました。視覚的な不具合はさておき、これはかなりうまく機能し、各画像の処理に数秒しかかかりませんでした.

トレーニングやデフォルトの変更を行わなかった場合、利用可能な 4 つのエンジン間の結果のばらつきは非常に大きくなりました。 Tesseract は最高の、そして許容できる唯一の変換を示しました。残りは、まったく使用を検討するのに十分ではありませんでした.理由はわかりませんが、そのままです。

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

また、グレーの背景画像の方が良い結果が得られることにも気付きました。過去に Tesseract は苦戦していたので、このエンジンにどのような改良が加えられたとしても、それは大歓迎です。ただし、これは厳密には OCRFeeder のことではありません。必要に応じて、コマンド ラインから自分で Tesseract を実行できます。

OCRFeeder - 画像がテキストに移動する場所

デスキューとアンペーパー

OCRFeeder には 2 つの便利な機能があります。歪んだ画像スキャンでテキストを自動回転する機能と、ノイズを減らしてより正確な変換を可能にするために用紙の背景を削除する機能です。両方のオプションを試しましたが、デスキューは問題なく機能しました。紙を剥がす、まあまあ。しかし、テキストを回転させた後 (制御画像の GIMP で以前に行った)、変換の結果はさらに良くなりました.

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

ODT へのエクスポート

これは少しトリッキーでした。私はこれを数回試しましたが、たくさんのエラーが発生しました。最終的にはうまくいきました。出力はあまりきれいではありませんが、さまざまな画像に異なるエンジンを使用するなど、複数の変換を同時にエクスポートできるという利点があります。とても気の利いた。

OCRFeeder - 画像がテキストに移動する場所

OCRFeeder - 画像がテキストに移動する場所

設定

最後に、プログラムの動作を変更するオプションがあります。大したことはありませんが、検出と精度に役立ちます。ほとんどの場合、テキスト列の幅、余白、言語の選択などをどのように検出するかにかかっています。ほとんどの人にとって、デフォルトは妥当な出発点です。

OCRFeeder - 画像がテキストに移動する場所

結論

OCRFeeder は合理的で柔軟なソフトウェアです。複数のエンジンを使用でき、画像修正アルゴリズムが追加されています。これにより、OCRFeder はおそらく自由市場でこの種の最も有望なソフトウェアになりますが、誰かがこれを手に入れない限り、すぐに更新される可能性は低いため、あなたの希望はすぐに打ち砕かれなければなりません.これには市場がありますが、Linux の世界は、疲労と無関心の間という困難な立場に陥っています。

それはさておき、古いものとアップデートのことはさておき、ほとんどの場合、OCRFederが提供しました。変換品質は悪くなく、UI を使用して作業を行っても何も失われません。また、エクスポート機能により、さらに編集するための優れたドキュメントを作成できます。また、Tesseract の改善にも満足しています。したがって、テキストに適した画像がたくさんあり、古い形式の手書きのテキストを現代的で使いやすいものに変換したい場合は、これが可能です。 OCRFeeder は PDF をサポートするだけでなく、スキャナーから直接読み取ることもできます。実験する価値は十分にあります。さあ、さようなら、さようなら。

乾杯。


  1. OpenOffice 3 - ナイス! - レビュー

    OpenOffice の最新バージョンがリリースされました。そしてそれはいいです。これは、最も人気のある無料のオープン ソース オフィス スイートの最新バージョンである OpenOffice 3 の、ささやかな楽しいレビューです。 私は少なくとも過去 3 年間、OpenOffice を広範囲に使用しており、多くのバージョンが出てくるのを見てきました。日常生活では、人々は通常、ソフトウェアの更新によってもたらされる新機能にほとんど注意を払っていませんが、振り返って、何年にもわたる継続的な進歩を 1 つの首尾一貫した考えにまとめると、印象に残ります。 OpenOffice はどんどん良くなっ

  2. Miro - インターネット TV

    ミロについて聞いたことがある人もいるかもしれません。以前は民主主義プレーヤーとして知られていました。 Miro について聞いたことがない人のために説明すると、Miro は、インターネット メディアのタップを開いて、音楽やビデオをユーザーのデスクトップにストリーミングすることを目的とした、見栄えがよく、用途の広い最新のマルチメディア アプリケーションです。 Miro の簡単なツアーに参加して、何ができるか見てみましょう。 ミロをゲット Miro は、Linux、Windows、および Mac で利用できます。 Miro は公式サイトで見つけるか、リポジトリからダウンロードできます。