UiPathでGoogle OCRを使って画像認識してみた

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る
google OCRをUiPathでやってみた

UiPathを使っていくのに仮想環境の操作とかこれから必須だなーって思ってOCR使ってみたがうまく使えない・・・。
仮想環境上で使うから悪いのかと思いつつ、ローカル環境で使ってみるもこれまた使えない。
ということでちょっとハマったので、備忘録として残しておきます。あとGoogleOCR使ったのも初めてだったのであわせて紹介。

Google OCRとは

まずOCRとは、Optical Character Recognitionの略の事で、

OCRとは、紙面を写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、
書かれている内容を文字データとして取り出す装置やソフトウェアのこと。また、そのような方式による自動文字認識。

http://e-words.jp/w/OCR.html

また、GoogleOCRとは、Googleが提供しているOCR機能で、Googleドキュメントから無料で利用可能。APIとしてGoogle Cloudも使用可能(有料)

ということで、早速UiPathのGoogle OCRがどの程度のものか確認してみる。

まずはGoogle OCRを使うための事前準備

UiPath Studioをインストールしただけだと、そのままではGoogleOCRを利用できないため以下の設定が必要。

①下記のサイトから日本語パッケージをダウンロードする。

https://github.com/tesseract-ocr/tessdata/tree/3.04.00

ダウンロードするファイルは「jpn.traineddata

②ダウンロードしてきたファイルを以下のフォルダに格納してUiPath Studioを再起動する。

C:\Users\ユーザ名\AppData\Local\UiPath\app-バージョン\tessdata

実際に画像からテキストを取得してみる

「Get OCR Text」アクティビティで以下のような画像を読み込んでみた。環境によって表示が変わると思うけども、メイリオのフォントサイズ18で作成しています。

作成したシーケンス

GetOCRTextアクティビティのプロパティ「Output」に変数resultを設定する。

GoogleOCRのLanguageに”jpn”と設定する。

ここでは特にアウトプットに設定しなくても取得結果を渡せる模様
ちなみに画像は開いていないと読み込めません。

MessageBoxに表示された結果がこちら。

うーん、さすがに日本語が100%データ化できるとは思っていなかったけど
残念なのは英語の「OCR」が「0CR」になってしまっていることですかね。。。

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

SNSでもご購読できます。

コメントを残す

*