
UiPathを使っていくのに仮想環境の操作とかこれから必須だなーって思ってOCR使ってみたがうまく使えない・・・。
仮想環境上で使うから悪いのかと思いつつ、ローカル環境で使ってみるもこれまた使えない。
ということでちょっとハマったので、備忘録として残しておきます。あとGoogleOCR使ったのも初めてだったのであわせて紹介。
Google OCRとは
まずOCRとは、Optical Character Recognitionの略の事で、
OCRとは、紙面を写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、
書かれている内容を文字データとして取り出す装置やソフトウェアのこと。また、そのような方式による自動文字認識。
また、GoogleOCRとは、Googleが提供しているOCR機能で、Googleドキュメントから無料で利用可能。APIとしてGoogle Cloudも使用可能(有料)
ということで、早速UiPathのGoogle OCRがどの程度のものか確認してみる。
まずはGoogle OCRを使うための事前準備
UiPath Studioをインストールしただけだと、そのままではGoogleOCRを利用できないため以下の設定が必要。
①下記のサイトから日本語パッケージをダウンロードする。
https://github.com/tesseract-ocr/tessdata/tree/3.04.00
ダウンロードするファイルは「jpn.traineddata」
②ダウンロードしてきたファイルを以下のフォルダに格納してUiPath Studioを再起動する。
C:\Users\ユーザ名\AppData\Local\UiPath\app-バージョン\tessdata
実際に画像からテキストを取得してみる
「Get OCR Text」アクティビティで以下のような画像を読み込んでみた。環境によって表示が変わると思うけども、メイリオのフォントサイズ18で作成しています。
作成したシーケンス
GetOCRTextアクティビティのプロパティ「Output」に変数resultを設定する。
GoogleOCRのLanguageに”jpn”と設定する。
ここでは特にアウトプットに設定しなくても取得結果を渡せる模様
ちなみに画像は開いていないと読み込めません。
MessageBoxに表示された結果がこちら。
うーん、さすがに日本語が100%データ化できるとは思っていなかったけど
残念なのは英語の「OCR」が「0CR」になってしまっていることですかね。。。