Power Automate Desktopアクション「OCR」の種類と使い方

  • URLをコピーしました!
目次

1. テキストが画像に表示されるまで待機(OCR)

詳細:

このアクションは、OCRを使用して、指定した画像や画面内に特定のテキストが表示される、または消えるまでフローを中断します。画像認識や特定状況の発生を待機する場合に便利です。

使い方:

  1. 対象画面または画像を指定します。
  2. 待機するテキストを入力します(例: ボタンのラベル)。
  3. テキストが表示されるか、消えるかの条件を選択します。
  4. 必要に応じてタイムアウト時間を設定します。

実例:

  • シナリオ: ファイルが正常に処理されると画面に「完了」と表示される。
  • 操作:
    • テキスト「完了」が表示されるまで待機。
  • 結果: テキストが表示された時点で次のアクションに進む。

2. テキストが画像に表示される場合(OCR)

詳細:

指定されたテキストが画面内で認識される場合に条件付きブロックを実行します。このアクションは、特定の状況に応じて処理を分岐させたい場合に便利です。

使い方:

  1. 監視する画面や画像を指定します。
  2. 認識したいテキストを入力します。
  3. テキストが見つかった場合のアクションを設定します。

実例:

  • シナリオ: 支払いページで「成功」と表示された場合に次の操作を実行。
  • 操作:
    • テキスト「成功」が表示される場合にメール通知を送信。
  • 結果: 支払い成功が確認されると、メール通知が送信される。

3. OCRを使ってテキストを抽出

詳細:

このアクションは、OCRエンジンを使用して画像や画面内のテキストを抽出します。非デジタルな文書やスキャン画像からデータを取り出す際に非常に便利です。

使い方:

  1. 使用するOCRエンジンを選択します(Google OCR、Tesseract OCRなど)。
  2. テキストを抽出する画像や画面を指定します。
  3. 抽出結果を変数に保存します。

実例:

  • シナリオ: スキャンした請求書の金額を抽出。
  • 操作:
    • 請求書画像から金額部分のテキストを抽出。
  • 結果: 画像内の金額が"¥10,000"として変数に保存される。

OCRアクションの比較

アクション名主な用途主な違い
テキストが画像に表示されるまで待機テキストが表示されるか消えるのを待つフローの実行を中断する
テキストが画像に表示される場合テキストが表示される条件で処理を分岐条件付きブロックを開始する
OCRを使ってテキストを抽出画像や画面内のテキストを取得するテキストデータを変数に保存

よくある質問

Q1: OCRの精度を上げる方法はありますか?
A1: 高品質の画像を使用し、OCRエンジンで対応している言語を正しく設定してください。

Q2: 日本語のテキストも認識できますか?
A2: はい、対応するOCRエンジンで日本語を選択することで認識できます。

Q3: OCRが正しく動作しない場合はどうすればいいですか?
A3: 使用しているOCRエンジンの設定や画像の解像度、文字のコントラストを確認してください。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

目次