Power AutomateでPDFや画像からテキストを抽出する方法(OCR活用)

  • URLをコピーしました!

「PDFファイルの中の文字をコピペできない…」「スキャンした書類から情報を自動で抜き出したい」
そんな時に便利なのが OCR(光学文字認識) 機能です!

この記事では、Power Automate Desktop を使って、PDFや画像から文字情報を抽出する方法(OCRの使い方) を、ステップごとにやさしく解説します。2024年の最新アップデートに対応しています。


目次

✅ この記事でわかること

  • OCRって何?どんなことができるの?
  • Power Automate DesktopでOCRフローを作成する手順
  • PDFや画像からテキストを取り出して表示する方法
  • よくある質問(エラー対処など)

🔍 OCRって何?

OCR(Optical Character Recognition)とは、画像やPDFなどから 文字らしきものを見つけてテキストとして取り出す技術 のこと。

たとえば、スキャンされた請求書や写真に写っている文字なども、テキストとして扱えるようになります。

Power Automate Desktopでは、画像やPDFファイルをOCRで読み取って、文字として扱うことが可能です。


🛠 操作手順:OCRでPDFの文字を抽出するフローを作ってみよう!

💡シナリオ:PDFの中の請求書から顧客情報を抽出して、画面に表示してみる

✅ Step 1:新しいデスクトップフローを作成する

  1. Power Automate Desktop を起動
  2. 「新しいフロー」をクリック
  3. 任意の名前(例:OCR_PDF_読み取り)を入力して「作成」

✅ Step 2:アクション「OCR でテキストを抽出」を検索して追加

  1. 左側のアクション検索バーに「OCR」と入力
  2. OCR でテキストを抽出」アクションをドラッグしてメインに追加

🔧 設定内容

項目設定内容
OCRエンジンWindows OCR(推奨)または Tesseract OCR
画像ファイルのパス対象のPDFまたは画像ファイルのパスを入力

🔸ファイルのパスは、対象ファイルを右クリック → 「パスのコピー」で簡単に取得できます。


✅ Step 3:抽出したテキストをメッセージボックスで表示する

  1. アクション検索で「メッセージを表示」を追加
  2. タイトル:PDFから抽出したテキスト
  3. メッセージ:先ほどのOCRアクションで取得した変数(例:ExtractedTextなど)を入力

✅ Step 4:フローを実行して確認する

右上の「実行」ボタンを押すと、PDFや画像内の文字が抽出され、メッセージとして表示されます。


🙋‍♀️よくある質問(FAQ)

Q1. OCRエンジンは「Windows」と「Tesseract」のどちらがいいの?

どちらも使用できますが、Windows OCRエンジンの方が安定性が高いとの声もあります。環境やPDFの内容によって最適なものが異なるため、両方試してみるのがおすすめです。


Q2. 手書き文字も認識できますか?

基本的には手書き文字の認識は難しいです。OCRは印刷文字に強く、筆跡やクセのある文字は正確に読み取れないことがあります。


Q3. PDF全体ではなく、一部だけ読み取ることはできますか?

可能です。ただしPower Automate Desktopでは、対象エリアを指定するには追加の画像処理が必要になるため、少し上級者向けです。まずは全文抽出から始めるのがおすすめです。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

目次