Power Automate Desktop(PAD)を使えば、PDFファイルの処理を自動化できます。PDFからテキストや画像を抽出したり、ページを切り出したり、複数のPDFを結合したり することで、業務の効率を劇的に向上させることができます。
本記事では、以下の 5つのPDFアクション を初心者向けに詳しく解説します。
- PDFからテキストを抽出する
- PDFから画像を抽出する
- PDFの特定のページを切り出す
- 複数のPDFを1つにマージする
- PDFのデータをExcelに保存する
目次
① PDFからテキストを抽出する
できること
- PDF内の文字データを取得し、Excelやテキストファイルに保存できる
- 手入力の手間を省き、正確なデータ管理ができる
手順
- Power Automate Desktopを開く
- 「新しいフローを作成」をクリックし、名前を入力して作成
- PDFファイルを選択
- 「PDFのテキストを抽出」アクションを追加
- 抽出したいPDFファイルを指定
- 「すべてのページ」または「特定のページ」を選択
- 抽出データを変数に格納
PDFテキストという変数を作成し、抽出したデータを格納
- Excelに書き込む(オプション)
- 「Excelのワークシートに書き込み」アクションを追加
- セル
A1に%PDFテキスト%を入力
- フローを実行し、テキストを確認
💡 ポイント
- テキストが画像として埋め込まれている場合はOCR(光学文字認識)ツールが必要
- 「検索」機能と組み合わせれば、特定のキーワードを含む行のみを抽出可能
② PDFから画像を抽出する
できること
- PDF内の画像を自動で抽出し、指定フォルダーに保存できる
- 画像データを管理しやすくなる
手順
- PDFを開く
- 「PDFの画像を抽出」アクションを追加
- 抽出したいPDFファイルを指定
- 画像を保存するフォルダーを指定
- 抽出画像の保存先フォルダーを
C:\Users\〇〇\Desktop\ExtractedImages\に設定
- 抽出画像の保存先フォルダーを
- フローを実行し、フォルダーを確認
💡 ポイント
- 画像が複数ある場合、連番 (
image_1.jpg,image_2.jpgなど) で保存される - 「繰り返し処理」と組み合わせると、複数のPDFから自動で画像を取得可能
③ PDFの特定のページを切り出す
できること
- 必要なページだけを抽出し、新しいPDFとして保存できる
- 重要な部分だけを整理し、管理しやすくなる
手順
- PDFを開く
- 「PDFのページを抽出」アクションを追加
- 元のPDFファイルを指定
- 抽出したいページ範囲を設定
- 例:
2-4(2ページ目から4ページ目を抽出)
- 例:
- 保存先を指定
- 新しいPDFファイルの保存先を指定(例:
C:\Users\〇〇\Desktop\ExtractedPages.pdf)
- 新しいPDFファイルの保存先を指定(例:
- フローを実行し、PDFが正しく抽出されているか確認
💡 ポイント
- 「条件分岐」と組み合わせれば、ページ数によって異なる処理を設定可能
- 毎月の請求書やレポートから特定のページだけ抽出する用途に最適
④ 複数のPDFを1つにマージする
できること
- バラバラのPDFを1つにまとめ、1つのファイルとして管理できる
- 契約書や報告書を1つのファイルに統合できる
手順
- マージするPDFを指定
- 「PDFをマージ」アクションを追加
- 複数のPDFファイル(
file1.pdf,file2.pdfなど)を指定
- 保存先を設定
- マージ後のPDFの保存先を指定(例:
C:\Users\〇〇\Desktop\MergedFile.pdf)
- マージ後のPDFの保存先を指定(例:
- フローを実行し、PDFが結合されているか確認
💡 ポイント
- ファイル名の規則を決めておくと、後から整理しやすい
- 「ファイルを取得」アクションと組み合わせて、フォルダー内のすべてのPDFを自動でマージ可能
⑤ PDFのデータをExcelに保存する
できること
- PDF内の表データを抽出し、Excelに保存できる
- 契約書、請求書、注文書などのデータを自動整理できる
手順
- PDFを開く
- 「PDFのテキストを抽出」アクションを追加し、テキストを取得
- データを整形する(オプション)
- 「テキストの分割」アクションを使用し、データを
,(カンマ)やTABで区切る
- 「テキストの分割」アクションを使用し、データを
- Excelに書き込む
- 「Excelのワークシートに書き込み」アクションを追加
- セル
A1から順番にデータを入力
- Excelを保存・閉じる
- 「Excelを保存」アクションを追加
- 「Excelを閉じる」アクションを追加
💡 ポイント
- 「データテーブルを作成」アクションと組み合わせると、表形式のデータをきれいに整理できる
- OCRツールと組み合わせれば、スキャンされたPDFからデータを抽出することも可能
Q&A(よくある質問)
Q1. PDFのテキスト抽出で、文字化けしてしまう場合は?
A:
- PDFが「画像形式」の場合、OCRツールを使用する必要があります
- 別のPDFリーダーで開き、手動でコピーできるか確認してください
Q2. 画像抽出がうまくいかない場合は?
A:
- PDFの形式によっては画像が埋め込まれていない可能性があります
- 「PDFを画像に変換」アクションを使って、ページごとに画像化する方法も検討
Q3. 特定のページだけを抽出したいが、範囲指定ができない場合は?
A:
- ページ番号は 1から始まる数値 で指定する必要があります
- 「PDFのページ数を取得」アクションを使って、動的に範囲を指定可能
Q4. マージしたPDFのページ順を変更したい場合は?
A:
- マージするPDFの順番を ファイル名の昇順や降順 に変更すると解決する場合があります
- 「ファイルを取得」アクションで、順番に並べて取得すると設定しやすくなります
Q5. PDFのデータをExcelに書き込む際、フォーマットが崩れてしまう場合は?
A:
- 「テキストの分割」アクションで、カンマやタブ区切り で分割すると整形しやすくなります
- Excelの「書式設定」を事前に調整し、適切な列幅やフォントを設定することも有効です
