こんにちは!
今日は Power Automate Desktop (PAD) を使って「Webページのデータを自動で取ってくる」方法をご紹介します。
📌 今回学べること
- ページをまたいでデータを自動で集める
- 必要な情報だけを抜き出す方法(正規表現)
- フローを分けて整理する「サブフロー」の使い方
「毎回コピペしてるのが大変…」という方にはピッタリの内容です!
目次
1. 複数ページのデータを取ってくるには?
Webページの一覧は、1ページに全部表示されるとは限りません。
例えば「検索結果が100件」で、1ページに10件ずつ表示される場合、10ページ分のデータをまとめて取る必要があります。
PADではとても簡単で、
- 「Extract data from web page」アクションを追加
- 表を選択して「HTML Table全体を抽出」を選ぶ
- ページ送りボタンを右クリック → 「Set element as pager」 を設定
これだけで、PADが自動で「次のページ」へ進みながら、すべてのデータを集めてくれます。
2. 不要なデータを除いて必要な情報だけ抽出する
表の中には、欲しい情報以外の文字が含まれていることもあります。
たとえば「数字だけ欲しい」のに、文字や記号も入ってしまうケースです。
そんなときに便利なのが 正規表現(Regex) です。
例:数字だけを取る場合
\d+
このルールを設定すると、表から 数字(IDやコードなど)だけ を自動で抜き出すことができます。
👉 よくある使い方
- 郵便番号だけを抽出
- 顧客IDや商品コードだけを取得
- 電話番号だけを残す
3. フローを整理して分かりやすくする「サブフロー」
フローを作っていると「ログインする処理」と「データを取る処理」が混ざってしまい、長くなりがちです。
そんなときに役立つのが サブフロー です。
- メインフロー … ログインや初期設定をまとめる
- サブフロー … データ取得などの繰り返し使う処理をまとめる
- 「Run Subflow」アクションで呼び出す
こうすることで「どこで何をしているか」が分かりやすくなり、後から修正もしやすくなります。
4. 実際にやってみると…
今回の流れを組み合わせると、こんなことができます👇
- ログインして「データ一覧ページ」に移動
- ページを自動で切り替えながら全データを取得
- Regexを使って「数字だけ」を抽出
- Excelに保存(94行×6列のデータになった例も!)
人が何時間もかけてコピー&ペーストしていた作業を、PADが数分で終わらせてくれます。
まとめ
- 複数ページ対応 → 「Set element as pager」で解決
- 必要な値だけ抽出 → Regexでフィルタリング
- 分かりやすく保守しやすく → サブフローで整理
最初は「ちょっと難しそう…」と思うかもしれませんが、
1ページ分だけ取ってみる → Regexで絞ってみる → ページを増やしてみる
と少しずつ進めると、すぐに使いこなせるようになりますよ!
