Power Automate Desktopを使えば、ノーコードでWebページからデータを抽出(スクレイピング)して、Excelに出力することができます。今回は、書籍情報が一覧表示されたサイトを例に、ページ内のデータを複数ページ分抽出し、整理された表形式でExcelに保存する方法を、手順を追ってわかりやすく解説します。
目次
1. フローの作成と準備
ステップ1:新しいフローを作成
- Power Automate Desktopを起動し、「新しいフロー」を作成します。
- 名前は「Webスクレイピングサンプル」としましょう。
ステップ2:ブラウザを起動
- 左側の「ブラウザー自動化」セクションから「新しいMicrosoft Edgeを起動」を選びます。
- 起動時に表示するページのURLに、データを取得したいサイトのURLを貼り付けます(例:https://sample-book-site.com)。
- 「保存」をクリック。
2. Webデータの抽出設定
ステップ3:Webページからデータを抽出する
- 「Webデータ抽出」→「Webページからデータを抽出する」を追加。
- 自動的にデータ抽出ウィザードが起動するので、Edgeに表示された書籍一覧ページで、以下を右クリックして設定します。
抽出対象の設定方法:
- 書籍タイトル:タイトルの部分を右クリック→「要素の値を抽出」→「タイトル属性を抽出」
- 価格:価格が表示されている箇所を右クリック→「テキストを抽出」
- 在庫情報:同様に在庫部分を右クリック→「テキストを抽出」
📝 ポイント: タイトルが省略表示されている場合、アンカータグの「title属性」から正確なタイトルを取得できます。
ステップ4:データ列名の編集
- 表示されているプレビューの列名をクリックして以下のように変更します。
- Title →
タイトル - Price →
価格 - Stock →
在庫状況
- Title →
3. ページングの設定(複数ページ対応)
ステップ5:次ページへのリンクを設定
- ページ下部の「Next」ボタンを右クリック→「要素をページャーとして設定」
- 詳細設定を開くと、CSSセレクターが自動で設定されているのが確認できます。
ステップ6:最大ページ数の指定
- 「処理するWebページの最大数」を「3」と指定(必要に応じて調整可)
4. データをExcelに出力
ステップ7:Excelを起動
- 「Excel」→「Excelの起動」を追加。
- 「空のドキュメントを使用」にチェックを入れて保存。
ステップ8:ヘッダー情報の書き込み
- 「Excelワークシートに書き込む」を追加。
- 「書き込む値」に以下を設定:
['ネーム', '価格', '在庫状況', 'タイトル']
- 出力場所:セル「A1」
ステップ9:抽出データの出力
- もう1つ「Excelワークシートに書き込む」を追加。
- 「書き込む値」→変数
DataFromWebPageを選択。 - 出力場所:セル「A2」
5. 実行と確認
ステップ10:フローを実行
- 実行すると、指定されたWebページが開き、ページングしながらデータを抽出。
- Excelに以下のような形で出力されます:
| ネーム | 価格 | 在庫状況 | タイトル |
|---|---|---|---|
| Python入門書 | ¥2,980 | 在庫あり | Pythonプログラミング入門 2025年版 |
| AI基礎ガイド | ¥3,480 | 在庫なし | 人工知能概論 |
よくある質問(FAQ)
Q1: データ抽出がうまくいかないときは?
A: 要素の選択ミスが原因の場合があります。正しい部分(例えば、アンカータグのtitle属性など)を再確認しましょう。
Q2: ページ数を増やしたい場合はどうすればいい?
A: 「処理するWebページの最大数」を増やせば、さらに多くのページを巡回してくれます。
Q3: Excelに書き込むデータの列がずれることがあるのはなぜ?
A: Webサイトの構造が変わっていたり、取得対象の要素が一部非表示になっている場合があります。事前にページを確認しておきましょう。
