WindowsでWebページからリンクを抽出する方法

さまざまな目的(インターネット調査、Web開発、セキュリティ評価、Webページのテストなど)のために、Webページのリンク(URL)を抽出する必要がある場合があります。 この記事では、WindowsでWebページまたはHTMLドキュメントからリンクを抽出する方法について説明します。

WindowsでWebページからリンクを抽出する方法

WebページのURLを抽出する方法はいくつかあります。 Webブラウザーの開発者ツールセクションを使用して、ネイティブな方法から始めましょう。

Webブラウザーの開発者ツールを使用する

  1. Chrome for Firefoxを開き、最初にWebサイトまたはWebページにアクセスします。
  2. F12キーを押して、[開発者ツール]ウィンドウを開きます。
  3. 開発者ツールの[コンソール]タブをクリックします。
  4. コンソールのクリア (Chromeの場合)またはWebコンソールの出力のクリア (Firefoxの場合)ボタンをクリックして、 コンソール出力をクリアします。
  5. コンソールプロンプトで次のコードを入力します。
     Array.prototype.slice.call(document.querySelectorAll( 'a')、0).forEach((a、i)=> console.log( `#$ {i + 1}-$ {a.innerText}- $ {a.href} `)); 

これにより、コンソールウィンドウのタイトルとともに、そのWebページ内のリンクの順序付きリストが出力されます。

シリアル番号またはタイトルテキストなしでURLのみを取得する場合は、次のコマンドを使用します。

 urls = $$( 'a'); (urls in urls)console.log(urls [url] .href); 

出力をメモ帳にコピーして保存します。


PowerShellの使用

PowerShellを起動し、次のコマンドライン構文を使用します。

 (Invoke-WebRequest -Uri "//www.winhelponline.com/blog").Links.Href | Sort-Object | Get-Unique | グリッドビュー 

これにより、指定されたWebページ内のリンクのリストが取得され、リストがグリッドビューコントロールに出力されます。

このPowerShellコマンドのもう1つの利点は、エントリを並べ替え、コレクションから重複したURLを削除することです。

グリッドビューコントロールを使用すると、URLキーのキーワード検索をフィルター処理したり、Ctrl + Cを使用してリストをクリップボードにコピーしたりできます。

タイトルとURLを取得

対応するリンクまたはURLに加えてinnerTextを表示するには、次のコマンドを実行します。

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href-ユニーク| Format-List innerText、href 

次のような出力が得られます。

重複するURLは出力から自動的に削除されます。

| clipを使用して、出力をクリップボードに自動的にコピーすることもできます| clip | clipパラメータ:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href-ユニーク| Format-List innerText、href | クリップ 

画像のURLのみを取得

画像URLのリストを抽出するには、次の構文を使用します。

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Images | Select-Object src 


NirsoftのAddrViewを使用する

NirsoftのAddrViewツールは、特定のWebページまたはローカルHTMLファイルからリンク(画像リンクを含む)を自動的に抽出し、それをグリッドビューにリストします。

タイプで結果を並べ替え、画像のURLのみをクリップボードにコピーするか、ファイルに保存することもできます。

画像リンクのみを取得したい場合は、Firefoxの組み込みの[ページ情報表示 ]オプションを使用できます。 Firefoxで、現在のWebページを右クリックし、[ ページ情報の表示 ]→[メディア]をクリックします。[メディア]タブには、 data:imageリンクを含むすべての画像URLが一覧data:imageます。 選択したアイテムまたはすべてのアイテムをクリップボードにコピーしたり、エントリをファイルに保存したりできます。

上記の方法以外にも、ChromeやFirefoxなどのブラウザーには、ブラウザーで現在アクティブなWebページからURLまたは画像リンクを取得する多くの拡張機能やアドオンがあります。

関連記事