メインメニューを開く

差分

ウェブ・スクレイピング

236 バイト追加, 2022年4月28日 (木) 04:42
'''ウェブ・スクレイピング'''([[英語]]:web scraping)とは、[[ウェブ]]上の[[HTML]]などから機械的に[[データ]]を抜き出すことを言う。単にスクレイピングと呼ばれることも多い。を抜き出すことを言う。単に「スクレイピング」と呼ばれることも多い。
==概要==
===Ruby===
*[[Nokogiri]]
 
===.NET===
*[[AngleSharp]]
*: 最近の流行りらしい。
*[[Html Agility Pack]]
*:かなり精度は高い。手軽。並列処理にも強い。
*[[GeckoFX]]
*:[[Firefox]]そのもの。そのものを利用する。[[iOS]]や[[Android]]のアプリ開発で頻出する[[WebView]]に類似するもので、[[HTML5]]かつほぼ[[JavaScript]]だけで描画を行っているページですら完璧にぶっこ抜くことが出来てしまう。 === その他 ===* [[Selenium]]*: あらゆる[[言語]]に[[移植]]されているぞ。速度と[[メモリリーク]]させ無視できるなら無敵だ。
==関連項目==