差分

ナビゲーションに移動 検索に移動

Html Agility Pack

17 バイト追加, 2015年5月14日 (木) 01:24
編集の要約なし
'''Html Agility Pack'''とは、主に[[ウェブスクレイピング]]に用いられる[[.NET]]向けの[[オープンソース]]の[[ライブラリ]]である。
==概要==
これにより[[XPath]]や[[LINQ to XML]]といった汎用的な手法を用いて解析できるようになる。
Html Agility Packにはウェブページを取得するメソッドも用意されているが、あくまで簡易的なものでありキャッシュ機能などもなく[[文字コード]]の判別が弱いなどの問題を抱えている。[[ウェブクローラー]]的なものを目指すのであれば、独自でHTMLを取得し、[[ReadJEnc]]を用いるなどして別途実装した方がいいだろう。
==使い方==
===環境を構築する===
* [[NuGet]] = https://www.nuget.org/packages/HtmlAgilityPack
* [[ソースコード]] = http://htmlagilitypack.codeplex.com
匿名利用者

案内メニュー