「Html Agility Pack」を編集中

ナビゲーションに移動 検索に移動

警告: ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。ログインまたはアカウントを作成すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。

この編集を取り消せます。 下記の差分を確認して、本当に取り消していいか検証してください。よろしければ変更を保存して取り消しを完了してください。

最新版 編集中の文章
1行目: 1行目:
'''Html Agility Pack'''とは、主に[[ウェブスクレイピング]]に用いられる[[.NET]]向けの[[オープンソース]]の[[ライブラリ]]である。
+
'''Html Agility Pack'''とは、主に[[ウェブスクレイピング]]に用いられる[[オープンソース]]の[[ライブラリ]]である。
  
 
==概要==
 
==概要==
6行目: 6行目:
 
これにより[[XPath]]や[[LINQ to XML]]といった汎用的な手法を用いて解析できるようになる。
 
これにより[[XPath]]や[[LINQ to XML]]といった汎用的な手法を用いて解析できるようになる。
  
Html Agility Packにはウェブページを取得するメソッドも用意されているが、あくまで簡易的なものでありキャッシュ機能などもなく[[文字コード]]の判別が弱いなどの問題を抱えている。[[ウェブクローラー]]的なものを目指すのであれば、独自でHTMLを取得し、[[ReadJEnc]]を用いるなどして別途実装した方がいいだろう。
+
Html Agility Packにはウェブページを取得するメソッドも用意されているが、あくまで簡易的なものでありキャッシュ機能などもなく[[文字コード]]の判別が弱いなどの問題を抱えている。
 +
[[ウェブクローラー]]的なものを目指すのであれば、独自でHTMLを取得し、[[ReadJEnc]]を用いるなどして別途実装した方がいいだろう。
  
 
==使い方==
 
==使い方==
===環境を構築する===
+
===環境を構築する==
 
* [[NuGet]] = https://www.nuget.org/packages/HtmlAgilityPack
 
* [[NuGet]] = https://www.nuget.org/packages/HtmlAgilityPack
 
* [[ソースコード]] = http://htmlagilitypack.codeplex.com
 
* [[ソースコード]] = http://htmlagilitypack.codeplex.com

MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細はMonoBook:著作権を参照)。 著作権保護されている作品は、許諾なしに投稿しないでください!

このページを編集するには、下記の確認用の質問に回答してください (詳細):

取り消し 編集の仕方 (新しいウィンドウで開きます)

このページで使用されているテンプレート:

このページは 1 個の隠しカテゴリに属しています: