<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ja">
	<id>https://monobook.org/w/index.php?action=history&amp;feed=atom&amp;title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B</id>
	<title>MonoでPDFからテキストを抽出する - 版の履歴</title>
	<link rel="self" type="application/atom+xml" href="https://monobook.org/w/index.php?action=history&amp;feed=atom&amp;title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B"/>
	<link rel="alternate" type="text/html" href="https://monobook.org/w/index.php?title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&amp;action=history"/>
	<updated>2026-06-05T18:18:08Z</updated>
	<subtitle>このウィキのこのページに関する変更履歴</subtitle>
	<generator>MediaWiki 1.42.1</generator>
	<entry>
		<id>https://monobook.org/w/index.php?title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&amp;diff=13965&amp;oldid=prev</id>
		<title>Administrator: Administrator がページ「Mono/PDFからテキストを抽出する」を「MonoでPDFからテキストを抽出する」に移動しました</title>
		<link rel="alternate" type="text/html" href="https://monobook.org/w/index.php?title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&amp;diff=13965&amp;oldid=prev"/>
		<updated>2020-12-23T03:09:29Z</updated>

		<summary type="html">&lt;p&gt;Administrator がページ「&lt;a href=&quot;/wiki/Mono/PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&quot; class=&quot;mw-redirect&quot; title=&quot;Mono/PDFからテキストを抽出する&quot;&gt;Mono/PDFからテキストを抽出する&lt;/a&gt;」を「&lt;a href=&quot;/wiki/Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&quot; title=&quot;MonoでPDFからテキストを抽出する&quot;&gt;MonoでPDFからテキストを抽出する&lt;/a&gt;」に移動しました&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ja&quot;&gt;
				&lt;td colspan=&quot;1&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← 古い版&lt;/td&gt;
				&lt;td colspan=&quot;1&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;2020年12月23日 (水) 03:09時点における版&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-notice&quot; lang=&quot;ja&quot;&gt;&lt;div class=&quot;mw-diff-empty&quot;&gt;(相違点なし)&lt;/div&gt;
&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;</summary>
		<author><name>Administrator</name></author>
	</entry>
	<entry>
		<id>https://monobook.org/w/index.php?title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&amp;diff=6641&amp;oldid=prev</id>
		<title>153.220.18.74: ページの作成:「PDFからテキストを抽出したい。  ==実装例1== iTextSharpでテキストの抽出も出来るようだ。 新規にPDFを生成するだけだと思って...」</title>
		<link rel="alternate" type="text/html" href="https://monobook.org/w/index.php?title=Mono%E3%81%A7PDF%E3%81%8B%E3%82%89%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B&amp;diff=6641&amp;oldid=prev"/>
		<updated>2015-01-30T01:37:49Z</updated>

		<summary type="html">&lt;p&gt;ページの作成:「&lt;a href=&quot;/w/index.php?title=PDF&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;「PDF」 (存在しないページ)&quot;&gt;PDF&lt;/a&gt;からテキストを抽出したい。  ==実装例1== iTextSharpでテキストの抽出も出来るようだ。 新規にPDFを生成するだけだと思って...」&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新規ページ&lt;/b&gt;&lt;/p&gt;&lt;div&gt;[[PDF]]からテキストを抽出したい。&lt;br /&gt;
&lt;br /&gt;
==実装例1==&lt;br /&gt;
iTextSharpでテキストの抽出も出来るようだ。&lt;br /&gt;
新規にPDFを生成するだけだと思っていたよ。&lt;br /&gt;
すごいぞiTextSharp。&lt;br /&gt;
&lt;br /&gt;
[[Mac]]上の[[Xamarin Studio]]で[[NuGet]]から[[iTextSharp]]を入れて試してみたが[[Mono]]でも問題なく動くようだ。&lt;br /&gt;
今のところ互換性問題やプラットフォーム依存はないと思われるので[[MonoMac]]なんかでも大丈夫だと思う。&lt;br /&gt;
&lt;br /&gt;
&amp;lt;source lang=&amp;quot;csharp&amp;quot;&amp;gt;&lt;br /&gt;
    using System;&lt;br /&gt;
    using System.IO;&lt;br /&gt;
    using System.Linq;&lt;br /&gt;
&lt;br /&gt;
    using iTextSharp;&lt;br /&gt;
    using iTextSharp.text;&lt;br /&gt;
    using iTextSharp.text.pdf;&lt;br /&gt;
    using iTextSharp.text.pdf.parser;&lt;br /&gt;
&lt;br /&gt;
    class MainClass&lt;br /&gt;
    {&lt;br /&gt;
        public static void Main(string[] args)&lt;br /&gt;
        {&lt;br /&gt;
            var filename = &amp;quot;test.pdf&amp;quot;;&lt;br /&gt;
&lt;br /&gt;
            using (var pdfReader = new PdfReader(filename))&lt;br /&gt;
            {&lt;br /&gt;
                var strategy = new SimpleTextExtractionStrategy();&lt;br /&gt;
&lt;br /&gt;
                for (int pageNum = 1; pageNum &amp;lt;= pdfReader.NumberOfPages; pageNum++)&lt;br /&gt;
                {&lt;br /&gt;
                    // １ページまるごとテキスト化&lt;br /&gt;
                    var text = PdfTextExtractor.GetTextFromPage(pdfReader, pageNum, strategy);&lt;br /&gt;
&lt;br /&gt;
                    // 行単位に分割&lt;br /&gt;
                    var lines = text.Split(&amp;#039;\n&amp;#039;);&lt;br /&gt;
                    for (int lineNum = 1; lineNum &amp;lt;= lines.Length; lineNum++)&lt;br /&gt;
                    {&lt;br /&gt;
                        var line = lines[lineNum - 1];&lt;br /&gt;
                        Console.WriteLine(&amp;quot;{0:D2}:{1:D2}|{2}&amp;quot;, pageNum, lineNum, line);&lt;br /&gt;
                    }&lt;br /&gt;
                }&lt;br /&gt;
            }&lt;br /&gt;
        }&lt;br /&gt;
    }&lt;br /&gt;
&amp;lt;/source&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[category:Mono]]&lt;/div&gt;</summary>
		<author><name>153.220.18.74</name></author>
	</entry>
</feed>