差分
ナビゲーションに移動
検索に移動
'''Tesseract OCR'''とは、[[オープンソース]]の[[OCRエンジン]]である。
もともとは[[ヒューレット・パッカード]]が1984年から商用販売していたもので、1984年に発明された[[アルゴリズム]]が採用されている。いわゆる最近流行りの[[機械学習]]で文字認識する系ではない。
30ヶ国語以上に対応し日本語も認識できる。
2005年に[[オープンソース]]化された。直後から[[Google]]の中の人が殺到してガシガシ改造を始めた。
[[Windows]]でも[[Mac OS]]でも[[Linux]]でも[[Android]]などほとんどの[[OS]]で動く。本体は[[C++]]で書かれているが、様々な[[プログラミング言語]]から呼び出せる。[[Xamarin.Android]]などでもちょっと遅いけど動く。
もともとは[[ヒューレット・パッカード]]が1984年から商用販売していたもので、1984年に発明された[[アルゴリズム]]が採用されている。いわゆる最近流行りの[[機械学習]]で文字認識する系ではない。
30ヶ国語以上に対応し日本語も認識できる。
2005年に[[オープンソース]]化された。直後から[[Google]]の中の人が殺到してガシガシ改造を始めた。
[[Windows]]でも[[Mac OS]]でも[[Linux]]でも[[Android]]などほとんどの[[OS]]で動く。本体は[[C++]]で書かれているが、様々な[[プログラミング言語]]から呼び出せる。[[Xamarin.Android]]などでもちょっと遅いけど動く。