差分

ナビゲーションに移動 検索に移動

Tesseract-OCR

821 バイト追加, 2018年8月28日 (火) 04:12
ページの作成:「'''Tesseract OCR'''とは、オープンソースOCRエンジンである。 もともとはヒューレット・パッカードが1984年から商用販...」
'''Tesseract OCR'''とは、[[オープンソース]]の[[OCRエンジン]]である。

もともとは[[ヒューレット・パッカード]]が1984年から商用販売していたもので、1984年に発明された[[アルゴリズム]]が採用されている。いわゆる最近流行りの[[機械学習]]で文字認識する系ではない。

30ヶ国語以上に対応し日本語も認識できる。

2005年に[[オープンソース]]化された。直後から[[Google]]の中の人が殺到してガシガシ改造を始めた。

[[Windows]]でも[[Mac OS]]でも[[Linux]]でも[[Android]]などほとんどの[[OS]]で動く。本体は[[C++]]で書かれているが、様々な[[プログラミング言語]]から呼び出せる。[[Xamarin.Android]]などでもちょっと遅いけど動く。
匿名利用者

案内メニュー