InftyReader

日本語・英語混在文に強いOCRソフト、数式を含む理系文書もOK、結果は LaTeX, MathML, Word2007等

今すぐダウンロード

InftyReader詳細

InftyReader は、印刷物をスキャンした画像から、文字認識を行い、電子文字データにするOCRソフトです。
印刷文書を電子化するためのOCRは、たくさん出ていますが、InftyReader は、従来、文字認識が難しいとされている、数式構文や画像が混在するような文書も、認識できるように、研究開発されました。
また、1行中に日本語と英語(欧文)の部分が混在している場合でも、高精度な認識結果が得られます。

PDF ファイルを認識して LaTeX や Word などの編集可能なデータに変換することもできます。

結果は、さまざまな形式に出力でき、LaTeXのソースファイル、HTML(数式部分はMathML)、XML(MS WORD2007に対応)、また、Texから数式記号などを除いた Human Readable TeXにも保存できるので、多様な目的に対応します。
さらに、数学用文書エディタ InftyEditor (http://www.sciaccess.net/jp/InftyEditor)
と組み合わせることにより、スキャンした画像と認識結果を同時に表示して、認識結果を修正・編集することが容易に行えます。
その後、InftyEditorからも、同様にLaTeX、HTML(MathML)、XML(MS WORD2007に対応)、PDFなどに出力できるので、OCR結果を確実に利用することができます。

日本語部分の認識には国内の2つのトップメーカーの認識エンジンを組み合わせて用いていますので、最高認識結果を得ることができるようになっています。
また、英語やフランス語などの欧文の認識には3つのOCRエンジンが用いられる贅沢な仕様になっています。

文書中の図などは、画像として文書中に保存されます。

これまでに約20万ページに及ぶ数学専門論文誌の電子化実績をもち、数学特有の文字記号や、複雑な構文の数式にも、高い認識率を実現しました。

日本語と英語の部分を自動で抽出し、それぞれ専用のOCRエンジンを呼びだしていますので、日英混在分でも認識率が下がることがありません。
語学の教材やテストなどのような文書の認識にも力を発揮します。

今までのOCRで満足できなかった方にも、是非、試していただきたいソフトです。

Leave a Reply

メールアドレスが公開されることはありません。 が付いている欄は必須項目です