OCRしてみよう！

電脳硬化症気味な日記です。まとまった情報は wiki にあります。

2010.1.25 (Monday)

at 21:26

　iPod touch + skybookで通勤時等に読むことができるよう、手持ちのPDF形式の小説ファイルを、「青空文庫形式」のテキストに変換したいと思いつきました。
　最近の一般ピーポー向けOCRの状況はどんなもんじゃい？ってことで。。。

[Adobe Acrobat 8.0でPaper Capture]
　ん～、何の工夫もなく、文庫本を1000x1400pixel程度のjpg画像にscanしたPDFを喰わせてみたところ、認識率は、利用可能なレベルではありませんでした。ん～。

[いきなりPDF to Data]
　上記と同じPDFファイル(400ページ程度)を喰わせてみたところ、インジケータが半分も進まないうちに、「メモリが不足しています。」と言われました。1GBじゃ足りんてか。

　なるほど。思いつきでパッとできる作業では、まだまだ無いってことですか。。。(^^;;

trackback:

リンクはご自由に。ご意見・お問い合わせ・フィードバックはお気軽にメールください。

　当サイトにおいて提供される情報は、真実性、合法性、安全性、適切性、有用性、完全性、正確性について何ら保証するものではありません。利用者はその旨を了承の上、自己の責任において利用するものとし、当該情報に基づく損害、損失についても、当サイトは一切責任を負いません。

This page is created in 0.526 sec.