OCRコンバーターについて
Convert.Guru は、25年以上にわたり維持・更新されてきた、世界最大級かつ信頼性の高いファイル形式データベースの一つを基盤としています。 当社の形式判定機能は、OCR を高い精度で識別します。ファイル名が誤っている場合や破損している場合でも対応し、一般的な形式へ変換できます。OCR コンバーターは登録やインストール不要で、ブラウザ上でそのまま利用できます。 アップロードされたファイルは、変換後に自動的に削除されます。
スキャン済みテキストファイル (OCR) からテキストを抽出
.OCRファイルは非常に断片化されており、その出所によって複数の異なる目的で機能する。主に、Canadian Armed Forces (CAF)(カナダ軍)の内部管理メッセージや軍の配置命令に使用される。民間部門では、通常、光学式文字認識(OCR)ソフトウェアの中間データファイルとして生成される。例としては、Adobe Acrobatに関連付けられたOCR処理済みPDFドキュメント、Subtitle Workshop用のOCRスクリプトファイル、またはNuance Communicationsによる従来のFAXGrapperファックステキストファイルなどが挙げられる。
.OCRフォーマットの主な欠点は、標準化されていないことだ。一般的な.OCRファイルは、独自の軍事データベースエントリ、スキャナーからの生のテキストダンプ、または特殊な字幕スクリプトのいずれかである可能性がある。この断片化により、ファイルをダブルクリックしても正しいアプリケーションで開かれることは稀であり、専用ソフトウェアには高価なサブスクリプションや時代遅れのハードウェアが必要になる。抽出されたテキストを読んだり、共有したり、編集したりするには、通常、これらのファイルを.PDF、.TXT、.DOCXなどの標準フォーマットに変換する必要がある。字幕のバリアントは、多くの場合、標準の.SRTや.VTTに変換される。
標準的なオンラインコンバーターは、全く異なるファイルタイプのどれを処理しているかを正確に推測できないため、.OCRファイルの処理に失敗することがよくある。CAFの管理メッセージのような独自のフォーマットは、閉鎖的な政府の内部システムに依存しているため、開くのが特に困難だ。しかし、convert.guruは現実的な回避策を提供する。ファイルをドラッグ&ドロップするだけで、フォーマットを識別し、表示し、可能な場合は変換できる。私たちのシステムは内部のファイルシグネチャを検査して、埋め込まれたテキストや基礎となるデータを表示し、アプリケーションのロックインを回避するのに役立つ。
Convert.Guru はOCRファイルを分析し、正確な形式を検出して、中のテキストを読めるようにします。
ほかのユーザーは PDF, DOCX, DOC, SSA, PY, AU3 ファイルも変換しました。
OCR ファイルを PDF, TXT, RTF, DOC, DOCX, ODT, PAGES, TEX, LATEX, MD, MARKDOWN または LOG に変換したい場合は、Adobe Acrobat または「テキストおよびデータストレージ」カテゴリの同様のソフトウェアを使用できます。[ファイル] メニューで 名前を付けて保存… または エクスポート… を探してください。
PDF, DOC, ASC, TODO, NFO, MEMO, README, DOCX, JPG, TXT, NOTE または RTF ファイルを OCR に変換するには、Adobe Acrobat または「テキストおよびデータストレージ」カテゴリの他の同等のツールを試してください。
Convert.Guru は、25年以上にわたり維持・更新されてきた、世界最大級かつ信頼性の高いファイル形式データベースの一つを基盤としています。 当社の形式判定機能は、OCR を高い精度で識別します。ファイル名が誤っている場合や破損している場合でも対応し、一般的な形式へ変換できます。OCR コンバーターは登録やインストール不要で、ブラウザ上でそのまま利用できます。 アップロードされたファイルは、変換後に自動的に削除されます。