OCR テキスト認識

画像とPDFファイルからテキストを抽出

ここに画像またはPDFをドロップまたはクリックしてアップロード

使い方

OCR テキスト認識ガイド

このツールは Tesseract.js を使用して画像とPDFファイルからテキストを抽出します。 完全にブラウザ内で実行され、ファイルをサーバーにアップロードする必要はありません。

使用方法:

  1. 画像/PDFファイルをアップロードまたはドラッグ&ドロップ
  2. OCR 処理が完了するまで待機
  3. 抽出されたテキストをコピー

対応フォーマット:

  • 画像:PNG、JPEG/JPG、BMP、GIF(最初のフレームのみ)
  • PDFドキュメント(すべてのページが処理されます)

ファイルサイズ制限:

  • 1ファイルあたり最大10MB

ヒント:

  • 最良の結果を得るには、コントラストの良い鮮明な画像を使用
  • テキストは整列していて歪みがないこと
  • PDFの場合、テキストが画像としてスキャンされていないことを確認
  • 対応言語:日本語、英語、中国語