OCR 文字识别

从图片和 PDF 文件中提取文字

拖拽图片或PDF到这里或点击上传

使用说明

OCR 文字识别使用指南

本工具使用 Tesseract.js 从图片和 PDF 文件中提取文字。 完全在浏览器中运行,无需上传文件到服务器。

使用方法:

  1. 上传或拖拽图片/PDF文件
  2. 等待 OCR 处理完成
  3. 复制提取的文字

支持的格式:

  • 图片:PNG、JPEG/JPG、BMP、GIF(仅第一帧)
  • PDF 文档(会处理所有页面)

文件大小限制:

  • 每个文件最大 10MB

使用技巧:

  • 为获得最佳效果,请使用清晰且对比度良好的图片
  • 文字应该对齐且不变形
  • 对于 PDF,请确保文字不是以图片形式扫描的
  • 支持的语言:中文、英文、日文