告别复杂公式,PDF轻松转Markdown!OCR+GPT-4,让转换更智能!
##PDF OCR 转换工具这是一个将 PDF 文件转换为 Markdown 格式的 OCR 工具。它使用 OpenAI 模型(例如 GPT-4)识别 PDF 中的文本和公式,并将它们转换为 Markdown 和 LaTeX 格式。
**功能:**
* 将 PDF 文件转换为图像
* 使用 OCR 识别图像中的文本和公式
* 将识别结果转换为 Markdown 和 LaTeX 格式
* 支持批量处理多个 PDF 文件
* 使用图形界面选择输入和输出文件夹
**安装依赖:**
```bash
pip install asyncio aiohttp PyMuPDF tkinter
```
**配置:**
* `API_BASE_URL`: OpenAI API 基础 URL
* `api_key`: 你的 OpenAI API 密钥
* `MODEL`: 使用的 OpenAI 模型名称(例如:“gpt-4”)
**使用方法:**
1. 运行程序:`python script_name.py`
2. 选择包含 PDF 文件的输入文件夹
3. 选择保存转换结果的输出文件夹
4. 程序将开始处理 PDF 文件并显示进度
**注意事项:**
* 程序使用异步处理来提高效率,可以同时处理多个页面。
* 如果处理过程中出现错误,程序会自动重试。
* 输出文件将以原 PDF 文件名保存为 `.md` 格式。
* 如果输出文件已存在,程序将跳过处理该文件。
**限制:**
* 程序依赖于 OpenAI 的 API,请确保你有足够的 API 使用额度。
* OCR 识别的准确性取决于 PDF 的质量和模型的性能。
* 处理大型 PDF 文件可能需要较长时间。
**效果:**
GPT-4 模型的效果最好,基本没什么错误。Gemini 1.5 Pro 次之,其他模型未测试。
页:
[1]