告别复杂公式，PDF轻松转Markdown！OCR+GPT-4，让转换更智能！

admin 发表于 2024-8-24 16:54:39

告别复杂公式，PDF轻松转Markdown！OCR+GPT-4，让转换更智能！

##PDF OCR 转换工具
这是一个将 PDF 文件转换为 Markdown 格式的 OCR 工具。它使用 OpenAI 模型（例如 GPT-4）识别 PDF 中的文本和公式，并将它们转换为 Markdown 和 LaTeX 格式。
**功能:**
* 将 PDF 文件转换为图像
* 使用 OCR 识别图像中的文本和公式
* 将识别结果转换为 Markdown 和 LaTeX 格式
* 支持批量处理多个 PDF 文件
* 使用图形界面选择输入和输出文件夹
**安装依赖:**
```bash
pip install asyncio aiohttp PyMuPDF tkinter
```
**配置:**
* `API_BASE_URL`: OpenAI API 基础 URL
* `api_key`: 你的 OpenAI API 密钥
* `MODEL`: 使用的 OpenAI 模型名称（例如：“gpt-4”）
**使用方法:**
1. 运行程序：`python script_name.py`
2. 选择包含 PDF 文件的输入文件夹
3. 选择保存转换结果的输出文件夹
4. 程序将开始处理 PDF 文件并显示进度
**注意事项:**
* 程序使用异步处理来提高效率，可以同时处理多个页面。
* 如果处理过程中出现错误，程序会自动重试。
* 输出文件将以原 PDF 文件名保存为 `.md` 格式。
* 如果输出文件已存在，程序将跳过处理该文件。
**限制:**
* 程序依赖于 OpenAI 的 API，请确保你有足够的 API 使用额度。
* OCR 识别的准确性取决于 PDF 的质量和模型的性能。
* 处理大型 PDF 文件可能需要较长时间。
**效果:**
GPT-4 模型的效果最好，基本没什么错误。Gemini 1.5 Pro 次之，其他模型未测试。

页: [1]

一元网络论坛's Archiver

告别复杂公式，PDF轻松转Markdown！OCR+GPT-4，让转换更智能！