帖文详情
@dotey@x.good.news
谢谢整理,不介意的话我发一下基于你图片整理的文字版的:
PDF转Markdown 方案选型
1. document-convert(开源):t.co/D2Y7mm886i
2. Ragflow(开源):t.co/WD37nopgN9
3. gptpdf(开源):t.co/DwasbujNU4
4. 百度云Textmind(闭源):t.co/NLZXdeHEsE
5. doc2x(闭源):t.co/SpwZz5qrtb
6. 腾讯云文档解析(闭源):https://t.co/A5oZFhBbE6
7. marker(开源):https://t.co/UI3w2R9eQ4
8. PDF-Extract-Kit(开源):https://t.co/1C863X9L7v
9. zerox(开源):https://t.co/1m4ONttSAw
10. OminiParse(开源):https://t.co/dE7cVwXRkn
11. MinerU(开源):https://t.co/MJQlh7rUDz
评估方法:
- 评估指标:人工评估
- 评估数据集:
* 数字PDF:论文、财报(含图片、表格和文字)
* 扫描PDF:书籍(含图片、表格和文字)、模拟试卷、水印文档、教辅习题、复杂合并单元格表格、财报图片格式(含复杂表格)、含图片的表格。