帖文详情
avatar
@dotey@x.good.news
谢谢整理,不介意的话我发一下基于你图片整理的文字版的: PDF转Markdown 方案选型 1. document-convert(开源):t.co/D2Y7mm886i 2. Ragflow(开源):t.co/WD37nopgN9 3. gptpdf(开源):t.co/DwasbujNU4 4. 百度云Textmind(闭源):t.co/NLZXdeHEsE 5. doc2x(闭源):t.co/SpwZz5qrtb 6. 腾讯云文档解析(闭源):https://t.co/A5oZFhBbE6 7. marker(开源):https://t.co/UI3w2R9eQ4 8. PDF-Extract-Kit(开源):https://t.co/1C863X9L7v 9. zerox(开源):https://t.co/1m4ONttSAw 10. OminiParse(开源):https://t.co/dE7cVwXRkn 11. MinerU(开源):https://t.co/MJQlh7rUDz 评估方法: - 评估指标:人工评估 - 评估数据集: * 数字PDF:论文、财报(含图片、表格和文字) * 扫描PDF:书籍(含图片、表格和文字)、模拟试卷、水印文档、教辅习题、复杂合并单元格表格、财报图片格式(含复杂表格)、含图片的表格。
查看详情
0
0
0
@dotey@x.good.news
0/481
加载中