Du kan inte välja fler än 25 ämnen Ämnen måste starta med en bokstav eller siffra, kan innehålla bindestreck ('-') och vara max 35 tecken långa.
zhudongwork 10432a1be7
Refa: Optimize pptx shape extraction to reduce content loss (#6703)
6 månader sedan
..
resume Fix:when start with source code not in docker env report 'UnicodeDec… (#5802) 7 månader sedan
__init__.py Update comments (#4569) 9 månader sedan
docx_parser.py Update comments (#4569) 9 månader sedan
excel_parser.py Fix: When Excel is a formula, the parsed result is a formula, but cannot be correctly parsed as a value type (#6613) 7 månader sedan
figure_parser.py Feat: add VLM-boosted DocX parser (#6307) 7 månader sedan
html_parser.py Update comments (#4569) 9 månader sedan
json_parser.py Update comments (#4569) 9 månader sedan
markdown_parser.py Feat:Optimize the table extraction logic in the Markdown parser: (#5663) 8 månader sedan
pdf_parser.py fix RAGFlowPdfParser AttributeError: 'PdfReader' object has no attribute 'close' err (#6859) 6 månader sedan
ppt_parser.py Refa: Optimize pptx shape extraction to reduce content loss (#6703) 6 månader sedan
txt_parser.py Fix: delimiter issue. (#5720) 8 månader sedan
utils.py Update comments (#4569) 9 månader sedan