LiteParse v2 veröffentlicht: Open-Source-PDF-Parser in Rust mit 100-facher Geschwindigkeit

LlamaIndex hat LiteParse v2 veröffentlicht — einen vollständigen Rust-Rewrite seiner Dokumenten-Parser-Bibliothek, der bis zu 100-fache Geschwindigkeit und Sub-Sekunden-Verarbeitung für Dokumente bis zu 450 Seiten und 100 MB erzielt. Die Bibliothek unterstützt mehr als 50 Dokumenttypen, kompiliert zu WASM für den Einsatz in Browser- und Edge-Runtimes und bietet native Bindings für Python, TypeScript, Rust und WASM. Das Repository überschritt beim Launch 5.000 GitHub-Sterne; eine Integration für wissenschaftliche Agenten-Workflows — lokales PDF-Parsing mit zitierfähigen Quellen und OCR für gescannte Paper — wurde zeitgleich von K-Dense AI veröffentlicht.

Warum das relevant ist

Schnelles, lokales Dokumenten-Parsing in mehreren Formaten ist eine Grundvoraussetzung für jede produktive RAG- oder Document-Intelligence-Pipeline. LiteParse v2s WASM-Unterstützung macht es zur ersten ernsthaften browsernnativen Option und erweitert Document-AI auf Edge- und Offline-Anwendungsfälle.