TGS-RAG behauptet 80 % Tokenreduktion gegenüber LightRAG bei höherer Genauigkeit

Forscher der Southeast University Nanjing haben TGS-RAG (Text-Graph Synergy RAG) veröffentlicht – ein hybrides Retrieval-Framework, das für HotpotQA ca. 217M verbrauchte Tokens gegenüber ca. 757M bei LightRAG und ca. 646M bei GraphRAG ausweist, eine Reduktion von ca. 70–80 %. Gleichzeitig wird die höchste Genauigkeit im Benchmark-Vergleich gemeldet. Die zentrale Innovation: Graph-Pruning per Beam-Search wird als „in den Speicher verschieben" statt als Löschen behandelt, sodass der Vektor-Retrieval-Kanal verworfene Graph-Knoten wieder aktivieren kann, wenn spätere textuelle Belege auf sie hinweisen. Der Mechanismus vermeidet neue Datenbankabfragen beim Orphan-Bridging-Schritt – hier akkumulieren sich die Token-Einsparungen.

Einordnung

Eine 3- bis 4-fache Kostenreduktion bei gleicher oder besserer Genauigkeit ist eine Pareto-Verbesserung – der unternehmerische Fall für TGS-RAG gegenüber LightRAG/GraphRAG ist eindeutig, wenn sich die Ergebnisse replizieren lassen. Der Infrastruktur-Footprint (pgvector, 0,6B-Qwen-Embedding, einzelner 32-GB-Linux-Server) liest sich zudem als bewusstes „Bau-es-selbst"-Signal.