PflegeLotse
DSGVO-konformer RAG-Assistent für das Pflege-Recht (SGB XI) — quellenbelegte Antworten, konversationell mit Streaming, Anti-Halluzination und Eval-Harness. Live.
Problem & Kontext
Pflege-Recht ist komplex — und Antworten müssen belegbar sein
Pflegedienste und Angehörige verlieren Zeit mit der Suche im SGB XI. Ein generischer Chatbot halluziniert — bei Rechtsfragen inakzeptabel. Gebraucht wird ein Assistent, der NUR aus dem Gesetzestext antwortet, jede Aussage mit Quelle belegt und bei Unsicherheit ehrlich abbricht.
Lösung
Retrieval-Augmented Generation mit striktem Grounding
§-genaues Chunking, Retrieval über pgvector und ein Grounding-Prompt: jede Aussage wird mit dem Paragraphen belegt, bei zu schwachem Treffer bricht das System ehrlich ab (Abstention statt Halluzination). Konversationell mit Verlauf (Rückfragen) und Token-für-Token-Streaming — ohne das Grounding aufzugeben.
Architektur
Clean Architecture, vier Schichten
Entities, Ports & Regeln — framework-frei
Use-Cases: Ingest, Answer, Konversation+Streaming
pgvector, mistral-embed / E5, Mistral/Ollama
FastAPI + Jinja2/HTMX + SSE-Streaming
Process History
Vom Plan zum Deploy — sechs Phasen
- 01
Setup & Architektur
FERTIGClean-Architecture-Gerüst, Docker, CI (ruff + mypy --strict + pytest). ADR-0001: Python/HTMX statt Next.js.
- 02
Daten & Ingestion
FERTIGSGB XI (gemeinfrei) geparst, §-genau gechunkt (235 §§), Embeddings → pgvector. § + Titel im Embedding hob den Recall messbar.
- 03
Retrieval & Grounding
FERTIGRetrieval über pgvector, quellenbelegte Antworten, Abstention-Schwelle (Score < 0.78) — keine Halluzination.
- 04
Eval-Harness
FERTIGGolden-Set (26 Fälle), Recall@k, Abstention-Accuracy und Latenz gemessen — messbar statt „gefühlt".
- 05
Konversation, Streaming & UI
FERTIGJinja2/HTMX + SSE: Verlauf (Rückfragen via Query-Rewriting), Token-für-Token-Antwort, Quellen-Panel, Cookie-Banner (TDDDG), BFSG/WCAG, Disclaimer (RDG).
- 06
Deploy & Doku
FERTIGLive auf eigenem VPS via Traefik (Auto-HTTPS), leichtes Image (mistral-embed, kein torch). Projektdokumentation + Design-Präsentation öffentlich.
Ergebnisse
Messbar gemacht
Gemessen gegen ein Golden-Set (26 Fälle). Details in der Projektdokumentation.
Stack & Compliance
DSGVO & EU-AI-Act: keine personenbezogenen Daten, EU- oder lokales LLM, Quellenangabe statt frei generierter Aussagen. Disclaimer: keine Rechtsberatung (RDG).