Zugang zu Wissen für Schüler*innenvertretungen erleichtern

Das Civic Data Lab unterstützte Schule ein Gesicht geben e.V. bei der Entwicklung eines LLM-basierten Informationszugangssystems, das Schüler*innen, Lehrkräften und Begleiter*innen von Schüler*innenvertretungen den Zugang zu  Informationsmaterialien über Mitbestimmung im Schulalltag erleichtert.


  • Abgeschlossen
  • Datenanwendung
  • LLM-basiert
  • Open Source

Der Verein Schule ein Gesicht geben e.V. unterstützt Schulen dabei, zu einem Ort von Mitgestaltung, Mitbestimmung und einem lebendigen Schulalltag zu werden. Trotz umfangreicher Ressourcen auf der Webseite meinsvwissen.de finden Schüler*innen oft nicht die passenden Informationen – sei es wegen unterschiedlicher Wortwahl zwischen Fach- und Alltagssprache, unpassender Strukturierung oder fehlendem Wissen über mögliche Lösungsansätze.

Das Civic Data Lab unterstützte das Team von Schule ein Gesicht geben e.V. von Juli  bis November 2025 bei der Entwicklung eines LLM-basierten Informationszugangssystems in Form eines Chatbots. Das CDL übernahm die Zusammenstellung und Aufbereitung der Wissensbasis unter anderem durch Webscraping sowie die Koordination der Zusammenarbeit des Dienstleisters mit Schule ein Gesicht geben. Der Chatbot ist seit Ende November auf meinvswissen.de eingebunden und unterstützt Schüler*innen bei der Suche nach Wissen und Informationen, um sich in Schülervertretungen demokratisch zu engagieren.

Übergangswelle

Technologien

  • Programmiersprache: Python
  • LLM-Framework: langchain und packages von aureka (siehe GitHub)
  • Integration in bestehende Webseite meinsvwissen.de (WordPress)
  • Chatbot-Interface als iframe
  • Materialien von meinsvwissen.de
  • Gesetzestexte (PDFs) zu Schulformen und bundeslandspezifischen Regulierungen
  • Publikationen, die auf Zotero gesammelt und organisiert wurden wurden und über die Zotero-API eingebunden werden
  • Die Daten werden halbjährlich im Backend des LLM-Systems geupdatet
Übergangswelle

Erkenntnisse

Erkenntnisse zur Herstellung einer Wissensbasis für RAG

  • Gesetzesgrundlagen stammen aus allen Bundesländern und es stellte sich heraus, das Gesetze nicht einheitlich maschinenlesbar verfügbar sind. Viele Länder betreiben Portale von Juris, die keine kostenlose API haben. Hier gibt es eine Übersicht über die Portale. Es benötigt sehr viele „hacky“ Umwege, um automatisiert an die aktuellen Gesetzestexte zu kommen. Gesetzestexte sind somit nicht wirklich Open Data.
  • Zotero eignet sich sehr gut für die Zusammenarbeit mit Domain-Expert:innen, die einen Überblick über vorhandene Literatur haben. Metadaten zu Material, wie die URL zu Volltexten, lässt sich leicht aus Collections auf Zotero über eine API ziehen. Über Tags lassen sich zusätzliche Informationen, wie z.B. für welche Bundesländer eine Publikation gilt, kodieren.

Erkenntnisse zur Entwicklung des LLM-basierten Systems

  • Basierend auf der Beschaffenheit der Wissensgrundlage lassen sich spezielle Tools entwickeln, die dem LLM zur Verfügung gestellt werden: z.B. Die Suche nach Begriffen in einem Glossar.
  • User Tests lohnen sich immer: In dem durchgeführten Test mit Schüler:innen empfanden diese die Anwendung als größtenteils hilfreich. Gleichzeitig wurde Input für die Verbesserung geliefert.

Beteiligte

Schule ein Gesicht geben e.V.

Das Team von Schule ein Gesicht geben e.V. betreibt die Webseite meinsvwissen.de, kuratierte die umfangreiche Ressourcensammlung und brachte inhaltliche sowie pädagogische Expertise in die Entwicklung ein.

Erfahre mehr
  • In Konzeption

aureka UG

Das Team von aureka begleitete als technischer Dienstleister die Entwicklung des LLM-basierten Chatbots. Sie brachten Expertise aus ihrem eigenen Projekt Lupai mit, das ebenfalls komplexe Informationen zugänglicher macht – in ihrem Fall im Bereich Migrationsberatung.

Erfahre mehr
Civic Data Lab
  • In Konzeption

Civic Data Lab Team

Das Civic Data Lab Team übernahm die Zusammenstellung und Aufbereitung der Wissensbasis unter anderem durch Webscraping sowie die Koordination der Zusammenarbeit von aureka mit Schule ein Gesicht geben.


Aus dem Projektverlauf:

  • Juli 2025: Kickoff des Datenvorhabens
  • Juli – Oktober 2025: Anpassung des existierenden Lupai RAG-Backends, Einbettung neuer Datenquellen, Entwicklung Frontend, Klärung von Datenschutzfragen
  • Ende Oktober 2025: User Tests mit Schüler*innen
  • Mitte November: Launch des Chatbots
Übergangswelle

Kontakt zum Umsetzungs-Team

Jonas Stetter (er/ihm)

CDL Team Kontakt in HumHub

Nevena Nikolajević (sie/ihr)

CDL Team Kontakt in HumHub