**Für mehr Mitgestaltung an Schulen – Zugang zu Wissen für Schüler*innenvertretungen erleichtern**

Das Civic Data Lab unterstützte Schule ein Gesicht geben e.V. bei der Entwicklung eines RAG-Chatbots, der Schüler*innen, Lehrkräften und Begleiter*innen von Schüler*innenvertretungen den Zugang zu Informationsmaterialien über Mitbestimmung im Schulalltag erleichtert. So gelingt Wissensmanagement für Schülervertretungen per Chatbot.

Abgeschlossen
Datenanwendung
Chatbot
Open Source

Der Verein Schule ein Gesicht geben e.V. unterstützt Schulen dabei, zu einem Ort von Mitgestaltung, Mitbestimmung und einem lebendigen Schulalltag zu werden. Trotz umfangreicher Ressourcen auf der Webseite meinsvwissen.de finden Schüler*innen oft nicht die passenden Informationen – sei es wegen unterschiedlicher Wortwahl zwischen Fach- und Alltagssprache, unpassender Strukturierung oder fehlendem Wissen über mögliche Lösungsansätze.

Das Civic Data Lab unterstützte das Team von Schule ein Gesicht geben e.V. von Juli bis November 2025 bei der Entwicklung eines Chatbots, der Schüler*innen, aber auch Lehrkräften und SV-Begleiter*innen den Zugang zu den vielfältigen Ressourcen auf der Webseite meinsvwissen.de erleichtern soll. Die Wissensgrundlage für die Entwicklung des Chatbots bilden die über Jahre hinweg sorgfältig kuratierten Materialien des Teams von Schule ein Gesicht geben e.V. sowie die Schulgesetze der jeweiligen Bundesländer. Das Ziel des Bots besteht darin, die gestellten Anfragen und die verfügbaren Materialien so miteinander abzugleichen, dass Schüler*innen im besten Fall „ihre Situation aus dem Schulalltag“ in „ihrer Sprache“ schildern können und ihnen passende Ressourcen ausgespielt werden – ohne dass sie die bestehenden Lösungsansätze oder die entsprechenden Fachbegriffe kennen müssen. Dabei werden stets die entsprechenden Quellen angegeben und ein Link zum Download bereitgestellt. Ermöglicht wird diese Funktionalität durch ein an den Chatbot angeschlossenes Large Language Modell (LLM), das durch die wissensgestützte Textgenerierung – auch bekannt als Retrival Augmentet Generation (RAG) – erweitert wurde. (Mehr Infos zur Funktionsweise von RAG und LLMs findet ihr in unserem Selbstlernmaterial.)

Bei der Entwicklung des Chatbots war es stets wichtig zu betonen, dass dieser als eine Art Informationszugangssystem fungiert, d.h. den Zugang zu Wissen, das in Form von SV-Materialien und Gesetzestexten vorliegt, erleichtern soll. Keinesfalls sollte der Bot das Beratungsangebot, das das Team von Schule ein Gesicht geben e.V. für Schüler*innen, Lehrkräfte und SV-Berater*innen bereithält, ersetzen.Vielmehr soll der Chatbot auf die Möglichkeit einer Beratung hinweisen, bspw. wenn Anfragen zu sensiblen Themen wie Rassismus oder Mobbing gestellt werden.

Der Chatbot ist seit Ende November auf meinvswissen.de eingebunden und unterstützt Schüler*innen bei der Suche nach Wissen und Informationen, damit sie sich in Schüler*innenvertretungen demokratisch engagieren können.

Wissensmanagement für Schülervertretungen per Chatbot mit Schule ein Gesicht geben

Ergebnisse

Hier stehen Ergebnisse aus dem Projekt bereit, die Ihr im Sinne der gemeinwohlorientierten Datennutzung weiterverwenden könnt.

Technologien

Web Scraping

Programmiersprache: Python
Packages:
- selenium: für das Web Scraping, um das Verhalten von menschlichen Browser-Unser*innen zu simulieren.
- polars: als Dataframe-Package
- pydantic: für die Validierung
Den Code findet ihr hier: GitHub

Backend

Programmiersprache: Python
Packages:
- langchain und Packages von aureka für Tools und RAG-Funktionen
- quadrant: als Vektor-Datenbank
Den Code findet ihr hier: GitHub

Frontend

Integration in bestehende Webseite meinsvwissen.de (WordPress)
Chatbot-Interface als iframe

Datengrundlage

Materialien von meinsvwissen.de
Gesetzestexte (PDFs) zu Schulformen und bundeslandspezifischen Regulierungen
Publikationen, die auf Zotero gesammelt und organisiert wurden und über die Zotero-API eingebunden werden
Die Daten werden halbjährlich im Backend des LLM-Systems geupdatet.

Kommunikation & Projektmanagement

Nextcloud für Protokolle
Mural für interne Workshops (z.B. zur Anforderungsdefinition)
Google Meet für Online-Meetings

Erkenntnisse

Erkenntnisse zur Erstellung einer Wissensbasis für RAG

Gesetzestexte – die rechtliche Grundlage unseres Zusammenlebens – sind nicht im eigentlichen Sinne als Open Data für die Allgemeinheit zugänglich: Da Bildung Kompetenz der Bundesländer ist, wurden Gesetzestexte aller Bundesländer als Teil der Datengrundlage, auf die der Chatbot zurückgreift, genutzt. Es zeigte sich allerdings, dass die Gesetzestexte nicht einheitlich maschinenlesbar verfügbar sind. Viele Länder betreiben Portale des ursprünglich staatlich getragenen Dienstleisters Juris. (Hier gibt es eine Übersicht über die Portale.) Da die Portale von Juris über keine kostenlose API (Bei „API“ verstehst du nur Bahnhof? – Dann schau in unserem Selbstlernmaterial vorbei!) verfügen, musste auf umständliche Methoden wie das Web Scraping (Du möchtest mehr über „Web Scraping“ erfahren? Dann schau dir unseren Blogpost mit Verlinkung zur Aufzeichnung des Espresso-Talks an.) zurückgegriffen werden.
Einen gemeinsamen Modus der Zusammenarbeit zu finden ist essentiell, um den Überblick zu behalten: Dabei können verschiedene Programme unterstützen, wie z.B. das Literaturverwaltungsprogramm Zotero. Dieses eignet sich sehr gut für die Zusammenarbeit zwischen Programmierer*innen und Domain-Expert*innen, die einen Überblick über vorhandene Literatur haben. Z.B. ermöglicht das Programm, Metadaten zu den hinterlegten Materialien (wie z.B. URLs zu Volltexten) über eine API programmatisch abzurufen. Zusätzlich erlaubt Zotero die Kodierung zusätzlicher Informationen, z.B. für welche Bundesländer eine Publikation gilt, mittels sogenannter Tags. Im Rahmen des Datenvorhabens wurde Zotero für die Systematisierung der Datengrundlage genutzt.

Erkenntnisse zur Entwicklung des Chatbots

Die Datenbasis impliziert die späteren Möglichkeiten des Chatbots – dies sollte bedacht werden: Um die Antworten zu erstellen, die ein Chatbot zur Beantwortung einer Anfrage wiedergibt, gibt es verschiedene Herangehensweisen. Die simpelste Art einer Chatbot-Interaktion ergibt sich aus einer Liste vordefinierter Antworten – wie bei einem FAQ. Dabei dient das Chatbot-Interface lediglich dem konversationellen Charakter der Informationsabfrage. Komplexer wird es schon, wenn dem Chatbot ein LLM vorgeschaltet wird, das auf einer Sammlung von Texten trainiert wurde. Ein Nachteil dieses Vorgehens ist das gelegentliche „Halluzinieren“, d.h. das Erfinden von Antworten, die in der Art nicht im Trainingsdatensatz vorkommen, sondern lediglich erlernten Mustern folgen. Um diesem Problem entgegenzuwirken, kann das LLM um die wissensgestützte Textgenerierung (RAG) erweitert werden. In diesem Fall wird die Antwort aus einer Sammlung vordefinierter Quellen generiert. Einen Schritt weiter gehen die sogenannten „agentischen KI-Systeme“. Dabei werden nicht alle Quellen gleichwertig behandelt, sondern es besteht die Möglichkeit, bestimmte Quellen zum „Lösen“ bestimmter Aufgaben zu verwenden. Im Rahmen des Datenvorhabens, bedeutet ein solches Vorgehen bspw., dass für die Erklärung bestimmter zentraler Begriffe keine Antwort generiert wird, sondern auf einen geprüften Glossareintrag zurückgegriffen wird. Um solche speziellen Funktionalitäten implementieren zu können, müssen diese allerdings bereits bei der Zusammenstellung der Datengrundlage berücksichtigt werden.
User*innen-Tests lohnen sich, um Anwendungen gezielt an den Bedarfen der Nutzenden auszurichten: Bei der Entwicklung von Anwendungen tappt man schnell in die Falle, Vorannahmen zum Verhalten von Nutzer*innen zu treffen, ohne diese im Prozess zu überprüfen. Deshalb sollte man sich immer wieder vor Augen führen, keine stellvertretenden Aussagen zu treffen, sondern User*innen-Tests systematisch in die Entwicklung von Anwendungen zu integrieren und diese möglichst frühzeitig umzusetzen. Im Rahmen des Datenvorhabens wurden Tests mit Schüler*innen, der zentralen Zielgruppe, durchgeführt. Die dabei gewonnenen Anregungen lieferten wertvollen Input zur Verbesserung des Chatbots.
Ein gemeinsames Verständnis von Arbeitsbegriffen kann Missverständnisse und den daraus resultierenden Mehraufwand vermeiden: Es mag banal klingen, aber insb., wenn es um omnipräsente Begrifflichkeiten wie „Chatbot“, „LLM“ und Co. geht, die fälschlicherweise gerne synonym verwendet werden, sollte zu Beginn des Prozesses ein gemeinsames Verständnis geschaffen werden. Das umfasst neben der Frage „Worüber sprechen wir, wenn wir XY sagen?“ auch die Klärung der Funktionsweise, die sich hinter technischen Begriffen verbirgt. Im Rahmen des Datenvorhabens stellte sich als wichtig heraus, zu klären, welche Datenquellen ein LLM wie verarbeiten kann. Denn im Gegensatz zu einem Menschen, der keinen großen Unterschied zwischen Informationen in Fließtext oder in Grafiken macht, ist es für ein LLM ein essentieller Unterschied.

Beteiligte

Schule ein Gesicht geben e.V.

Das Team von Schule ein Gesicht geben e.V. betreibt die Webseite meinsvwissen.de, kuratierte die umfangreiche Ressourcensammlung und brachte inhaltliche sowie pädagogische Expertise in die Entwicklung ein.

Erfahre mehr

aureka UG

Das Team von aureka begleitete als technischer Dienstleister die Entwicklung des LLM-basierten Chatbots. Es brachte Expertise aus dem eigenen Projekt „Lupai“ ein, das ebenfalls zum Ziel hat, komplexe Informationen zugänglicher zu machen – in ihrem Fall im Bereich der Migrationsberatung.

Erfahre mehr

Civic Data Lab Team

Das Civic Data Lab Team übernahm die Zusammenstellung und Aufbereitung der Wissensbasis sowie die Koordination der Zusammenarbeit zwischen Dienstleister und dem Team von Schule ein Gesicht geben e.V.

Aus dem Projektverlauf:

Juli 2025: Kickoff und Formulierung der Anforderungen
Juli – Oktober 2025: Anpassung des existierenden Lupai RAG-Backends, Einbettung neuer Datenquellen, Entwicklung des Frontends, Klärung von Datenschutzfragen
Ende Oktober 2025: User*innen-Tests mit Schüler*innen
Mitte November 2025: Launch des Chatbots