Dieses Event wurde zuerst auf unserer Community Plattform gepostet. Dort trefft Ihr auf Menschen aus der Zivilgesellschaft, mit denen Ihr Euch zum Thema Daten für das Gemeinwohl austauschen könnt. Ob themenspezifisch, bilateral, allgemein: Hier könnt Ihr Euch informieren, vernetzen und aktiv werden – stets unterstützt vom Community Team des Civic Data Lab. Werdet jetzt Teil der Community und meldet Euch im Workspace an!

Experiment: Können wir Barcamp-Sessions mit Sprachmodellen besser dokumentieren?
Wir wollen verschiedene Transkriptions, LLM Experimente zusammentragen, um zu sehen welche Tools vielversprechend sind.
Notizen vom ersten Treffen 👇
Termin 15.04.
Anwesend: Jenny, Damian, Julius, Lena
1. Problemstellung & Zielsetzung
-
Dokumentation bei Barcamps oft lästig – dokumentierende Person kann nicht richtig teilnehmen
-
Ziel: smarter Weg über Einsatz von Sprachmodellen
-
Großes Interesse, eine sinnvolle Dokumentationsform zu finden
-
Herausforderungen: Datenschutz muss beachtet werden, nur EU-gehostete Tools
-
Wichtig: Auswirkungen der Aufzeichnung auf Teilnehmende mitdenken
2. Rahmenbedingungen & Anforderungen
-
Doku soll nicht zwingend am selben Tag fertig sein – kein Zeitdruck
-
Fokus auf Nachbereitung → Möglichkeit, über Prompts gute Ergebnisse zu erzielen
-
Soll möglichst wenig mit Barcamp-Ablauf interferieren
-
Ergänzend zur klassischen Dokumentation
-
Session-Zusammenfassungen im Plenum durch Teilnehmende bleiben bestehen
-
Consent der Teilnehmenden nötig? → Klärung, ob schriftlich erforderlich
-
Transparenz:
-
Audio wird nicht angehört, nur maschinell verarbeitet
-
Keine Namen im Endprodukt
3. Technisches Konzept & Setup
-
Idee: ein Raum mit Technik-Setup für Audioaufzeichnung (voraussichtlich der kleinere Session-Raum)
-
Dort gezielt Sessions einplanen, die sich für das Experiment eignen
-
Keine Frontalvorträge oder Workshops, in denen mehrere Kleingruppen arbeiten
-
Fokus auf Diskussionsformate/Roundtables mit Beteiligung aller
-
Herausforderung: leise Sprecher:innen werden schlecht erkannt → muss technisch abgefangen werden
-
Hochwertige Audiofiles sind Voraussetzung
-
Handys grundsätzlich geeignet, aber:
-
mehrere Einzelaufnahmen nötig
-
hoher Aufwand beim Zusammenführen
4. Tools & Erfahrungen
-
Damian: Transkription oft schlecht, LLM glättet erstaunlich gut
-
Tool-Vorschlag: Argdown (https://argdown.org/sandbox/map)
-
Ziel: Argumente strukturiert und nachvollziehbar darstellen
-
Idee von Damian, aber: aufwendig & nicht für jede Diskussion geeignet
-
Damian: Sprecher:innen-Erkennung besonders wichtig bei Diskussionen
-
Parrot Park
-
Gehostet von CorrelAid und D64
-
Keine Transkription, aber Weiterverarbeitung von Transkripten möglich
-
Frage: Gibt’s eine API?
-
Whisper
-
Julius hat Erfahrung → öfter Kauderwelsch
-
Damian möchte Whishper testen (https://whishper.net/)
-
Jenny: Apple Voice Memo ausprobiert – besser als OLLAMA
-
Tools für Übersetzung:
5. Datenschutz & Akzeptanz
-
Datenschutzkritisch: besonders der Teil, wo Audio verarbeitet wird
-
Bedenken: Aufzeichnungsraum könnte Teilnahme für manche einschränken
-
Gefahr: Teilnahme nur mit Aufzeichnung → intransparent
-
Idee: Umfrage auf Humhub, um Akzeptanz und Bereitschaft vorab einzuschätzen
6. Nächste Schritte / Orga
-
In den nächsten 2 Wochen Transkribierungstools testen
-
Julius stellt über GitHub eine absichtlich schlechte Audio zur Verfügung → Test mit versch. Tools
-
Ziel: Transkribieren + Zusammenfassen ausprobieren
-
Lena fragt nach guten Mikros → Gibt es welche bei GI? Caritas? Wo ist aktuell unser Podcast-Equipment?
-
Beim Barcamp Jenny und Damian versuchen früher zur Location zu kommen
nächster Termin: 29.04., 16:00 Uhr