Datenlebenszyklus

In wenigen Schritten mit Daten zu aussagekräftigen Ergebnissen? Der Datenlebenszyklus gibt Euch einen Überblick: von der Planung bis zur Umsetzung. Klickt Euch durch die einzelnen Schritte und erfahrt, was bei der Verarbeitung von Daten wichtig ist.

Daten organisieren

Daten zu verwalten und zu bereinigen ist ein zentraler Schritt für einen verantwortungsvollen Umgang mit Daten. Macht Euch Gedanken über Tools und Vorgaben.

  • Wie verwalte ich die Daten?
  • Wie bereinige ich die Daten?
  • Welche Tools nutze ich für die Verwaltung meiner Daten?
  • Wie manage ich die Daten DSGVO-konform?
  • Wie organisiere ich meine Daten nachhaltig?
  • Wo speichere ich die Daten?
  • Wie sichere ich meine Daten gegen Missbrauch, Diebstahl oder Verlust ab?
  • Welche (ethischen) Kriterien sind für die Bereinigung wichtig?
  • Welche Vorschriften zur Bereinigung gibt es seitens meiner Organisation?
  • Welche Tools nutze ich für die Bereinigung meiner Daten?
Übergangswelle

Kompetenzlevel

Ihr möchtet wissen, wo Ihr steht und wie Ihr weiterlernen könnt? Schätzt Eure Vorerfahrung anhand der drei Level ein und erhaltet Lernempfehlungen, um ins nächste Level aufzusteigen.

  • Verwaltet Daten teilweise analog oder in unterschiedlichen und schlecht maschinenlesbaren Dateiformaten
  • Hat erste Erfahrung im Umgang mit Tabellentools (z.B.  Excel) und kann Daten in einer Tabelle speichern
  • Verwaltet die Daten an dezentralen Orten, die für andere schwer zugänglich sind
  • Verwendet Daten so weiter, wie sie von sich aus vorliegen: hat kein kritisches Bewusstsein dafür, dass vorliegende Daten überprüft, bereinigt oder normalisiert werden müssen.

Unsere Lernempfehlungen

  • Verwaltet Daten digital, kann verschiedene Datensätze und -quellen zusammenfügen
  • hat Bewusstsein, dass Daten in anderen Formaten vorliegen und ggf. konvertiert werden müssen
  • Hat erste Erfahrungen in der Verwaltung und Pflege von Datenbanken
  • kann Daten auf Basis grundlegender Qualitätskriterien bereinigen z.B. Vollständigkeit, Lesbarkeit, Duplikate, extreme Ausreißer und macht dies manuell z.B. in Excel

Unsere Lernempfehlungen

  • Verwaltet  Daten zentral und kann sich um eine geeignete Dateninfrastruktur kümmern
  • kann Datenquellen verknüpfen und Daten selbstsicher in unterschiedlichen Tools und Systemen verwalten z.B. Datenbanken
  • kann auch aus schlecht maschinenlesbaren Dateiformaten (z.B. Text, Bild) mit Hilfe von technischen Methoden Informationen rausziehen, z.B. Topic Modeling, Labeling
  • weiß, dass Daten normalisiert werden müssen, um Vergleichbarkeit zwischen verschiedenen Datenquellen sicherzustellen.
  • kann bei der Bereinigung auf unterschiedliche  Datenqualitätskriterien achten z.B. maschinell bearbeitbare, leere Felder, einheitliche und vollständige Spalten und Zeilen, Ausreißer und verwendet Tools zur Unterstützung der Datenreinigung (z.B. Open Refine, R); kann anspruchsvolle String-Manipulation und automatisierte Reinigung von Daten z.B. mit Skript anwenden.
  • denkt im Datenbereinigungsprozess schon ganzheitlich spätere Schritte der Datenverarbeitung mit

Unsere Lernempfehlungen