Begriffe

Big Data: Big Data wird als eine grosse Menge an Daten aus vielfältigen Quellen definiert, die mit Hilfe neu entwickelter Methoden und Technologien erfasst, verteilt, gespeichert, durchsucht, analysiert und visualisiert werden können (Horvath, 2013). Big Data entsteht also dadurch, dass viele einzelne Datenquellen miteinander verknüpft werden. Aus diesen verknüpften Datenquellen können dann Analysen, Prognosen, Visualisierungen und vieles weitere erstellt werden. Durch die Verknüpfung sind Schlussfolgerungen möglich, die nur mit der Betrachtung der einzelnen Datenquellen nicht ersichtlich wären. Ein weiteres Merkmal von Big Data ist die Grösse. Galten bis vor kurzem noch Terabytes als Mass für grosses Datenvolumen, so ist man heute bereits bei Petabytes, Exabytes und Zettabytes (Klausnitzer, 2013). Wer sich nicht genau vorstellen kann, wie gross Petabyte etc. sind, sei der Artikel 1,8 Zettabyt: Studie prophezeit Datenberge und Bit-Seen empfohlen (Spiegel Online).

Big Data wird in verschiedenen Quellen, unter anderem in Klausnitzer (2014), mit vier V’s beschrieben:

  • Volume: Umfang und Grösser der Daten.
  • Velocity: Schnelligkeit in der Verfügbarkeit und Bearbeitbarkeit der Daten.
  • Variety: Verschiedenartigkeit der Daten, z. B. strukturierte und unstrukturierte Daten, Text und Multimedia.
  • Veracity: Richtigkeit der Daten, d. h. es gibt bei Big Data immer die Ungewissheit wegen möglicher Inkonstistenz oder Unvollständigkeit der Daten.

Dashcam: Eine Dashcam ist eine Kamera, die an den Windschutzscheiben von Autos installiert wird. Sie zeichnen den vor dem Auto liegenden Bereich auf.

Data Mining: Data Mining (dt. Datenbergbau) bedeutet gemäss Duden die automatische Auswertung grosser Datenmengen zur Bestimmung bestimmter Regelmässigkeiten, Gesetzmässigkeiten und verborgener Zusammenhänge.

Persönlich identifizierenden Daten: Der Begriff „Persönlich identifizierende Daten“ ist sehr schwammig definiert. Als persönlich identifizierend gelten Datensets, die die genaue Identifikation einer Person ermöglichen (Davis 2012). Die alleinige Angabe einer Adresse gilt nicht per se als identifizierend. Nehmen wir zum Beispiel an sie erhalten folgendes Datenset A: männlich, 14 Jahre alt, klein, schwarzes zerzaustes Haar, runde Brille, Narbe auf der Stirn, wohnt am Ligusterweg 4. Diese mögen für Sie keinerlei Sinn ergeben. Es sei denn, Sie können es mit folgendem Datenset B verknüpfen: Harry Potter, blitzförmige Narbe auf der Stirn, wohnt am Ligusterweg 4. Datenset A per Definition nicht persönlich identifizierend. In Kombination mit Datenset B ist es aber persönlich identifizieren. Der Begriff „nicht persönlich identifizierend“ ist daher mit Vorsicht zu geniessen.

Quantified-Self: Mitglieder der Quantified-Self Bewegung vermessen mithilfe moderner Technik ihr gesamtes Leben. Nähere Informationen finden Sie im Blog unserer Kommilitoninnen.

2 Antworten zu Begriffe

  1. Pingback: Big Data ist ethisch neutral – Big Data Anwendungen sind es nicht | About Big Data

  2. Pingback: Brauchen wir ein Datenrecht? | About Big Data

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s