Themenblog künstliche Intelligenz

Part 4 Big Data

Big Data bezeichnet Datenmengen, die ein Ausmaß haben, welches mit herkömmlicher Hardware oder Software nicht handhabbar sind. Es sind Daten im Tera (1012)- oder Zettabytebereich (1021).

 

  • Anlagenstatus

Im Wesentlichen wird Big Data durch 4 Merkmale gekennzeichnet, die auch 4 V’s genannt werden:

- Volume (scale of data/ Masse): Hiermit sind der Datenbestand bzw. die Datensätze und Files gemeint. Dieser ist sehr umfangreich und nimmt in der heutigen Zeit mit rasender Geschwindigkeit zu.

- Variety (diversity of data/ Vielfalt): Die Datenvielfalt spielt hierbei eine wichtige Rolle: So sind es nicht nur Textdokumente die als Daten abgespeichert werden. Es sind Multimediadaten, die entweder bereits strukturiert, unstrukturiert oder teilweise strukturiert sind. Dazu gehören alle Arten von Daten: Grafiken, Texte, Videos, Bilder und auch Audiodateien. Durch die Sozialen Medien kommen täglich zahlreiche Tweets und Blogeinträge hinzu und auch die Kommunikation zwischen verschiedenen Maschinen tragen dazu bei, dass das Volume immer größer wird.

- Velocity (speed of data/ Geschwindigkeit): Die große Menge an Daten erfordert es, mit hoher Geschwindigkeit verarbeitet zu werden. Die Data Streams (Datenflüsse) werden in Echtzeit aufgezeichnet, ausgewertet und sofort analysiert.

- Value (benefit of data/ Nutzen): Durch die Nutzung von Big Data soll ein Mehrwert für das Unternehmen entstehen.

Häufig findet man in der Literatur auch ein fünftes V. Dies steht für Veracity (certainty of data/ Richtigkeit) und bedeutet, dass die Aussagekraft mancher Daten oftmals ungenau ist. Es werden also Algorithmen und Bewertungen notwendig um sichere Ergebnisse zu bekommen. Es ist ein Erkennen von Zusammenhängen und Mustern notwendig um daraus Vorhersagen zu treffen oder Modelle zu generieren. Ein Werkzeug hierfür ist das Data Mining.

Wenn von Big Data die Rede ist, dann meint dies meistens nicht nur den Datenbestand an sich, sondern auch die Analyse dieser Daten. Ein Bespiel hierfür sind die Kaufempfehlung in Onlineshops. „Andere Kunden kauften auch…“ oder „Dies könnte Sie auch interessieren…“. Hier spielen Big Data und auch Künstliche Intelligenz schon zusammen, ohne dass der Benutzer dies als KI wahrnimmt. Das Kaufverhalten einer Vielzahl von Kunden wird in Echtzeit analysiert und mit dem eigenen Profil verglichen.