Data, code, design | Daten-Visualisierung im Talk

Jeffrey Heer ist Informatiker und durch für Informations-Visualisierungen und interaktive Datenanalyse bekannt.

“David McCandless turns complex data sets, like worldwide military spending, media buzz, and Facebook status updates, into beautiful, simple diagrams that tease out unseen patterns and connections. Good design, he suggests, is the best way to navigate information glut — and it may just change the way we see the world.”
TEDEd

DATA, code, design | Abstrakte Daten-Visualisierung

Ab wann spricht man von abstrakter Daten-Visualisierung?

Um Daten-Visualisierungen, Diagramme, Infografiken etc. „lesen“ zu können, ist es wichtig, dass diese leicht verständlich aufgebaut und visualisiert sind. Hierbei spielt der informative Wert die Hauptrolle, der visuelle Anspruch rückt dabei in den Hintergrund und soll nur die Informationsaufnahme unterstreichen.

Onformative, ein Berliner Studio für digital art and design, zeigt (meiner Interpretation zufolge) ein sehr schönes Projekt für abstrakte Daten-Visualisierung mit dem „4010 Facebook Tree“.
Für dieses Projekt wurden Facebook-Beiträge, des Auftraggebers Telekom flagship store, über vier Jahre verarbeitet und mittels Processing visualisiert. Der 4010 Facebook Tree verarbeitet Interaktionen eines Facebook-Posts, wie Like-Anzahl, Type des Posts, Comment-Anzahl etc. und illustriert diese als organischen Baum/Farn.

From onformative | 4010 Facebook Tree
From onformative | 4010 Facebook Tree
From onformative | 4010 Facebook Tree

Ohne Kontext wirkt diese Illustration sehr komplex und detailreich. Erfährt man die generativen/algorithmischen Regeln dahinter, so ist man in der Lage, diesen Baum auf weitere Ebenen zu entschlüsseln und zu entdecken. Damit unterscheidet sich der Anspruch dieser „data illustration“ von jenem der klassischen Daten-Visualisierung insofern, dass hier der visuelle Teil eine viel höhere Wertigkeit besitzt als die Informationsaufnahme.

Mittels angebrachten QR Codes können LeserInnen den Spalt zwischen Information und Grafik schließen und können die dahinter verarbeiteten Daten eruieren und werden direkt zum Facebook-Post geleitet.

Source

https://onformative.com/
https://onformative.com/work/4010-facebook-tree/

DATA, code, design | Daten

In unserer Zeit sind wir von Daten und Informationen umgeben. Rund um die Uhr werden in jeder Sekunde Daten generiert. Dies veranschaulicht der DOMO report aus dem Jahr 2018:

“Over 2.5 quintillion bytes of data are created every single day, and it’s only going to grow from there. By 2020, it’s estimated that 1.7MB of data will be created every second for every person on earth.”

Via socialmediatoday.com | DOMO, How much data is generated every minute?

Testdaten

Einer der wichtigsten Punkte der Daten-Visualisierung sind die Daten selbst. Um realistische Testdaten zu analysieren wurden folgende Seiten recherchiert:

THE WORLD BANK

Explore. Create. Share: Development Data

DataBank is an analysis and visualisation tool that contains collections of time series data on a variety of topics. You can create your own queries; generate tables, charts, and maps; and easily save, embed, and share them. Enjoy using DataBank and let us know what you think!

THE WORLD BANK bietet eine Vielzahl an Datenbanken und vorgefertigte Report Tools welche die Analyse erleichtern.

Beispiel:

https://databank.worldbank.org/source/gender-statistics

Google Datasetsearch

“Die Datensatzsuche soll Datensätze allgemein zugänglich und nutzbar machen und die folgenden Aufgaben erfüllen:

  • Sie soll ein System schaffen, das die Publisher geteilter Daten dazu motiviert, die Best Practices für Speicherung und Veröffentlichung von Daten anzuwenden
  • Sie soll Wissenschaftlern die Möglichkeit geben, anhand der Zitierung der von ihnen erstellten Datensätze zu zeigen, welche Wirkung ihre Arbeit hat

Da immer mehr Datensatz-Repositories schema.org und ähnliche Standards verwenden, um ihre Datensätze zu beschreiben, werden Nutzer im Laufe der Zeit in der Datensatzsuche zunehmend umfangreichere und vielfältigere Datensätze finden.”

https://datasetsearch.research.google.com/help

Source

https://www.socialmediatoday.com/user_media/diveimage/internet_minute_info2.jpg

https://datasetsearch.research.google.com/help

https://databank.worldbank.org/

DATA, code, design | Klassische Daten-Visualisierungs-Tools

Um Daten zu visualisieren gibt es verschiedene professionelle Tools. Diese werden, je nach Anforderungen kategorisiert. Diese sehr komplexen Tools bieten eine Vielzahl an Report und Visualisierungsmöglichkeiten.

  • Code Tools
  • Visual Reporting or BI
  • Maps
  • Infographic Tool
  • Net-work graphs
  • Large-Screen Visualization

Code Tools

D3.js

Open Source JavScript library mit verschiedenen Visualisierungsmöglichkeiten (HTML, CSS, SVG)

From finereport.com | D3.js

Plotly

From finereport.com | Plotly

gglot2

From finereport.com | ggplot2

Visual Reporting or BI 

Excel

From finereport.com | Excel

FineReport

From finereport.com | FineReport

Tableau

From finereport.com | Tableau

Maps

Leaflet

From finereport.com | Leaflet

Power Map

From support.microsoft.com | PowerMap
From finereport.com | PowerMap

Infographic Tools

Piktochart

From finereport.com | Piktochart

Visme

From finereport.com | visme

Net-work graphs 

Keylines

From finereport.com | Keylines

Gephi

From finereport.com | Gephi

Large-Screen Visualization

Ali DataV

From finereport.com | Ali DataV

Last but not least FineReport itself

From finereport.com | FineReport

Source

https://towardsdatascience.com/top-16-types-of-chart-in-data-visualization-196a76b54b62

DATA, code, design | Klassische Diagrammtypen

Wie schon im vorherigen Blogeintrag beschrieben gibt eine Vielzahl an Diagrammtypen. Manche sind sehr einfach gestaltet, andere wiederum sehr komplex. Jedoch spielt die Verständlichkeit dabei eine viel größere Rolle als Komplexität.

Hier 16 davon:

Column Chart

From towardsdatascience.com | FineReport

Bar Chart

From towardsdatascience.com | FineReport

Line Chart

From towardsdatascience.com | FineReport

Area Chart

From towardsdatascience.com | FineReport

Pie Chart

towardsdatascience.com | FineReport

Scatter Plot

From towardsdatascience.com | FineReport

Bubble Chart

From towardsdatascience.com | FineReport

Gauge

From towardsdatascience.com | FineReport

Radar Chart

From towardsdatascience.com | FineReport

Frame Diagram

From towardsdatascience.com| FineReport

Rectangular Tree Diagram

From towardsdatascience.com| FineReport

Funnel Chart

From towardsdatascience.com| FineReport

Word Cloud Chard

From towardsdatascience.com| FineReport

Gantt Chart

From towardsdatascience.com| FineReport

Regional Map

From towardsdatascience.com| FineReport

Point Map

From towardsdatascience.com| FineReport

Flow Map

From towardsdatascience.com| FineReport

Heatmap

From towardsdatascience.com| FineReport

Soure

https://towardsdatascience.com/top-16-types-of-chart-in-data-visualization-196a76b54b62

DATA, code, design | Daten-Visualisierung, Art + Science = ?

Definitionssuche

„Mit Visualisierung oder Veranschaulichung (Sichtbarmachen) meint man im Allgemeinen, abstrakte Daten (z. B. Texte) und Zusammenhänge in eine graphische bzw. visuell erfassbare Form zu bringen.“
https://de.wikipedia.org/wiki/Visualisierung

Data visualization (often abbreviated data viz[1]) is an interdisciplinary field that deals with the graphic representation of data. It is a particularly efficient way of communicating when the data is numerous as for example a Time Series. From an academic point of view, this representation can be considered as a mapping between the original data (usually numerical) and graphic elements (for example, lines or points in a chart). The mapping determines how the attributes of these elements vary according to the data. In this light, a bar chart is a mapping of the length of a bar to a magnitude of a variable. Since the graphic design of the mapping can adversely affect the readability of a chart,[2] mapping is a core competency of Data visualization. Data visualization has its roots in the field of Statistics and is therefore generally considered a branch of Descriptive Statistics. However, because both design skills and statistical and computing skills are required to visualize effectively, it is argued by some authors that it is both an Art and a Science.[3]
https://en.wikipedia.org/wiki/Data_visualization

Art + Science = Informationdesign?

Als Informations Designer und angehender Communication Designer trifft diese Definition den Nagel für mich auf den Kopf:

Information design is the practice of presenting information in a way that fosters an efficient and effective understanding of the information. The term has come to be used for a specific area of graphic design related to displaying information effectively, rather than just attractively or for artistic expression. Information design is closely related to the field of data visualization and is often taught as part of graphic design courses.[1] The broad applications of information design along with its close connections to other fields of design and communication practices have created some overlap in the definitions of communication design, data visualization, and information architecture.”
https://en.wikipedia.org/wiki/Information_design


Wenn man von solchen multidisziplinär erstellten Diagrammen spricht, spricht man meist von solchen:

  • Line chart  
  • Bar chart
  • Histogram
  • Scatterplot
  • Boxplot
  • Pareto chart
  • Pie chart
  • Area chart
  • Control chart
  • Run chart
  • Stem-and-leaf display
  • Cartogram
  • Small multiple
  • Sparkline
  • Table
  • Marimekko chart

Charles Joseph Minard

Wenn wir von Informationsgrafik sprechen wird oft auf den “Erfinder” Charles Joseph Minard (1781 – 1870) verwiesen. Minard gilt als „a cartographic pioneer in many respects“.

Bereits 1825 studierte Minard Passagierflüsse/Frachtflüsse im Schienenverkehr und hat hierzu Balkendiagramme angefertigt.

Minards erste statistische Grafik

1845 visualisierte Minard die erste und revolutionäre Flow-Map, welche von Edward Tufte als „vermutlich beste Infografik aller Zeiten“ bezeichnet wird. Sie zeigt den Straßenverkehr zwischen Dijon und Mulhouse.

Minards erste Flow-Grafik

Seine Infografik, später bekannt als Sankey diagram, zeigt Napoleons Russlandfeldzug 1812 in der „Carte figurative des pertes successives en hommes de l’Armée Française dans la campagne de Russie 1812–1813

“The original description in French accompanying the map translated to English:[5]
Figurative Map of the successive losses in men of the French Army in the Russian campaign 1812–1813.
Drawn by M. Minard, Inspector General of Bridges and Roads (retired). Paris, November 20, 1869.
The numbers of men present are represented by the widths of the colored zones at a rate of one millimeter for every ten thousand men; they are further written across the zones. The red designates the men who enter Russia, the black those who leave it. — The information which has served to draw up the map has been extracted from the works of M. M. Thiers, de Ségur, de Fezensac, de Chambray and the unpublished diary of Jacob, the pharmacist of the Army since October 28th.

In order to better judge with the eye the diminution of the army, I have assumed that the troops of Prince Jérôme and of Marshal Davout, who had been detached at Minsk and Mogilev and have rejoined near Orsha and Vitebsk, had always marched with the army.“
https://en.wikipedia.org/wiki/Charles_Joseph_Minard

Minards Infografik über Napoleons Russlandfeldzug

DATA, code, design | Daten-Visualisierung

Als Communication-Designer finde ich komplexe Statistiken und Info-Grafiken spannend. Daher werde ich mich in meiner Recherche umfassend mit Daten-Visualisierung auseinandersetzen. Bekanntlich sind Statistiken sehr statisch. Um dem entgegenzuwirken möchte ich mein Code-Vorwissen einbringen und versuchen Daten, Code und Design unter einen Hut zu bringen.
Mein Ziel ist es dynamisch große Datenmengen auszulesen und generativ zu visualisieren, daher wird das Hauptaugenmerk meiner Recherche auf Code generierte Daten-Visualisierungen und die damit verbundenen Anforderungen liegen.

Dabei stellen sich folgende Fragen:
Wie können komplexe Datenstrukturen simpel visualisiert werden
Wie können komplexe Datenstrukturen abstrakt visualisiert werden

Das Hauptaugenmerk wird sich um abstrakte, ansprechende Datenvisualisierung drehen. Die Schwierigkeit besteht darin, komplexe Informationen mit abstrakten grafischen Mitteln zu verbinden.

Hierzu möchte ich meine Analyse folgenden Themen widmen:

  • Simulating Natural Systems
  • Cellular automata processing
  • Textursynthese
  • Recherche von bestehenden datasets
    • Daten-Architektur Analyse
  • Passende Entwicklungsumgebungen
  • … and more to come