Forscher warnen vor unreflektierter Nutzung von Big Data aus sozialen Medien Soziale Medien – verzerrte Ergebnisse? - scinexx | Das Wissensmagazin
Anzeige
Anzeige

Forscher warnen vor unreflektierter Nutzung von Big Data aus sozialen Medien

Soziale Medien – verzerrte Ergebnisse?

Soziale Medien liefern Big Data - aber diese sind oft verzerrt © freeimages

Big Data mit Risiko: Twitter, Facebook und Co sind längst auch für Forscher zu einem wertvollen Hilfsmittel geworden. Denn sie liefern jede Menge Daten für psychologische und soziologische Studien. Doch US-Forscher warnen nun im Fachmagazin „Science“: Auf diese Weise generierte Ergebnisse können oft irreführend sein. Sie fordern deshalb höhere methodische Standards.

Jährlich werden tausende Studien veröffentlicht, deren Ergebnisse ausschließlich auf Daten aus Twitter und anderen sozialen Medien beruhen. Das scheint kaum verwunderlich. Schließlich eröffnet sich Wissenschaftlern mit diesen Quellen ein nie zuvor dagewesener Datenpool: Angefangen von persönlichen Daten wie Geburtsjahr, Geschlecht und Job, bis hin zu Meinungen zu bestimmten Themen oder unsere grundsätzliche Weltanschauung – vieles, was wir denken und tun, präsentieren wir in sozialen Netzwerken auf einem gläsernen Tablett.

Schneller Weg zu „Big Data“

„Soziale Medien sind ein schneller Weg, um diese Informationen zu erfassen“, erklärt Jürgen Pfeffer von der Carnegie Mellon University in Pittsburgh. Er verfolgte beispielsweise 2013 die Reaktionen von Menschen auf das Attentat auf den Marathonlauf in Boston. In nur zwei Wochen hatte der Forscher dazu 25 Millionen Tweets gesammelt. „Man bekommt einen Einblick in das Verhalten von Millionen Menschen – und das umsonst“, sagt er.

Und die Daten werden nur zu gerne genutzt: „Viele dieser Studien beeinflussen Entscheidungen und Investitionen in Öffentlichkeit, Industrie und Regierung“, sagt Derek Ruths von der McGill University in Montreal. Doch die Big Data aus dem Netz sind nur auf den ersten Blick uneingeschränkt dafür geeignet, Trends, Stimmungen und Verhaltensweisen von Menschen abzubilden. Gemeinsam mit Jürgen Pfeffer von der Carnegie Mellon University in Pittsburgh nennt Ruths nun gleich mehrere Aspekte, warum Daten aus solchen Erhebungen mit Vorsicht zu genießen sind.

Austausch über das Internet gehört heute zum Alltag © SXC

Nicht repräsentativ und nicht frei von Manipulation

Die Nutzer sozialer Netzwerke sind nicht repräsentativ, sie stellen oft kein Abbild der Gesellschaft dar, sondern nur einen Ausschnitt. So wird etwa Instagram in den USA vor allem von jungen Menschen zwischen 18 und 19 Jahren genutzt, insbesondere von Afroamerikanern und Latinos. Pinterest dominieren hingegen 25- bis 34-jährige Frauen, die über ein durchschnittliches Einkommen von 100.000 US-Dollar verfügen, wie die Forscher erklären.

Anzeige

Zudem beeinflusst das Design und die Struktur der sozialen Medien-Plattformen, wie sich die Nutzer verhalten und welches Verhalten gemessen werden kann. So gibt es beispielsweise auf der Facebookseite selbst keinen „dislike“-button. Dadurch lassen sich negative Reaktionen schlechter bis gar nicht erfassen, so Ruths und Pfeiffer. Die sozialen Netze nutzen zudem spezielle Algorithmen, mit denen sie ihre Datenströme filtern und beeinflussen – und diese werden häufig verändert. Auch das kann daher Studien verfälschen.

Ein weiteres Problem sind die vielen Accounts, die nicht zu einer natürlichen Person gehören: So kommunizieren etwa viele PR-Experten im Auftrag von Stars und Sternchen, vertreten Politiker oder gleich ganze Unternehmen. Und manches Profil ist schlicht ein Bot oder Fake, mancher Follower für teures Geld gekauft. Auch das kann die Ergebnisse soziologischer und psychologischer Studien verfälschen.

„Kenne deine Daten“

„Forscher müssen sich dessen stärker darüber bewusst sein, was sie da eigentlich genau analysieren, wenn sie mit sozialen Medien arbeiten“, sagen Ruths und Pfeiffer. Denn kennt man die Verzerrungen und ihre Quelle, dann kann in einigen Fällen mit statistischen Methoden ausgeglichen werden. In anderen müssen neue Techniken und Standards entwickelt werden, um mit den Verfälschungen sinnvoll umzugehen. Der alte Sinnspruch „Kenne deine Daten“, sei auch in diesem Kontext noch immer ein guter Rat, konstatieren die Forscher. (Science, 2014; doi: 10.1126/science.1257756)

(Science/ Carnegie Mellon University, 28.11.2014 – DAL)

Anzeige

In den Schlagzeilen

Diaschauen zum Thema

Dossiers zum Thema

News des Tages

Physik-Highlights

Physik-Highlights des Jahres 2018

Relikt des Urknalls entdeckt

Wie viel Sauerstoff verliert unser Planet?

Kinderknochen reifen heute schneller

Haben Affen einen Sinn für Musik?

Bücher zum Thema

Die berechnete Welt - Leben unter dem Einfluss von Algorithmen Von Nora S. Stampfl

50 Schlüsselideen Digitale Kultur - Tom Chatfield und Carl Freytag

Menschen, Tiere und Max - Natürliche Kommunikation und künstliche Intelligenz Von Ipke Wachsmut

150 psychologische Aha-Experimente - Beobachtungen zu unserem eigenen Erleben und Verhalten Von Serge Ciccotti

Top-Clicks der Woche

Anzeige
Anzeige