top of page

Want to generate your own video summary in seconds?

Analyse von Datentrends im digitalen Journalismus: Erkenntnisse aus der Vorlesung von David Kriesel

Erforschen Sie die Auswirkungen der modernen Datenverarbeitung auf die Gesellschaft durch die Analyse von SPIEGEL ONLINE-Artikeln von David Kriesel. Entdecken Sie Trends in der Veröffentlichungshäufigkeit, der Artikellänge und den Inhaltskategorien.

Video Summary

David Kriesel, ein renommierter Datenwissenschaftler, erlangte mit seinem aufschlussreichen Vortrag über den Xerox-Scanningbug auf der 31C3-Konferenz Berühmtheit. Seine anschließende Analyse von fast 100.000 Artikeln von SPIEGEL ONLINE hat faszinierende Einblicke in den Inhalt und die Trends der Veröffentlichung enthüllt. Durch das Eintauchen in diesen riesigen Datenschatz hat Kriesel wertvolle Beobachtungen zur Dominanz von Politik-, Panorama- und Sportartikeln auf der Plattform gemacht. Durch sorgfältige Prüfung der Veröffentlichungshäufigkeit, der Artikellänge und der Inhaltskategorien hat er die redaktionellen Strategien von SPIEGEL ONLINE und die sich entwickelnde Landschaft des digitalen Journalismus beleuchtet.

Die Diskussion mit Kriesel bestätigt lang gehegte Vermutungen in der Datenwissenschaft und betont die entscheidende Rolle der Datenanalyse bei der Validierung von Messmethoden. Überraschenderweise wurde festgestellt, dass Artikel, die während der Nebenstunden veröffentlicht werden, tendenziell kürzer sind und faszinierende Muster in der Datenwissenschaft aufdecken. Darüber hinaus ergab sich eine Korrelation zwischen der Tageszeit und der Artikellänge, wobei längere Stücke in der Regel am frühen Morgen veröffentlicht werden. Die Analyse deckt auch eine Verbindung zwischen Datenwissenschaft und der Herausforderung von Stereotypen auf, wie durch die Untersuchung von Autorenmustern in Online-Artikeln belegt. Durch die Prüfung von Autorenkollaborationen wurde ein soziales Netzwerk von Autoren bei SPIEGEL ONLINE konstruiert, das interne Teamdynamiken aufzeigt.

Die Unterhaltung geht weiter auf potenzielle ethische Dilemmas im Zusammenhang mit der Nutzung persönlicher Daten bei der Analyse von Autorenveröffentlichungsmustern ein. Sie unterstreicht die Bedeutung ethischer Überlegungen bei der Datenanalyse, insbesondere beim Schutz von Privatsphäre und Sicherheit. Kriesel wirft auch Licht auf die Auswirkungen der Datenspeicherung und Überwachung und äußert Bedenken hinsichtlich Datenschutzverletzungen und möglicher Datenmissbräuche. Die Diskussion erstreckt sich auf die Analyse von Artikellängen und Autorenplatzierungen in Online-Veröffentlichungen und bietet Einblicke in redaktionelle Praktiken und Inhaltsentwicklung.

Darüber hinaus erforscht Kriesel eine Methode der Schlüsselwortanalyse zur Erstellung thematischer Karten von Nachrichtenthemen, die die vernetzte Natur verschiedener Themen, die von Nachrichtenagenturen behandelt werden, zeigen. Mit einer Zoom-Analogie illustriert er die weite politische Landschaft, die von den US-Wahlen ausgeht und sich auf globale Themen wie den Bürgerkrieg in Syrien und Terrorismus ausdehnt. Die Veränderung der Kommentierbarkeit von Artikeln auf SPIEGEL ONLINE wird diskutiert und zeigt einen Rückgang der Möglichkeit, zu sensiblen Themen wie der Flüchtlingskrise und Justizfragen zu kommentieren.

Die Bedeutung der Visualisierung von Daten in der Datenwissenschaft zur besseren Verständlichkeit komplexer Informationen wird betont. Die Unterhaltung berührt auch das Thema der Kommentierbarkeit im Kontext nationaler Konflikte wie dem Israel-Palästina-Konflikt und dem Ukraine-Konflikt. Sie unterstreicht, wie bestimmte Themen wie Terrorismus in Frankreich zu einer Verringerung der kommentierbaren Artikel führen. Darüber hinaus geht die Diskussion auf die Wähleransprache in politischen Kampagnen ein und betont die Verwendung von Datenanalyse, um Botschaften an spezifische demografische Gruppen anzupassen.

Die potenziellen Auswirkungen von Datenwissenschaftstechniken auf Wahlen werden untersucht und warnen davor, personalisierte Werbung blind zu akzeptieren. Bedenken werden hinsichtlich der Verwendung persönlicher Daten, insbesondere von Facebook-Likes, zur Gestaltung politischer Kampagnen geäußert. Kriesel diskutiert die Herausforderungen der Datenanalyse aufgrund von Zeitbeschränkungen und persönlichen Faktoren und zeigt eine Demo, wie sich Artikelüberschriften im Laufe der Zeit entwickeln können. Die Bedeutung von Rohdaten und innovativen Analyseideen wird hervorgehoben.

Zusammenfassend bietet die Analyse von SPIEGEL ONLINE-Artikeln durch David Kriesel wertvolle Einblicke in Daten-Trends im digitalen Journalismus. Von der Inhaltsanalyse bis zur Bedeutung der genauen Interpretation von Daten bietet Kriesels Arbeit eine überzeugende Erzählung über die sich entwickelnde Landschaft der Datenwissenschaft im Journalismus.

Click on any timestamp in the keypoints section to jump directly to that moment in the video. Enhance your viewing experience with seamless navigation. Enjoy!

Keypoints

00:00:12

Einführung von David Kriesel

David Kriesel, ein Datenwissenschaftler, erlangte durch seinen Vortrag über den Xerox-Ganningbug auf dem 31C3-Event Berühmtheit.

Keypoint ads

00:01:16

Hintergrund von David Kriesel

David Kriesel, ein Informatiker aus Bonn, hat sich auf Datenwissenschaft und maschinelles Lernen spezialisiert. Seit 2014 hat er fast 100.000 Artikel von SPIEGEL ONLINE im Rahmen seiner Arbeit gespeichert.

Keypoint ads

00:02:00

Zweck der Datenanalyse

Die während einer Zeit des Medienumbruchs gesammelten Daten geben Einblicke in die Meinungen und Stimmungen der Öffentlichkeit. Die Analyse zielt darauf ab, Trends aus dem Datensatz aufzudecken und Licht auf die Auswirkungen der Datensammlungspraktiken auf die Gesellschaft zu werfen.

Keypoint ads

00:03:06

Spiegelmining-Prozess

Spiegelmining beinhaltet das automatische Herunterladen und Speichern neuer Artikel von Spiegel Online alle paar Minuten. Dieser Prozess ermöglicht den sofortigen Zugriff auf Artikel in ihrem Originalzustand und bietet unverfälschte Einblicke für die Analyse.

Keypoint ads

00:03:50

Datenanalysefunktionen

Merkmale, die aus den heruntergeladenen Artikeln extrahiert wurden, umfassen Veröffentlichungszeitstempel und Artikelkategorien. Diese Merkmale werden für die Analyse verwendet, wobei interessante Ergebnisse durch Blogartikel geteilt werden, um den Lesern Einblicke in Spiegel Online und Datenwissenschaft zu bieten.

Keypoint ads

00:04:26

Analyse des Spiegel Online-Inhalts

Spiegel Online wird von Artikeln über Politik dominiert, gefolgt von Panorama und Sport. Diese drei Kategorien machen die Hälfte aller Artikel auf der Plattform aus.

Keypoint ads

00:05:06

Artikelveröffentlichungsfrequenz

Die Veröffentlichungsfrequenz von Spiegel Online variiert erheblich, wobei an Wochenenden ein deutlicher Rückgang zu verzeichnen ist. Im Durchschnitt veröffentlicht die Plattform etwa 700 Artikel pro Woche, was ungefähr 100 Artikel pro Tag entspricht.

Keypoint ads

00:05:28

Datensammlungstipp

Es ist ratsam, ein Warnsystem einzurichten, um zu alarmieren, wenn die Datensammlung stoppt, wie es bei einem Vorfall im März 2015 der Fall war, als Daten aufgrund eines Versehens während eines Monats mit einem 'E' fehlten.

Keypoint ads

00:06:43

Analyse der Veröffentlichungszeit und Kategorie

Beim Kombinieren von Veröffentlichungszeit und Kategorie wird festgestellt, dass die Output-Stabilität je nach Kategorie unterschiedlich ist. Während Politik und Panorama stabil bleiben, zeigen Kategorien wie Wissenschaft und UniSPIEGEL signifikante Reduzierungen im Output.

Keypoint ads

00:07:17

Artikellängenanalyse

Spiegel Online-Artikel variieren je nach Kategorie in der Länge, wobei kulturelle Artikel fast dreimal so lang sind wie Sportartikel und doppelt so lang wie politische Artikel. Trotz kürzerer Artikel bleiben Politik, Panorama und Sport dominierende Kategorien, was auf einen Fokus auf Reichweite statt Tiefe hinweist.

Keypoint ads

00:08:29

Bedeutung des Experimentierens mit Funktionen

Das Experimentieren mit Features ist entscheidend in der Datenwissenschaft. Zum Beispiel zeigt ein Diagramm, das das Veröffentlichungsvolumen pro Wochentag und Stunde zeigt, Muster, bei denen größere Blöcke auf mehr veröffentlichte Artikel hinweisen. Diese Experimente helfen beim Verständnis von Datenwissenschaftsprozessen.

Keypoint ads

00:08:50

Datenwissenschaftliche Erkenntnisse

In der Datenwissenschaft werden häufig bestätigte Muster entdeckt, die frühere Annahmen bestätigen. Die Analyse von Veröffentlichungstrends zeigt, dass weniger Inhalte zu unkonventionellen Zeiten veröffentlicht werden, wie spät in der Nacht. Diese Erkenntnis hilft bei der Überprüfung von Messmethoden.

Keypoint ads

00:09:23

Unerwartete Muster in der Datenwissenschaft

Data Science deckt unerwartete Muster auf, wenn Merkmale kombiniert werden. Zum Beispiel zeigt die Farbcodierung von Blöcken basierend auf der Textlänge eine klare Korrelation zwischen Tageszeit und Artikellänge auf. Diese unerwartete Entdeckung stellt vorgefasste Vorstellungen in Frage und vertieft das Verständnis.

Keypoint ads

00:09:45

Artikellängentrends

Die typische Länge der veröffentlichten Artikel variiert im Laufe der Woche, wobei längere Artikel früh am Morgen veröffentlicht werden. Dieser Trend gilt auch am Wochenende, was auf eine Beziehung zwischen Tageszeit und Artikel Länge hinweist.

Keypoint ads

00:10:03

Herausforderung von Stereotypen in der Datenwissenschaft

Data Science fordert Stereotypen heraus, indem es zeigt, dass kulturelle Abteilungsautoren später am Tag veröffentlichen. Diese Erkenntnis widerspricht der Annahme, dass sie später mit der Arbeit beginnen. Durch die Analyse von Daten können Vorurteile angegangen und korrigiert werden.

Keypoint ads

00:11:03

Vorsicht bei der Datenanalyse

Es ist wichtig, Vorsicht bei der Datenanalyse walten zu lassen, um Stereotypen zu vermeiden. Bei der Analyse von Veröffentlichungsmustern ist es entscheidend, Faktoren wie vorgeplante Artikel zu berücksichtigen. Dies dient als Erinnerung, Ergebnisse kritisch zu bewerten und Bestätigungsfehler zu vermeiden.

Keypoint ads

00:11:39

Die Nutzung von Autorendaten zur Analyse

Die Extraktion von Autoreninformationen aus Artikeln ermöglicht eine tiefere Analyse. Durch die Untersuchung von Autorenmustern können interne Strukturen von SPIEGEL ONLINE abgeleitet werden. Dieser Ansatz liefert Einblicke in die Veröffentlichungsdynamik und Autorenschaft innerhalb der Organisation.

Keypoint ads

00:12:21

Autorenkollaborationsanalyse

Durch die Analyse von Autorenkollaborationen ist es möglich, eine Autorenkarte zu erstellen, die die Bedeutung der Autoren füreinander auf der Grundlage ihrer Artikelkollaborationen zeigt. Diese Autorenkarte wurde für SPIEGEL ONLINE-Autoren der letzten zwei Jahre erstellt, wobei jeder Autor als Blase dargestellt wird. Autoren, die selten zusammenarbeiten, werden herausgefiltert, was deutliche Cluster von Autoren zeigt, die eng zusammenarbeiten.

Keypoint ads

00:13:12

Ressourcenbasierte Autorengruppierung

Autoren wurden basierend auf ihren jeweiligen Fachgebieten farblich kodiert, die aus dem SPIEGEL ONLINE Impressum stammen. Diese Farbkodierung zeigte, dass Autoren mit ähnlichen Ressourcen dazu neigen, auf der Autorenkarte zusammenzufallen. Zum Beispiel repräsentieren Autoren in Pink Sport, Wissenschaft und Gesundheit, während andere Farben verschiedene Bereiche wie Politik und Reisen kennzeichnen.

Keypoint ads

00:13:38

Identifizierung von Autorenteams

Unterschiedliche Autorenteams können auf der Autorenkarte anhand ihrer Clusterungsmuster identifiziert werden. Graue Blasen repräsentieren Autoren, denen keine Ressource aus dem SPIEGEL ONLINE Impressum zugeordnet werden konnte, was möglicherweise auf ehemalige Kollegen hinweist. Trotzdem ermöglicht ihre Nähe zu farbigen Gruppen das Gruppieren dieser Autoren in Teams und zeigt die Kraft der externen Analyse bei der Erfassung interner Teamstrukturen.

Keypoint ads

00:14:31

Zeitanalyse der Autorenveröffentlichungen

Jede Linie im Diagramm stellt einen Autor dar, wobei farbige Linien veröffentlichte Artikel im Laufe der Zeit anzeigen. Durch die Verfolgung der Veröffentlichungsmuster von Autoren, wie regelmäßige Kolumnen oder Berichterstattung über aktuelle Ereignisse, wird es möglich, Details wie Urlaubszeiten basierend auf Veröffentlichungslücken zu erschließen. Diese zeitliche Analyse liefert Einblicke in das Verhalten und die Zeitpläne der Autoren.

Keypoint ads

00:15:18

Einblicke aus Urlaubsüberschneidungen

Die Identifizierung von sich überschneidenden Urlaubszeiten unter Autoren kann Muster der Zusammenarbeit und Beziehungen innerhalb des Teams aufzeigen. Durch die Erkennung, wann bestimmte Autoren dazu neigen, gleichzeitig Urlaub zu nehmen, beispielsweise während der Feiertage, wird es einfacher, potenzielle Partnerschaften und Interaktionen abzuleiten. Diese Daten können wertvolle Einblicke in die Autorendynamik und Arbeitsbeziehungen bieten.

Keypoint ads

00:15:55

Bedeutung der Datenanalyse

Die Analyse anonymisierter Autorendaten kann wertvolle Einblicke in Autoreninteraktionen und -kollaborationen liefern. Auch wenn die Ergebnisse nicht alle Partnerschaften endgültig bestätigen, dienen sie als starke Indikatoren für weitere Untersuchungen. Unternehmen nutzen oft solche Datenanalysen für strategische Entscheidungsfindung und das Verständnis interner Dynamiken, was die praktischen Anwendungen datengetriebener Erkenntnisse zeigt.

Keypoint ads

00:16:02

Datenschutz und Sicherheit

Der Sprecher betont die Bedeutung von Datenschutz und Sicherheit und betont, dass bei der Veröffentlichung von Daten nicht der Veröffentlicher entscheidet, was offenbart wird, sondern potenzielle Gegner. Durch die Analyse von Metadaten wie Zeiten und Autoren können sensible persönliche Informationen abgeleitet werden, einschließlich Details über Beziehungen, Gesundheit, Überzeugungen und finanziellen Status.

Keypoint ads

00:17:01

Implikationen der Metadatenanalyse

Die Diskussion geht auf die Auswirkungen der Metadatenanalyse ein und zieht Parallelen zum Konzept der Massendatenspeicherung. Der Sprecher verdeutlicht, wie die Metadatenanalyse intime Details über Einzelpersonen offenlegen kann, wie ihre sozialen Verbindungen, Gesundheitszustand und politischen Überzeugungen, und hebt die tiefgreifenden Datenschutzrisiken hervor, die mit solchen Praktiken verbunden sind.

Keypoint ads

00:18:01

Überwachungsinfrastruktur

Der Sprecher warnt vor dem Aufbau einer Überwachungsinfrastruktur durch die Sammlung von Metadaten und vergleicht sie mit George Orwells 'Big Brother'. Diese Infrastruktur, die möglicherweise mit guten Absichten errichtet wurde, könnte von zukünftigen bösartigen Regierungen ausgenutzt werden und stellt eine erhebliche Bedrohung für die Privatsphäre und Bürgerrechte dar.

Keypoint ads

00:18:29

Bedenken bezüglich staatlicher Kontrolle

Der Sprecher äußert Bedenken über den möglichen Missbrauch der Überwachungsinfrastruktur durch zukünftige Regierungen und hebt die Risiken hervor, die mit der Gewährung von zu viel Kontrolle an die Behörden verbunden sind. Die Diskussion unterstreicht die Notwendigkeit von Schutzmaßnahmen, um autoritäre Missbräuche zu verhindern und individuelle Freiheiten zu schützen.

Keypoint ads

00:19:40

Herausforderungen bei der Autorenzuweisung

Der Sprecher diskutiert Herausforderungen im Zusammenhang mit der Autorenzuweisung in Online-Artikeln und weist auf Diskrepanzen hin, wie Autoren an verschiedenen Stellen im Text präsentiert werden. Die Komplexität der Autorennamen, unterschiedliche Formate und Platzierungsinkonsistenzen stellen technische und Benutzerfreundlichkeitsherausforderungen dar, die die Feinheiten der Datenwissenschaft und Informationsgewinnung widerspiegeln.

Keypoint ads

00:19:42

Artikellängenabweichung basierend auf der Autorenposition

Artikel mit Autoren am Ende sind in der Regel etwa 300 Wörter lang, während diejenigen mit Autoren am Anfang über zweieinhalb Mal länger sind und durchschnittlich etwa 750 Wörter umfassen. Dies deutet auf einen signifikanten Unterschied in der Artikel-Länge basierend auf der Position des Autors hin.

Keypoint ads

00:20:24

Prozentsatz der Nachrichtenagenturartikel basierend auf Länge

Nur etwa 2% der langen Artikel stammen von Nachrichtenagenturen, während fast 80% der kurzen Artikel von Nachrichtenagenturen stammen. Dies verdeutlicht eine Diskrepanz in der Herkunft von Artikeln basierend auf ihrer Länge.

Keypoint ads

00:20:48

Analyse der Variation der Artikel Länge im Laufe des Tages

Längere Artikel erscheinen hauptsächlich am Anfang des Tages, mit einem höheren Prozentsatz an selbstgeschriebenen Artikeln. Dieses Muster verschiebt sich im Laufe des Tages, was auf eine Schwankung der Artikel-Länge basierend auf der Veröffentlichungszeit hinweist.

Keypoint ads

00:21:39

Die Verwendung von Schlüsselwörtern zur Artikelkategorisierung

Artikel auf SPIEGEL ONLINE sind mit Schlüsselwörtern versehen, die eine Kategorisierung nach Themen ermöglichen. Über 65.000 verschiedene Schlüsselwörter wurden identifiziert, und die Analyse ihres gemeinsamen Auftretens liefert Einblicke in verwandte Themen innerhalb der Artikel.

Keypoint ads

00:22:33

Schlüsselwort-Beziehungsanalyse

Schlüsselwörter werden auf ihre Beziehungen analysiert, wobei eng verwandte Schlüsselwörter als verbundene Knoten in einer thematischen Karte dargestellt werden. Dieser Ansatz schafft eine visuelle Darstellung der miteinander verbundenen Themen, die von SPIEGEL ONLINE in den letzten zwei Jahren behandelt wurden.

Keypoint ads

00:23:37

Volkswagen-Abgasskandal

Der Volkswagen-Abgasskandal wird durch eine Visualisierung dargestellt, die Schlüsselwörter unterschiedlicher Größe zeigt. Die Größe jedes Schlüsselworts repräsentiert die Anzahl der damit verbundenen Artikel. Die Farbe zeigt die vorherrschende Kategorie in allen Artikeln an, die das Schlüsselwort enthalten. Gelb steht beispielsweise für die Kategorie 'Wirtschaft'.

Keypoint ads

00:24:33

Verschiedene Luftfahrtunfälle

Verschiedene Luftfahrtvorfälle werden in der Visualisierung dargestellt, wobei das Thema zwischen 'Panorama' (grün) und 'Politik' (rot) liegt. Die politischen Aspekte beziehen sich auf Vorfälle wie das Flugzeug, das über der ukrainisch-russischen Grenze abgeschossen wurde.

Keypoint ads

00:25:01

Griechische Finanzkrise

Die griechische Finanzkrise wird als Thema zwischen 'Politik' und 'Wirtschaft' (rot und gelb) hervorgehoben. Wolfgang Schäuble wird als verantwortlich für dieses Thema genannt, dargestellt in Grau aufgrund des Mangels an einer dominanten Kategorie in der Schlüsselwortlandschaft.

Keypoint ads

00:25:24

US-Präsidentschaftswahl

Die US-Präsidentschaftswahl des Jahres wird präsentiert, mit Hillary Clinton und Donald Trump in einem politischen Kontext (rot). Das Schlüsselwort 'Emails' wird innerhalb dieses Themas besonders hervorgehoben.

Keypoint ads

00:25:58

Weltweites politisches Umfeld

Herauszoomen offenbart die weitläufige politische Landschaft, die Ereignisse wie den syrischen Bürgerkrieg, den Islamischen Staat, islamistischen Terrorismus und den Konflikt in der Ukraine umfasst. Auch verschiedene aktuelle Themen in der Türkei, Russland, Israel und dem Nahen Osten werden dargestellt.

Keypoint ads

00:26:45

Politische Landschaftsübersicht

Die gesamte politische Landschaft wird präsentiert, mit klaren Abschnitten für die US-Wahl, die Außenpolitik und die Inlandsangelegenheiten. Ein besonderer Schwerpunkt liegt auf der Flüchtlingskrise, die nun als wichtige Kategorie etabliert ist, die ausländische und inländische Anliegen verbindet.

Keypoint ads

00:27:12

Endgültige Landschaftsvisualisierung

Die Visualisierung zoomt heraus, bis einzelne Details nicht mehr erkennbar sind, und zeigt eine komplexe Vielfalt von farbigen Landschaften. Die politischen, panoramischen und wirtschaftlichen Abschnitte werden hervorgehoben, wobei die Flüchtlingskrise als ein bedeutendes zentrales Thema hervortritt.

Keypoint ads

00:27:30

Einführung in die Weltkarte

Der Sprecher stellt die Weltkarte vor und erwähnt verschiedene Abschnitte wie den Hauptkontinent, die Blaue Netz Welt im Osten, den Kulturbereich und mehr. Die Weite der Karte wird hervorgehoben, mit Bereichen, die nahtlos ineinander übergehen.

Keypoint ads

00:28:06

Erkunden der Weltkarte

Der Sprecher diskutiert die Weite der Weltkarte und erwähnt, dass der Wissenschaftsbereich vom Hauptkontinent entfernt ist und der Sportbereich weit entfernt ist. Das Publikum wird ermutigt, die interaktive Karte auf der Website des Sprechers zu erkunden, um ein ansprechenderes Erlebnis zu haben.

Keypoint ads

00:28:31

Kommentieren von Artikeln

Der Sprecher spricht über die Kommentarfunktion bei Spiegel Online-Artikeln und hebt die Möglichkeit hervor, dass Leser ihre Meinungen äußern können. Es gibt jedoch einen Trend zu abnehmenden kommentierbaren Artikeln, insbesondere nach dem signifikanten Anstieg der Berichterstattung über Flüchtlinge im Sommer 2015.

Keypoint ads

00:29:30

Rückgang der kommentierbaren Artikel

Seit dem Höhepunkt der Berichterstattung über Flüchtlinge im Jahr 2015 gab es einen kontinuierlichen Rückgang der Anzahl von kommentierbaren Artikeln auf Spiegel Online. Derzeit erlauben die meisten Artikel keine Kommentare, was auf eine Veränderung im Ansatz der Plattform zur Nutzerbindung hinweist.

Keypoint ads

00:30:00

Gründe für den Rückgang der kommentierbaren Artikel

Der Sprecher spekuliert über die Gründe für den Rückgang kommentierbarer Artikel und deutet an, dass dies auf einen Anstieg von Online-Hassrede oder Spiegel Online's Zurückhaltung gegenüber negativen Kommentaren zurückzuführen sein könnte. Die genaue Ursache bleibt jedoch unklar und offen für individuelle Interpretationen.

Keypoint ads

00:30:30

Einführung von Kommentierungsbeschränkungen

Während der Berichterstattung über Flüchtlinge führte Spiegel Online Entschuldigungstexte für Artikel ein, bei denen aufgrund sensibler Themen keine Kommentare möglich waren. Dieser Schritt spiegelte das Unbehagen der Plattform über den starken Anstieg der Kommentarbeschränkungen wider. Trotz anfänglicher Umsetzung wurden die Entschuldigungstexte schließlich eingestellt.

Keypoint ads

00:30:49

Analyse der Kommentiertrends

Der Sprecher analysiert die Kommentiertrends, indem er Schlüsselwörter auf einer Karte farblich kennzeichnet, basierend auf ihrer Kommentierbarkeit. Rot zeigt eine unterdurchschnittliche Kommentierbarkeit an, Blau bedeutet eine überdurchschnittliche Kommentierbarkeit und Grau steht für den Durchschnitt. Diese visuelle Darstellung zeigt die sich entwickelnde Landschaft des Nutzerengagements auf Spiegel Online.

Keypoint ads

00:31:08

Einführung in die Schlüsselwortzuordnung

Der Sprecher führt das Konzept des Keyword-Mappings ein und erwähnt, dass ein Schlüsselwort entweder am Anfang oder am Ende der Skala hervorsticht. Sie deuten auch darauf hin, eine Karte auf ihrer Website für interaktive Erkundungen hinzuzufügen.

Keypoint ads

00:31:19

Kommentieren zu verschiedenen Themen

Verschiedene Themen werden zur Kommentierung diskutiert, wie Sport, Wissenschaft und Wirtschaft, wobei spezifische Farbcodes unterschiedliche Artikelformate kennzeichnen. Der Sprecher erwähnt, dass bestimmte Themen wie Justiz und der NSU-Prozess nur begrenzte Leserkommentare haben, während Themen im Zusammenhang mit Flüchtlingen und Rechtsextremismus noch weniger Kommentare zulassen.

Keypoint ads

00:32:15

Einschränkungen bei der Kommentierung von Justiz

Artikel zum Thema Justiz, einschließlich Berichte über Verbrechen, Morde und Angriffe, haben nur begrenzte Leserkommentare, wobei nur etwa 30% der Artikel für Kommentare geöffnet sind. Der NSU-Prozess wird als ein stark diskutiertes Thema mit eingeschränkten Kommentaren hervorgehoben.

Keypoint ads

00:32:53

Einschränkungen bei Kommentaren zu Flüchtlingsfragen

Themen im Zusammenhang mit Flüchtlingen, Asylrechten und verwandten Themen haben die strengsten Kommentierungsbeschränkungen, wobei nur etwa 18% der Artikel für Kommentare geöffnet sind. Der Sprecher betont die visuelle Darstellung dieser Beschränkungen auf einer Karte, die die systematische Schließung von Kommentarbereichen nach Thema zeigt.

Keypoint ads

00:33:00

Bedeutung der visuellen Darstellung in der Datenwissenschaft

Der Sprecher betont die Bedeutung der visuellen Darstellung von Daten in der Datenwissenschaft und erklärt, dass es entscheidend ist, komplexe Informationen leicht verständlich zu machen. Sie erwähnen, dass Visualisierungen Individuen helfen, nicht nur Programmierer, komplexe Verbindungen zu erfassen, da die Augen die einzige Breitbandverbindung zum Gehirn darstellen.

Keypoint ads

00:33:38

Kommentierungsbeschränkungen zum Israel-Konflikt

Artikel zum Israel-Konflikt haben strenge Kommentarbeschränkungen, wobei Leser darauf hingewiesen werden, sich bei fast allen Artikeln zurückzuhalten. Der Sprecher wechselt zum Thema des Ukraine-Konflikts und weist auf ähnliche Kommentarbeschränkungen hin.

Keypoint ads

00:34:06

Einblick in westliche Filterblasen

Der Sprecher zeigt eine Visualisierung von westlichen Filterblasen, die unterschiedliche Ebenen der Kommentarfreiheit in verschiedenen Ländern und Regionen zeigen. Sie heben den Kontrast zwischen Regionen wie dem Iran, Großbritannien, der Türkei und Frankreich hervor, wo die Kommentarbeschränkungen je nach Diskussionsthema unterschiedlich sind.

Keypoint ads

00:34:35

Analyse der Kommentartrends in Frankreich

Eine detaillierte Analyse der Kommentartrends in Frankreich wird präsentiert, die eine Verschiebung von überwiegend kommentierbaren Artikeln zu eingeschränktem Kommentieren zeigt, insbesondere nach einer Serie von terroristischen Angriffen. Der Sprecher veranschaulicht diese Verschiebung anhand visueller Daten von 2000 bis 2015 und zeigt eine signifikante Veränderung in den Kommentarmustern.

Keypoint ads

00:35:05

Anschläge in Paris im November 2015

Im November 2015 gab es eine signifikante Zunahme der Berichterstattung über die Anschläge in Paris, mit einem Anstieg von Artikeln über Frankreich. Die meisten dieser Artikel waren nicht für Kommentare zu den Anschlägen geöffnet, was zu einem Rückgang der Gesamtkommentierbarkeit seit den terroristischen Vorfällen führte.

Keypoint ads

00:35:22

Medienreaktion und Kommentierungsbeschränkungen

Die Reaktion von Spiegel Online auf die Angriffe bestand darin, die Kommentierung zu bestimmten Themen einzuschränken, was auf einen Trend hindeutet, bei dem bestimmte Themen aufgrund vergangener Erfahrungen von Benutzerkommentaren blockiert werden. Es liegt im Ermessen von Spiegel Online, zu entscheiden, welche Themen auf ihrer Plattform zur Diskussion offen stehen.

Keypoint ads

00:36:01

Kommentierungsbeschränkungen auf Spiegel Online

Spiegel Online scheint das Kommentieren von Themen zu verbieten, bei denen die Meinungen der Leser politisch nicht übereinstimmen könnten, was möglicherweise eine selektive Herangehensweise darstellt, um die Benutzerbeteiligung auf ihrer Plattform zu ermöglichen.

Keypoint ads

00:36:23

Artikelkategorisierung

Die Präsentation unterteilte die Artikelkollektion in zwei Hauptkategorisierungsmethoden: zunächst in wenige Kategorien und später in mehrere Kategorien, was es ermöglichte, Artikel basierend auf Schlüsselwörtern unter verschiedenen Themen zu klassifizieren und somit ein komplexeres, aber leistungsstärkeres Kategorisierungssystem zu schaffen.

Keypoint ads

00:36:56

Wahlkampfstrategien

Politische Kampagnen verwenden Wählerzielstrategien, die ähnlich sind wie die Kategorisierung von Artikeln, bei der Wähler basierend auf demografischen Merkmalen wie Geschlecht, Rasse, Alter und Einkommen segmentiert werden. Dieser Ansatz ermöglicht maßgeschneiderte Kampagnenbotschaften an spezifische Wählergruppen für eine effektive Kommunikation.

Keypoint ads

00:37:50

Feine Wählersegmentierungsanalyse

Ein Artikel hob die Fähigkeit eines Datenanalyseunternehmens hervor, Wähler fein zu segmentieren, ähnlich einer ausgefeilten thematischen Karte. Die detaillierte Wählersegmentierung des Unternehmens soll angeblich die Ergebnisse bei der US-Präsidentschaftswahl und dem Brexit-Referendum beeinflusst haben und deutet auf ein nuanciertes Verständnis des Wählerverhaltens hin.

Keypoint ads

00:38:48

Präzision bei der Wähleransprache

Ein Datenanalyseunternehmen behauptete, eine so präzise Wählersegmentierung zu haben, dass sie individualisierte Wahlkampfbotschaften für jeden Wähler maßschneidern könnten, sogar den Ton der Kommunikation genau abgestimmt. Diese Präzision bei der Wähleransprache hat Bedenken hinsichtlich der Auswirkungen auf Wahlergebnisse und der Manipulation der öffentlichen Meinung aufgeworfen.

Keypoint ads

00:39:12

Effektivität der Kampagne des Unternehmens

Der Sprecher hinterfragt die Wirksamkeit der Kampagne des Unternehmens in den beiden Wahlkämpfen und deutet darauf hin, dass die Informationen hauptsächlich vom Unternehmen selbst stammten. Sie glauben, dass das Unternehmen einen ausgezeichneten Verkäufer geschickt hat, der eine brillante Präsentation vor der Presse hielt, was dazu führte, dass die Presse die Botschaft der Kampagne übernahm.

Keypoint ads

00:39:37

Gezielte Werbung und Einfluss

Der Sprecher diskutiert die Auswirkungen von zielgerichteter Werbung und betont, dass Einzelpersonen jetzt maßgeschneiderte Anzeigen erhalten, die sie effizient dazu bringen, Entscheidungen zu treffen. Sie erwähnen das Beispiel von Viagra-Spam und geben an, dass nur diejenigen, die das Produkt wirklich benötigen, solche zielgerichteten Anzeigen erhalten.

Keypoint ads

00:40:17

Wählerentscheidungsfindung

Der Sprecher betont, dass Individuen letztendlich ihre eigenen Entscheidungen treffen, wenn es um das Wählen und Kaufen geht, und sagt, dass Big Data die Menschen nicht kontrolliert. Sie schlagen vor, dass diejenigen, die Angst vor zielgerichteter Werbung haben, stattdessen ihr eigenes Urteilsvermögen hinterfragen sollten.

Keypoint ads

00:41:00

Wahldynamik

Der Sprecher beschreibt, wie Wahlen funktionieren, und stellt fest, dass Wähler dazu neigen, den Kandidaten zu wählen, der kurz vor der Wahl emotional mit ihnen in Resonanz steht. Sie betonen die Effizienz personalisierter Werbung bei der Beeinflussung des Wählerverhaltens.

Keypoint ads

00:41:06

Einfluss von Data Science auf Wahlen

Der Sprecher behauptet, dass Techniken der Datenwissenschaft tatsächlich Wahlergebnisse beeinflussen können, indem er die Effizienz von hochpersonalisierter Werbung hervorhebt, um Wählerentscheidungen zu beeinflussen. Sie verknüpfen dies mit der Verwendung von Facebook-Likes als Daten, um Wähler präzise zu messen und zu zielen.

Keypoint ads

00:41:20

Datensammlung und Datenschutz

Der Sprecher betont die Bedeutung, kritisch gegenüber staatlicher Überwachung zu sein, während man auch auf die persönlichen Daten achten sollte, die online geteilt werden. Sie warnen davor, zu kritisch gegenüber externer Überwachung zu sein, während man sorglos mit persönlichen Informationen auf Plattformen wie Facebook umgeht, und betonen die Notwendigkeit von Selbstbewusstsein und Verantwortung.

Keypoint ads

00:42:05

Sprecherdatenanalyse

Der Sprecher enthüllt, dass sie über 700.000 Artikel von SPIEGEL ONLINE heruntergeladen haben, um Änderungen in Artikeln im Laufe der Zeit zu verfolgen. Sie erwähnen die Fähigkeit, Veränderungen im Artikelinhalt zu messen und kündigen eine Demonstration ihrer Analyse an.

Keypoint ads

00:42:48

Datenanalyse-Demonstration

Aufgrund von Zeitbeschränkungen kann der Sprecher keine umfangreiche Analyse der gesammelten Daten liefern, bietet jedoch eine Demo an. Sie erwähnen das Überprüfen von Änderungen in Artikelüberschriften und HTML-Titeln und zeigen die Fähigkeit, Modifikationen im Artikelinhalt im Laufe der Zeit zu verfolgen.

Keypoint ads

00:43:22

Artikelveröffentlichung und Titeländerung

Der Artikel wurde am 20. Januar 2015 veröffentlicht, und am nächsten Tag wurde der HTML-Titel in 'SAP wächst 2014 langsamer als geplant' geändert. Zunächst hieß es im Titel, dass der SAP-CEO langsamer wächst als geplant, was bei Spiegel Online als menschliche Note angesehen wurde. Anschließend wurde der Titel in 'SAP kann Wachstums- und Gewinnziele nicht erfüllen' geändert. Dies zeigt die Bedeutung von mehreren Versionen von Artikeln für eine eingehendere Analyse.

Keypoint ads

00:44:00

Artikelanalyse und Funktionen

Verschiedene Funktionen wie Kategorien, Zeiten, Kommentierbarkeit, Autoren und mehr wurden in den Artikeln erkundet. Es wurde vorgeschlagen, Links aus Artikeln zu extrahieren, um zu analysieren, ob bestimmte Autoren häufig auf bestimmte Personen verlinken. Die Möglichkeiten für Analysen sind vielfältig und ermutigen zu kreativer Exploration und Feature-Erfindung für die Datenbewertung.

Keypoint ads

00:45:32

Datenwissenschaftliche Erkenntnisse

Der Sprecher betonte die Bedeutung der Beibehaltung von Rohdaten und erklärte, dass der Zugriff auf vollständige Rohdaten umfangreiche retrospektive Analysen und die Entwicklung neuer Funktionen ermöglicht. Mit über 60 Gigabyte an verfügbaren HTML-Daten ist das Potenzial für die Ableitung neuer Erkenntnisse nach der Analyse signifikant und fordert Einzelpersonen auf, ihre Kreativität bei der Erstellung und Analyse von Funktionen zu entfesseln.

Keypoint ads

00:46:30

Ermutigung zur Datenanalyse

Das Publikum wurde ermutigt, ihre kreativsten Ideen für die Analyse von Datensätzen per E-Mail einzureichen. Der Sprecher äußerte die Bereitschaft, die Vorschläge zu erkunden, und erkannte an, dass sofortige Antworten aufgrund beruflicher Verpflichtungen möglicherweise nicht möglich seien. Es würden jedoch Anstrengungen unternommen, um innovative Analysevorschläge zu berücksichtigen und umzusetzen.

Keypoint ads

00:46:38

Dankbarkeit und Schlussfolgerung

Der Sprecher drückte seine Dankbarkeit für die Zeit und das Engagement des Publikums aus und bedankte sich dafür, dass sie die Sitzung gemeinsam verbracht haben. Links wurden geteilt und ein letzter Applaus wurde gegeben, bevor die Präsentation beendet wurde.

Keypoint ads

00:47:02

Fragerunde

Die Fragerunde begann, was den Teilnehmern ermöglichte, Fragen zu stellen oder Erkenntnisse zu teilen. Der Sprecher erkannte die faszinierende Natur der Datenanalyse an und ermutigte zur aktiven Teilnahme, indem er Einzelpersonen einlud, an die Mikrofone zu treten, um Fragen zu stellen.

Keypoint ads

00:47:50

Analyse von Split-Tests und Überschriften

Der Sprecher fand die Präsentation interessant und erkundigte sich, ob Split-Tests durchgeführt und Artikelüberschriften basierend auf Klickraten geändert wurden. Sie erwähnten, dass die Messung der Anzahl verschiedener Titel pro Artikel und die Beobachtung eines Anstiegs der durchschnittlichen Anzahl von Titeln pro Artikel auf solche Tests hinweisen könnten. Der Sprecher interpretierte, dass die Tests sporadisch und möglicherweise von SPIEGEL ONLINE durchgeführt wurden, basierend auf ihrer Datenanalyse.

Keypoint ads

00:48:41

Einschluss von Spiegel Plus Artikeln

Der Sprecher bestätigte, dass sie Spiegel Plus-Artikel in ihre Analyse einbezogen haben und erwähnte, dass sie ein Plus-Konto haben, das den Inhalt automatisch entschlüsselt. Sie äußerten anfängliche Frustration, als die Plus-Artikel eingeführt wurden, teilten jedoch später einen Blogbeitrag über die Entschlüsselung von ihnen und betonten, dass Spiegel Plus-Artikel in der Regel aus 1100 Wörtern bestehen und somit einen Mehrwert für das Geld bieten.

Keypoint ads

00:49:32

Inhaltsanalyse und Schlüsselwortfrequenz

Der Sprecher wurde gefragt, ob sie den Inhalt auf Schlüsselwortfrequenz und Übereinstimmung mit Tags oder Kategorien analysierten, um die Genauigkeit der Markierung zu bestimmen. Sie gaben zu, eine solche Analyse noch nicht durchgeführt zu haben, erwähnten jedoch die Möglichkeit, relevante Wörter in Artikeln für einen raffinierteren Markierungsansatz in der Zukunft zu verwenden.

Keypoint ads

00:50:11

Software für die Datenanalyse verwendet

Der Sprecher gab bekannt, dass er den Python P-Datenstapel für die Datenanalyse verwendet, wobei eine benutzerdefinierte Software für die Datenabfrage auf einem Server läuft. Sie nutzten Pandas für die Analyse und Machine-Learning-Tools wie scikit-learn. Darüber hinaus wurde Tableau für die Visualisierung, die effiziente Handhabung großer Datensätze und Geffi für die Graphvisualisierung verwendet.

Keypoint ads

00:51:08

Echtzeit-Datenanalyse

Der Sprecher klärte auf, dass die Daten in Echtzeit gesammelt, aber retrospektiv analysiert wurden. Sie erwähnten, dass die Daten zunächst roh gesammelt wurden, dann Merkmale extrahiert wurden und die Analyse auf einem Teil der Daten durchgeführt wurde, der in den RAM passte, was auf einen sequenziellen Prozess der Datenverarbeitung hinweist.

Keypoint ads

00:51:32

Datenanalyse-Funktionen

Der Sprecher diskutiert die Fähigkeit, Funktionen in drei Ebenen für die Datenanalyse zu erstellen. Während der Präsentation wurde die Daten zehn Mal heruntergeladen, was auf gleichzeitiges Herunterladen während der Diskussion hinweist.

Keypoint ads

00:51:51

Inhaltsanalyse

Ein Vorschlag wird gemacht, spezifische Wortgruppen in Artikeln zu analysieren, um wiederkehrende Phrasen zu identifizieren. Die Idee, Artikel zu bewerten, um den Prozentsatz neuer Inhalte zu bestimmen, der durchschnittlich bei 73% liegt, wird hervorgehoben.

Keypoint ads

00:52:19

Kommentierungseinschränkungen für Israel-Artikel

Der Sprecher hinterfragt, ob die Unfähigkeit, Kommentare zu Artikeln über Israel abzugeben, auf Ressourcenbeschränkungen zurückzuführen sein könnte, die möglicherweise zu rechtlicher Zensur führen. Es wird auf rechtliche Beschränkungen im deutschen Recht hingewiesen, die redaktionelle Entscheidungen beeinflussen können.

Keypoint ads

00:53:15

Open Source Software

Der Sprecher erwähnt die Einfachheit, die Software als Open Source anzubieten, um sie an andere Quellen wie die Tagesschau anzupassen. Obwohl nicht speziell erwähnt, merkt der Sprecher an, dass das Erstellen eines Skripts zum regelmäßigen Herunterladen und Speichern von Artikeln keine komplexe Aufgabe ist.

Keypoint ads

00:53:54

Datenvisualisierungstechniken

Der Sprecher erklärt den Prozess, mehrere Dimensionen auf zwei Dimensionen zu reduzieren, um Daten visualisieren zu können. Techniken wie Force Atlas 2 werden verwendet, um Knoten effektiv zu positionieren, relevante Verbindungen sicherzustellen und theoretische Grenzen zu berücksichtigen.

Keypoint ads

00:54:52

Rückmeldung vom Spiegel

Der Sprecher erinnert sich an eine positive und interessierte Aufnahme seitens Spiegel bezüglich der präsentierten Analysen. Die Erfahrung wurde als informativ und ansprechend empfunden, im Gegensatz zu Erfahrungen bei anderen Organisationen.

Keypoint ads

00:55:24

Erkunden mathematische Ansätze

Die Diskussion befasst sich mit der Erforschung mathematischer Ansätze in der Forschung. Es wird vorgeschlagen, die Singulärwertzerlegung der Adjazenzmatrix von Tags in Betracht zu ziehen, ähnlich der Methode von Google. Der Sprecher fragt sich, ob dieser Ansatz einen visuell ansprechenden Graphen liefern würde, und bemerkt, dass die Werte der Kanten letztendlich äquivalent sein können, wenn genügend Dimensionen verwendet werden.

Keypoint ads

00:56:16

Monte Carlo Methoden zur Kartierung

Das Gespräch dreht sich um Monte-Carlo-Methoden, die zur Positionierung von Federn in Karten verwendet werden. Die Stabilität dieser Methoden wird in Frage gestellt, da die Stabilität theoretisch nicht nachgewiesen werden kann. Sie werden jedoch als etabliert für große Graphen anerkannt, bei denen die Planarisierung keine Rolle spielt und Iterationen verwendet werden, bis zufriedenstellende Ergebnisse erzielt werden.

Keypoint ads

00:57:01

Markov-Analyse zur Artikelgenerierung

Die Idee, Markov-Analyse zur Erzeugung von Spiegelartikeln anzuwenden, wird vorgeschlagen. Der Sprecher bekundet Interesse daran, eine E-Mail mit weiteren Details zu diesem Thema zu erhalten, und signalisiert die Bereitschaft, diesen Ansatz zur Generierung von Inhalten zu erkunden. Darüber hinaus wird das Potenzial zur Generierung von Kommentaren zu spezifischen Themen erwähnt, was den Umfang der automatisierten Inhalteerzeugung erweitert.

Keypoint ads

00:57:40

Zusammenfassung und zukünftige Richtungen

Als die Diskussion ihrem Ende entgegengeht, erkennen die Teilnehmer das Ende ihrer gemeinsamen Zeit an. Der Sprecher erwähnt humorvoll, dass es nun zum nächsten Bierlokal geht, was eine lockere und fröhliche Atmosphäre unterstreicht. Mit Dankbarkeit für die geteilten Erkenntnisse endet das Gespräch mit einer Wertschätzung für die Erkundung von Mathematik und Datenbewusstsein.

Keypoint ads

Did you like this Youtube video summary? 🚀

Try it for FREE!

bottom of page