A bisserl Statistik und Analyse

Bis zu diesem Beitrag umfasst der Blog etwas mehr als 1.000 Artikel und etwas mehr als 500 Kommentare. Bislang wurden fast alle Kommentare von mir freigeschaltet, auch kritische, weil die Regeln (Impressum) beachtet wurden.

In den letzten Wochen sind jedoch eine ganze Menge Kommentare hinzu gekommen, die von mir nicht freigeschaltet wurden. Warum soll hier gar nicht erläutert werden, sondern welche Informationen man aus den Kommentaren an sich ziehen kann. Oberflächlich betrachtet stammen fast alle von verschiedenen Personen, was implizieren soll, dass eben eine ganze Menge Leute mit den Positionen dieses Blogs – zum größten Teil gesicherte Fakten und naturwissenschaftliche Schlussfolgerungen, daneben natürlich auch so mancher Seitenhieb auf die grünen Dumpfbacken – nicht einverstanden sind. Genauer betrachtet stammen aber fast alle Kommentare von ein und derselben Person. Dafür gibt es eine ganze Reihe von Indizien:

  • Sehr viele Kommentare haben als Absender die gleiche IP-Adresse, kommen also vom gleichen Gateway des Providers (welcher das ist, ist natürlich auch heraus zu bekommen). Bei der Vielzahl der Provider und der von ihnen benutzten IP-Adressbereiche sind gleiche IP-Adressen unterschiedlicher Nutzer ziemlich unwahrscheinlich. Selbst ein und derselbe Nutzer taucht oft mir unterschiedlichen IP-Adressen auf, was eine Analyse aufwändig macht. Bestimmte Infrastrukturen beim Provider führen allerdings dazu, dass Kunden vom gleichen Server bedient werden. Gleiche IP-Adresse = gleicher Nutzer, unabhängig vom Namen.
  • Zwar ein relativ schwaches Indiz, aber immerhin: das Zeitfenster, in denen die Kommentare abgesandt wurden, ist zu eng, um zu verschiedenen Nutzern zu passen.
  • Die Kommentatoren (oder der Kommentator) ist in gewisser Weise lernfähig (leider nicht auf den entscheidenden Gebieten). Kommentiert wurde mit Name und Email-Adresse, die schnell als nicht existierend entlarvt werden kann. Nach einem entsprechenden Hinweis in einem Beitrag erschienen alle Kommentare ohne Emailadresse, so als ob alle folgenden das gelesen hätten. Dafür wurden Kommentare an Beiträge angehängt, die ganz andere Themen behandelten (also doch zu doof zum Lesen). Erst nach einem weiteren Hinweis erschienen Kommentare dann an den richtigen Stellen. Transferleistungen im Denken sind offenbar weniger angesagt.
  • Da die Beiträge nicht freigeschaltet wurden, verlor der Kommentator offenbar die Übersicht auf verwendete Namen. So kommentierten einmal Sina Rashedi, Sabine Vogt und Hannes, beim nächsten Mal Sina Rahadi, Sandra Vogt und Jannes. Mit Tippfehlern hat das aus verschiedenen Gründen nichts zu tun.
  • Die Kommentare sind zwar etwas kurz, aber ich habe trotzdem mal einen experimentellen Filter drauf losgelassen, der anhand verschiedener stilistischer und anderer Kriterien untersucht, ob verschiedene Texte von verschiedenen Autoren stammen oder dem gleichen Autor zuzuordnen sind. Die Anzahl der Kommentare ist jedenfalls ausreichend. Der ordnete mit recht hoher Wahrscheinlichkeit die fraglichen Kommentare dem gleichen Autor zu.

Man könnte noch andere Maßstäbe hinzu ziehen, beispielsweise die thematische Tendenz der Kommentare oder gewisse Hintergrundkenntnisse, die der Kommentator offensichtlich gegooglet hat. Auch damit landet man bei einer hohen Wahrscheinlichkeit für einen Autor.

Also, Grüner Troll, wenn es dir nicht zu langweilig wird, mach ruhig weiter. Mir wird es nicht zu langweilig, den Quark in die Analyse zu schieben und nicht zuzulassen.