Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.

Text-Algorithmus: Software schreibt 10.000 Wikipedia-Artikel am Tag

Ist das schon Roboter-Journalismus? Der Algorithmus eines Schweden erstellt automatisch zigtausende Wikipedia-Artikel. Das gefällt nicht jedem.

Wikipedia-Logo: "Online die absolute Demokratie schaffen" Zur Großansicht
DPA

Wikipedia-Logo: "Online die absolute Demokratie schaffen"

Sverker Johansson ist ein vielbeschäftigter Mann. Der Schwede, der nicht nur Abschlüsse als Bauingenieur, in Sprachwissenschaften, Ökonomie und Teilchenphysik besitzt, ist zudem einer der fleißigsten Wikipedia-Autoren.

Seitdem der 52-Jährige vor sieben Jahren damit begonnen hat, für die Online-Enzyklopädie zu schreiben, sind 2,7 Millionen Artikel zusammengekommen. Die bearbeiteten Themenfelder reichen von Fliegen und Käfern bis zu philippinischen Städten, wie das "Wall Street Journal" (WSJ) berichtet. Johansson schreibt in drei Sprachen: Schwedisch und zwei Versionen des Philippinischen, von denen eine die Muttersprache seiner Ehefrau ist.

Die Ehrfurcht vor einem so dermaßen fruchtbaren Autor lässt indes ein wenig nach, wenn klar wird, dass Johansson seine Riesenarbeit nicht ohne Hilfe bewerkstelligt hat. Den Hauptteil habe nicht er persönlich verfasst, sondern ein zu diesem Zweck programmierter Bot, berichtet das "WSJ".

Der elektronische Helfer durchforste Datenbanken und jede sonstige verfügbare digitale Informationsquelle und verarbeite das gewonnene Material dann zu kurzen Artikeln. An guten Tagen schaffe Johanssons Lsjbot auf diese Weise bis zu 10.000 Einträge.

Diese computergestützte Aktivität wird von manchen durchaus kritisch beurteilt. Sie finden, derartige Bots würden die Kreativität verdrängen, die nur Menschen besäßen. Es gebe in der Tat eine laute Minderheit, die seine Arbeit ablehne, so der Schwede.

Er selbst verweist darauf, wie rudimentär seine Artikel sind, und dass sie für weiter- und tiefergehende Einträge erstens eine erste Basis bilden und zweitens der thematischen Vielfalt nutzen könnten. Derzeit werde die Mehrzahl der Wikipedia-Einträge von weißen, männlichen Nerds verfasst.

Ohnehin werkeln in der Wikipedia bereits diverse Bots, kümmern sich um Routineaufgaben und spüren Vandalismus auf. Eine eigene Arbeitsgruppe, die "Bot Approvals Group", wacht über die Algorithmen und die Einhaltung der "Bot Policy".

meu

Diesen Artikel...
Forum - Diskutieren Sie über diesen Artikel
insgesamt 20 Beiträge
Alle Kommentare öffnen
    Seite 1    
1. Kreativität durch Bot verdrängt?
noalk 16.07.2014
Mir ist schon sehr oft aufgefallen, dass Texte bei Wikipedia mit anderen, im Www verfügbaren Texten ganz oder passagenweise wortwörtlich übereinstimmen, wohlgemerkt in der deutschen Wikipedia. Dann ist es auch egal, ob die Texte per Bot oder "kreativ" per c&p übernommen werden.
2. @noalk
mw33 16.07.2014
tja, das liegt aber meistens daran, das viele Texte aus WP einfach kopiert werden (ist ja umsonst) und das Urheberrecht kein Schwein im Web interessiert. Im Gegensatz dazu werden Textplagiate in WP-Artikeln relativ schnell entdeckt und auch entfernt.
3. Sehe das nur positiv
dumwibrod 16.07.2014
Ich hatte vor einigen Jahren entdeckt, dass es für meinen Wohnort keinen Wikipedia-Eintrag gab, sondern nur eine Weiterleitung auf den Eintrag der Gemeinde. Deshalb hatte ich mir ein paar Zeilen aus einer Gemeindebroschüre zusammengesucht und die eingestellt. Inzwischen ist dort ein sehr umfangreicher und informativer Artikel entstanden. Von meinen minimalistischen Anfängen wird man wahrscheinlich keinen einzigen Buchstaben mehr finden. Deshalb mein Fazit: Sobald erstmal ein Anfang gemacht ist, finden sich schon Leute, die weitermachen (zumindest in den meisten Fällen). Darum gibt's wirklich nichts gegen diese Botgeschichte einzuwenden.
4.
Mach999 16.07.2014
Zitat von noalkMir ist schon sehr oft aufgefallen, dass Texte bei Wikipedia mit anderen, im Www verfügbaren Texten ganz oder passagenweise wortwörtlich übereinstimmen, wohlgemerkt in der deutschen Wikipedia. Dann ist es auch egal, ob die Texte per Bot oder "kreativ" per c&p übernommen werden.
Zumeist dürfte es so sein, dass einfach aus der Wikipedia abgeschrieben wird. Dann ist natürlich nicht Wikipedia daran schuld. Sollte es anders herum sein (was mir auch schon hin und wieder aufgefallen ist, aber eher selten vorkommt), dann sollte man das hier eintragen: http://de.wikipedia.org/wiki/Wikipedia:L%C3%B6schkandidaten/Urheberrechtsverletzungen
5. Waffengleichheit
cautious_analyst 16.07.2014
Na, gottseidank lasse ich Wikipedia auch nur noch von meinen Robotern lesen.
Alle Kommentare öffnen
    Seite 1    

© SPIEGEL ONLINE 2014
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH



Zum Autor
  • Richard Meusers schreibt als Autor für SPIEGEL ONLINE über die Digitalisierung.

Wikipedia-Richtlinien: "Schädige niemanden"
Schreibstil
Du solltest in neutraler, unzweideutiger Weise dokumentieren, welche verlässlichen unparteiischen Quellen über den Betroffenen veröffentlicht haben und gegebenenfalls auch, was die Person über sich selbst veröffentlicht hat. Der Schreibstil soll neutral, faktenorientiert und zurückhaltend sein. Es sollten weder hagiografische noch sensationsheischende Töne vorkommen. (…) Wenn du über ein negatives Ereignis schreibst, berücksichtige auch entlastende Informationen, bemühe dich immer um Ausgewogenheit.

Verlässliche Belege
Ohne glaubwürdige Belegangaben ist die Biografie wahrscheinlich Theoriefindung. Im Artikel angegebene Informationen müssen daher unbedingt für jeden einfach zu verifizieren sein. Informationen, die nur auf parteiischen Web-Seiten oder in obskuren Zeitschriften veröffentlicht sind, sollten mit Vorsicht behandelt und nicht verwendet werden, wenn sie tendenziös sind. Informationen aus Büchern und Zeitungen im Selbstverlag, oder von privaten Web-Seiten/Blogs sollten nie benutzt werden, außer sie stammen vom Betroffenen selbst.

Personen des öffentlichen Lebens
Über öffentlich bekannte Personen gibt es in der Regel eine Vielzahl von verlässlichen Quellen, und die Wikipedia-Biografie sollte einfach wiedergeben, was dort steht. Andererseits haben auch diese Personen ein Recht auf Privatsphäre. Nur wenn ein Vorwurf oder Zwischenfall bedeutsam, und in solchen angesehenen Veröffentlichungen dokumentiert ist, gehört er in den Artikel, und zwar auch, wenn der Betroffene die Erwähnung ablehnt. (…) Grundsätzlich ist – wie bei jedem anderen in einem Artikel erwähnten Faktum – eine Prüfung der enzyklopädischen Relevanz notwendig. In Grenzfällen sollte die Daumenregel lauten "schädige niemanden".

Umgang mit Artikeln über sich selbst
Wir raten zwar davon ab, Artikel über sich selbst zu verfassen (siehe Wikipedia: Eigendarstellung), aber die Betroffenen sind eingeladen, Fehler zu verbessern und ungenaues oder unbelegtes Material zu entfernen. Wenn Sie eine Frage oder ein Problem mit einem Artikel über sich selbst haben, kontaktieren Sie uns bitte über einen der auf Wikipedia: Kontakt angegebenen Wege oder schreiben Sie auf die Diskussionsseite des Artikels. Angaben zum verantwortlichen Betreiber im juristischen Sinn finden Sie im Wikipedia: Impressum.


Netzwelt auf Twitter

Über diesen Account erreichen Sie das Ressort und verpassen keinen Artikel.


Anzeige
  • Christian Stöcker:
    Spielmacher

    Gespräche mit Pionieren der Gamesbranche.

    Mit Dan Houser ("Grand Theft Auto"), Ken Levine ("Bioshock"), Sid Meier ("Civilization"), Hideo Kojima ("Metal Gear Solid") u.v.a.

    SPIEGEL E-Book; 2,69 Euro.

  • Bei Amazon kaufen.
Der kompakte Nachrichtenüberblick am Morgen: aktuell und meinungsstark. Jeden Morgen (werktags) um 6 Uhr. Bestellen Sie direkt hier: