Schwarmintelligenz: NASA-Spiel: Auswertung
Kürzlich haben wir das altbekannte NASA-Spiel neu mit Schwarmintelligenz gespielt. Hier kommt die Auswertung und eine sehr interessante Erkenntnis zur Schwarmintelligenz:
Zunächst die Auswertung. Die Aufgabe war, auf dem Mond nach einer außergewöhnlichen Landung wegen technischer Schwierigkeiten möglichst heil zum Mutterschiff zu gelangen und dazu 15 Gegenstände ihrer Wichtigkeit für das Überleben nach zu ordnen. Die NASA-Experten sehen die Prioritäten [Begründung] so:
- 2 Sauerstofftanks 50 l [füllen Atmungsbedarf]
- 20 Liter Wasser [ergänzt Wasserverlust infolge Schwitzens usw.]
- 1 Sternenkarte (Mondkonstellation) [eines der wichtigsten Orientierungsmittel]
- 1 Dose Lebensmittelkonzentrat [notwendige Tagesration]
- 1 FM-Empfänger und Sender, mit Sonnenenergie betrieben [evtl. Verbindung zum Mutterschiff]
- 20 Meter Nylonseil [nützlich beim Zusammenbinden von Verletzten und beim Klettern]
- 1 Erste-Hilfe-Koffer mit Injektionsspritze [Medikamente können wertvoll sein]
- 30 m² Fallschirmseide [Schutz gegen Sonnenstrahlen]
- 1 Rettungsfloß mit CO2-Flaschen [CO2-Flaschen zum Selbstantrieb über Klüfte etc.]
- Signalpatronen (brennen auch im luftleeren Raum) [Notruf, wenn in Sichtweite]
- 2 Pistolen, 7,65 mm incl. Munition [können zur Herstellung von Selbstantriebsaggregaten dienen]
- 1 Dose Trockenmilch [Nahrung, bei Mischung mit Wasser trinkbar]
- 1 tragbarer Kocher [nützlich nur bei Landung auf dunkler Seide des Mondes]
- 1 Magnetkompass [keine Magnetpole - unbrauchbar]
- 1 Schachtel Streichhölzer [kein Sauerstoff auf dem Mond - wenig oder gar nicht zu gebrauchen]
Die Ergebnisse des Experiments:
- Es haben sich 15 Personen beteiligt.
- Ein Ergebnis war “so gut”, dass ich es von der Bewertung ausgenommen habe. Es entsprach exakt der NASA-Liste. Begründung für den Ausschluss: Die Wahrscheinlichkeit, das exakt richtige Ergebnis per Zufall zu finden ist 1:1,3 Billionen! Zum Vergleich: Die Wahrscheinlichkeit im Lotto sechs Richtige zu tippen ist 1:13 Millionen. Die Wahrscheinlichkeit, den Lotto-Jackpot zu knacken 1:130 Millionen. Das wäre immer noch um 10.000fach größer als die exakt richtige Lösung hier. Selbst mit logischen Lösungen ist eine exakte Lösung höchst unwahrscheinlich (was ist unwichtiger: der unbrauchbare Kompass oder die unbrauchbaren Streichhölzer?)
- Die 14 verwertbaren Vorschläge des Schwarms im Vergleich zu der “Ideal”-Lösung der NASA:
Man erkennt auf Anhieb, dass die ersten vier Positionen – die wichtigsten – identisch sind. In den unteren Rängen geht es dann etwas durcheinander. - Zur Bestimmung der Prioritätenreihenfolge des Schwarms habe ich jeweils die vorgeschlagenen Positionen zu den einzelnen Gegenstände der Liste addiert. Nr. 1 wurde dann der Gegenstand mit der geringsten Summe, Nr. 2 der Gegenstand mit der zweitgeringsten Summe usw.
- Um die Güte der Abschätzungen der einzelnen Schwarmmitglieder zu bewerten, habe ich die Differenzen zu den jeweiligen der NASA-Positionen berechnet und als Summe addiert. Beispiel: Persönliche Einschätzung zu Kompass: Position 7, NASA: Position 14. Dies ergibt 7 Fehlerpunkte. Nach dieser Berechnung liegt der schlechteste Einzelschwärmer bei 80 Fehlerpunkten, der beste bei 16 Fehlerpunkten und der Schwarm bei 30 Fehlerpunkten.
- Nur drei Einzelschwärmer sind besser als der Schwarm, aber elf sind schlechter.
- Ich habe mich aber entschieden, das mathematische Verfahren der Fehlerbewertung noch etwas zu verfeinern und die Prioritätenreihenfolge mit zu berücksichtigen (Position 1 hat ein Gewicht von 15, Pos. 2 von 14 usw.). Einfach gesagt: die ersten Positionen sind wichtiger als die letzten. Nach diesem Verfahren ergibt sich folgendes Bild:
Der gelbe Balken ist das Schwarmergebnis (je kleiner je besser). Die drei grünen Balken sind die besten Einzelschwärmer. Die roten Balken sind die Einzelschwärmer, die schlechter als der Schwarm sind und der weiße Balken ist der Fehlerdurchschnitt.
- Kein Einzel-Schwärmer liegt in den ersten vier Positionen richtig, so wie der Schwarm! Nur zwei Schwärmer lagen in den ersten drei Positionen richtig.
Fazit:
Trotz der geringen Beteiligung ist das Gesamt-Ergebnis sehr gut. In der Wirklichkeit hätte mehr als die Hälfte der Individuen nicht überlebt, im Schwarm höchstwahrscheinlich alle.
In dem klassischen NASA-Spiel wird nach der Einschätzung der Einzelpersonen anschließend in Gruppen diskutiert und dann eine Gruppenlösung ermittelt (ausdiskutiert!). Der Zeitbedarf für den ganzen Prozess dauert nach einigen Anleitungen bis zu drei Stunden! Mit der Schwarmintelligenz braucht der ganze Prozess nur wenige Minuten zu dauern: Problem ansehen, persönliche Einschätzung abgeben, Ergebnis nach mathematischen Regeln ausrechnen. Fertig! Das Ergebnis kann viel schneller mit der gleichen oder besseren Qualität ermittelt werden.
Ich bin gespannt auf die Kommentare.
Nachtrag 2007-11-06 15:58:
Während ich diese Auswertung gemacht habe, hat mir in der Zwischenzeit noch eine Mitschwärmerin ihre Einschätzung geschickt. Interessehalber habe ich das Ergebnis noch berücksichtigt und kam aus dem Staunen nicht heraus. Obwohl diese Einzelschätzung “nur” das viertbeste Einzelergebnis war (173 Fehlerpunkte), wurde das Gesamt-Ergebnis erheblich verbessert. Und zwar durch leichte Verschiebungen von Einzelpositionen im mittleren Bereich des Rankings. Das Gesamt-Ergebnis sieht jetzt so aus:

Die Gesamtfehlerpunktezahl (gelber Balken) ist jetzt 133 und damit besser als jedes Einzelergebnis! Ein Schwarm bildet also kein Mittelmaß (weißer Balken: durchschnittlich 309 Fehlerpunkte) sondern kann als Gesamtergebnis besser sein, als jeder Einzelne. Das deckt sich mit vielen Forschungsergebnissen.
Das könnte Sie auch interessieren:








[...] Edit 2007-11-06: Die Ergebnisse gibt es hier: [...]
Hallo Wolff,
danke für deine Rechenkünste, die das Thema sehr aufschlussreich machen.
und warum der Kocher brennt, wenn die Streichhölzer es nicht tun…
Ich frage mich nur, was man auf der dunklen Seite des Mondes kochen könnte (und wozu)
Das Nasa-Experiment zur damaligen Zeit ist sicherlich auch in einem anderen Kontext zu sehen. Dort ging es in den drei Stunden auch darum, verschiedene Sichtweisen anzuerkennen und sich gemeinsam zu einigen, was einen gewissen Sinn darin hat, damit das Team die Entscheidung gemeinsam trägt. In dieser Zeit handelte man noch in der Hauptsache hierarchisch, daher war diese Herangehensweise neu und diskutieren ein Ausdruck der Gleichberechtigung.
Sogar ein richtiges Ergebnis kann oft nicht umgesetzt werden, wenn die meisten es nicht tragen (siehe auch die Leitbild-Diskussion). Im Normalfall hat man ja keine Referenzlösung. Statt der Diskussion würde man heute gemeinsam die Reihenfolge erarbeiten, nachdem man Hintergundinformationen eines Experten gehört hat. Ich könnte mir vorstellen, dass so ein Prozess ca. 45 Minuten dauert, das Ergebnis ganz gut wird und Vertrauen in Teamentscheidungen schafft.
Insofern kommt mir der Mehrwert dieses Prozesses trotz etwas längerer Dauer und Ungenauigkeit größer vor als das isolierte Sammeln von Daten.
Was meinen die anderen?
Liebe Judita,
der Austausch von Informationen und das Lernen ist sicherlich ein wichtiger Prozess und den will ich gar nicht durch Schwarmintelligenz überflüssig machen oder gar eliminieren. Ich finde nur hier bestätigt, was ich aus den Forschungsberichten kenne. Dort wird sogar gesagt, dass die Diskussionen oft kontraproduktiv sind. Es setzen sich Teilnehmer, die gut argumentieren können oder die kraft Amtes eine höhere Autorität haben, meistens durch und bügeln wichtige Einzel- und Randmeinungen unter.
Interessant wäre zu erkennen, wann der Austausch von Informationen angebracht ist und wann man besser erst mal abstimmt. Vielleicht gibt es ja noch eine dritte, bisher nicht entdeckte Möglichkeit, die alles noch besser macht.
Wir lernen jeden Tag dazu.
Ich hoffe
Bei meiner Arbeit ist es wichtig, unterscheiden zu können, ob eine “sachliche” Bewertung Ziel des Prozesses ist, die Stärkung des Teamzusammenhalts oder vielleicht gezielt die Fähigkeit nutzen zu können, die Perspektive zu wechseln (eine sehr wichtige Führungseigenschaft).
Daraus ergibt sich die Wahl der Methode.
Was Bewertungsprozesse angeht, könnte ich mir vorstellen, dass vorherige Information (hier z.B. über Unterschiede der grundsätzlichen Gegebenheiten von Mond und Erde) die Abstimmung verbessert hätten, was denkst du?
Die Unterscheidung finde ich gut. Sehr gut sogar. Das Stärken des Teamzusammenhalts kann ja auch darin bestehen, gemeinsam in die Kneipe zu gehen
Man darf das dann nur nicht mit Arbeit verwechseln. Sicherlich sind in bestimmten Situationen ausgiebige und tiefgründige Gespräche sinnvoll.
Und wenn es dann darum geht, momentan schnell eine gute Lösung zu finden, dann ist manchmal das Abstimmen und Auswerten á la Schwarmintelligenz angesagt.
Jeder zu seiner Zeit. Dann wird es gut.
Zu der Verbesserung der Bewertungsprozesse durch mehr Informationen: Klar, wenn jeder weiß, dass es auf dem Mond kein Magnetfeld gibt und daher der Kompass nichts bringt und dass mangels Sauerstoff in der Luft ein Streichholz sich auch nicht entzünden lässt, führt das zu besseren Ergebnissen. Schwarmintelligenz geht davon aus, dass dies aber gar nicht alle wissen müssen, sondern einige wenige reichen aus. Im Zusammenspiel wird dann etwas richtig Gutes daraus. Das klassische Gruppenexperiment kommt ja durch die Diskussion zu besseren Ergebnissen als der Einzelne (deshalb ist das Experiment ja so berühmt geworden). Nur haben wir jetzt bewiesen, dass es auch ohne Diskussionen geht.
@Wolff Horbach
Danke für das interessante Experiment, die NASA-Übung einmal aus ganz anderer Warte zu betrachten!
@alle
Kleiner Schwank: Wenn Sie bei der Gruppe einen Teilnehmer dabei haben, der auf einem früheren Seminar die Übung ‘Flugzeugabsturz’ gemacht hat, dann haben Sie ein Problem: Dort ist nämlich die wichtigste Erkenntnis, sich ja nicht vom Flugzeug weg zu bewegen. Er will daher in der Regel auch nicht von der Raumfähre zum Mutterschiff gehen. Meist lassen ihn die Anderen dann mit einer der beiden Pistolen zurück!
[...] anfangen? Ein Experiment dazu startete mein Blog-Kollege Wolf Horbach. Hier das Ergebnis des ersten Online-Experiment zur Schwarmintelligenz. Haben Sie also ein praktisches Problem, das Sie gern mittels Schwarmintelligenz angehen lassen [...]
Sehr guter Schwank
Ich kann mir gut vorstellen, dass viele oft klüger sind als der einzelne, schon alleine wegen der unterschiedlichen Perspektiven.
Aber welcher Schwarm liefert die besseren Ergebnisse: viele Nicht-Fachleute genauso wie die Gruppe der Fachleute?
Es wird Zeit für diese Art von Experiment.
Cooles Ergebnis! Ich frage mich, wie kann ich die Schwarmintelligenz verwenden, um Entscheidungen in Gestaltungsprozessen zu erlangen? Die erarbeiten Kompromisse führen meiner Ansicht nach oft zu Lösungen, die alle zufrieden machen, aber keinen glücklich.
@ Peter:
Das Ergebnis von Schwarmintelligenz ist m.E. kein Kompromiss, sondern die beste Lösung, die der Schwarm jetzt finden konnte. Was uns vermutlich fehlt, ist Vertrauen in die Entscheidung des Schwarms.
Jemand hat mal gesagt, ein guter Kompromiss ist, wenn alle gleich unzufrieden sind. Es geht aber bei einer Lösung nicht darum, dass jeder ein wenig nachgibt und man sich in der Mitte trifft. Wir sehen ja gerade an diesem Ergebnis, dass die Lösung viel besser ist als der Durchschnittswert.
Interessant finde ich deine Bemerkung “… alle zufrieden, aber keiner glücklich”. Über den Unterschied zwischen Glück und Zufriedenheit habe ich mir vor einiger Zeit meine Gedanken gemacht.
Jo, Wolff – teile Deine Betrachtung:
Und ich bin ganz froh, dass ich beim NASA Spiel so gut lag, denn bei den reinen “Zahlen-Schätz-Experimenten” bisher war ich ja katastrophal…. Schwarmintelligenz ist eher was für komplexe Problemlösungsstrategien, gelle…
Sehr aufschlussreich.
[...] anfangen? Ein Experiment dazu startete mein Blog-Kollege Wolf Horbach. Hier das Ergebnis des ersten Online-Experiment zur Schwarmintelligenz. Haben Sie also ein praktisches Problem, das Sie gern mittels Schwarmintelligenz angehen lassen [...]
Ihre Meinung!
Kategorien
Blogroll
Business-Club
Partner Blogs
Meta
Schlagwörter
Meistkommentiert
Letzte Artiel