Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
Sports
History
Health & Fitness
About Us
Contact Us
Copyright
© 2024 PodJoint
Loading...
0:00 / 0:00
Podjoint Logo
US
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts124/v4/fa/ae/1a/faae1ad7-9ed1-4ce7-801e-759b440ded48/mza_12235832160165771542.jpg/600x600bb.jpg
Streuspanne – Statistik und ihre Kuriositäten
Fraunhofer ITWM
41 episodes
3 days ago
Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.
Show more...
Mathematics
Science
RSS
All content for Streuspanne – Statistik und ihre Kuriositäten is the property of Fraunhofer ITWM and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.
Show more...
Mathematics
Science
Episodes (20/41)
Streuspanne – Statistik und ihre Kuriositäten
Künstliche Intelligenz im Weinglas und was dabei schiefgeht (Folge 31)

In der aktuellen Episode nehmen Jochen Fiedler und Esther Packullat vom Streuspanne-Team gemeinsam mit Gast Marcel Hensel, eine Studie unter die Lupe, die verspricht, Weinqualität per Machine Learning allein anhand von Inhaltsstoffen vorhersagen zu können. Marcel ist Postdoc am Lehrstuhl Digital Farming der Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau RPTU. Sie zeigen gemeinsam auf, warum die methodischen Ansätze der Studie grandios danebengehen.

Die Idee klingt spannend: Systematische, blinde Verkostungen treffen auf umfassende Laborwerte. Dabei wurden zahlreiche chemische Parameter wie Aromastoffe, Farbstoffe und pH-Wert gemessen, um Rückschlüsse auf die sensorische Qualität des Weins zu ziehen. Doch bei genauerem Blick offenbaren sich handfeste Fehler, die die Ergebnisse leider komplett entwerten.

Was erwartet Dich in dieser Episode?

• Die Grundfrage: Gibt es objektive Weinqualität? Wie könnte man das wissenschaftlich erfassen?

• Methodische Mängel: Wir beleuchten die Probleme der Studie, einschließlich der willkürlichen Klassifikation von Weinen und das Fehlen einer normierten Qualität.

• Datensatz-Problematik: Mit nur 18 Weinen und der Erzeugung synthetischer Daten – wie kann das funktionieren?

• Die Rolle von Machine Learning: Der Einsatz von ML-Algorithmen und die Risiken, die mit einer schlechten Datenbasis einhergehen.

• Wissenschaftliche Standards: Einblicke in die Herausforderungen der akademischen Publikationskultur und wie sie zu minderwertiger Forschung führen kann.

Was hier als wissenschaftliche Forschung daherkommt, ist am Ende eher eine hübsch verpackte Statistik-Falle – und taugt leider kaum als Grundlage für belastbare Aussagen.

Reinhören und die Wahrheit mit uns entkorken!

Wir erwähnen folgende Links, Artikel und Podcasts in der aktuellen Folge:

P. Bhardwaj, P. Tiwari, K. Olejar Jr et al. (2022). A Machine Learning Application in Wine Quality Prediction. Machine Learning with Applications. 8.

https://s.fhg.de/wein-ki

Zurückspulen lohnt sich: Frühere Episoden

• Podcast »Streuspanne – Künstliche Intelligenz und Statistik – Ist KI nur glorifizierte Statistik? KI hieß mal ML« 👉 www.itwm.fraunhofer.de /ki-statistik

• Podcast »Streuspanne – Künstliche Intelligenz und Statistik – Neuronale Netze: Wie Maschinen das Denken lernen« 👉 www.itwm.fraunhofer.de/ki-neuronale-netze


Gestalte unseren Podcast mit!

Du hast ein Zahlenphänomen entdeckt, das wir besprechen sollen? Oder eine Statistik in den Medien gelesen, die wir in der »Streuspanne« einmal genauer unter die Lupe nehmen sollen? Dann melde Dich gerne über presse(at)itwm.fraunhofer.de bei uns!

Show more...
1 month ago
57 minutes 29 seconds

Streuspanne – Statistik und ihre Kuriositäten
Zahlen, Zeichen und biblische Zufälle? Die Welt der Numerologie unter der Lupe (Folge 30)

Was ist eigentlich die Quersumme Deines Vornamens? Hast Du etwa nie darüber nachgedacht? Laut Numerologie solltest du das schleunigst nachholen, denn diese Zahl und ihre energetische Schwingung kann Dein Schicksal voraussagen!

Eigentlich zucken wir immer innerlich zusammen, wenn von »energetischen Schwingungen« die Rede ist, die unser Leben lenken sollen. Die Numerologie ermittelt unsere Lebenszahlen und verspricht auf mystische Weise Einblicke in unser gegenwärtiges Potential und unsere Zukunft.

Unser Streuspanne-Team Esther Packullat, Sascha Feth und Jochen Fiedler gehen diesem ominösen Zahlenzauber nach und klären, ob es sich wirklich um eine verborgene Wissenschaft handelt oder doch um Aberglauben.

Klingt spannend? Reinhören lohnt sich signifikant!


Wir erwähnen folgende Links, Artikel und Podcasts in der aktuellen Folge:

Statistische Behandlung des Bibelcodes:

  • McKay, B. D., Bar-Natan, D., Bar-Hillel, M., & Kalai, G. (1999). Solving the Bible Code Puzzle. Statistical Science, 14(2), 150-176.
  • Link: https://s.fhg.de/bible-code


Publikation von Jeremy Genovese zu Nobelpreisträgern und Lebenszahlen:

  • Genovese, J. (2007). Numerology and Nobel Laureates. Journal of Scientific Exploration, 21(2), 297-302.
  • Link: https://s.fhg.de/genovese


Zurückspulen lohnt sich: Frühere Episoden

  • Podcast »Streuspanne – Statistik und ihre Kuriositäten«: Das Benfordsche Gesetz 👉 www.itwm.fraunhofer.de/benfordsche-gesetz
  • Podcast »Streuspanne – Statistik und ihre Kuriositäten«: Statistik beweist: Parapsychologie ist (kein) Humbug 👉 www.itwm.fraunhofer.de/parapsychologie
  • Podcast »Streuspanne – Statistik und ihre Kuriositäten«: Gibt es den Zufall wirklich? 👉 www.itwm.fraunhofer.de/streuspanne-zufall


Gestalte unseren Podcast mit!

Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns: presse@itwm.fraunhofer.de.


Show more...
2 months ago
29 minutes 52 seconds

Streuspanne – Statistik und ihre Kuriositäten
»Streuspanne-Lexikon« – W wie Wurstkatastrophe

Der neue Eintrag unseres Streuspanne-Lexikons beschäftigt sich mit einem Begriff, der auf den ersten Blick eher nach Imbissbude als nach Mathematik klingt: der Wurstkatastrophe.

Dabei geht’s nicht um Frühstück und schon gar nicht um Fleisch – sondern rein um Mathematik. Diese Wurst ist also zu 100 Prozent vegan – und zu 100 Prozent nerdig.

Wir klären, warum Kugeln, die wie Würste aussehen, plötzlich eine Katastrophe auslösen – und was das Ganze mit konvexen Hüllen, Clusterbildungen und optimalem Packen zu tun hat.

Klingt schräg? Ist es auch. Und trotzdem steckt echte Mathematik dahinter, mit Anwendungen von der Materialforschung bis zur Kryptographie.

Vielen Dank an die treue Hörerin für die Anregung zu diesem Lexikon-Eintrag – Habt Ihr selbst kuriose Begriffe oder mathematische Fragen, die wir im »Streuspanne«-Podcast aufgreifen sollen? Dann schreibt uns gerne an presse@itwm.fraunhofer.de – wir freuen uns auf Eure Ideen!

Falls Ihr von einer regulären Episode hierher gefunden habt: springt schnell zurück, dort geht’s weiter!


Show more...
3 months ago
4 minutes 25 seconds

Streuspanne – Statistik und ihre Kuriositäten
Künstliche Intelligenz mit Tiefgang – Deep Learning, Sprachmodelle und die Frage nach dem Bewusstsein (Folge 29)

In der finalen Folge unserer Mini-Serie zu »Künstlicher Intelligenz (KI) und Statistik« wird es tiefgründig – im wahrsten Sinne des Wortes. Unser Podcast-Team – bestehend aus Esther Packullat, Sascha Feth und Jochen Fiedler – beschäftigt sich mit den großen Sprachmodellen wie GPT-4, Llama oder Gemini.

Wir werfen einen Blick hinter die Kulissen und diskutieren spannende Fragen wie:

• Was macht diese Modelle so leistungsfähig?

• Wie funktionieren große Sprachmodelle eigentlich?

• Was heißt Deep Learning – und was unterscheidet es von Shallow Learning?

• Wie arbeiten Neuronale Netze – und warum spielt ihre Topologie eine entscheidende Rolle?

• Inwiefern lassen sich die Fähigkeiten großer KI-Modelle wirklich vorhersagen?

• Warum ist Deep Learning mehr als nur angewandte Statistik?

• Was ist Emergenz – und warum überrascht uns KI manchmal selbst?

• Und schließlich die große Frage: Werden KI-Systeme eines Tages ein Bewusstsein entwickeln? Was würde das bedeuten?

Unsere beiden Statistik-Kollegen sind sich einig: Die Entwicklung geht in eine spannende Richtung – und wir stehen erst am Anfang.

Buchtipps aus der Folge:

Metzinger, Thomas (2014). Der Ego-Tunnel: Eine neue Philosophie des Selbst: Von der Hirnforschung zur Bewusstseinsethik. Piper Verlag.

Ramakrishnan, Venkatraman (2024). Warum wir sterben: die neue Wissenschaft des Alterns und die Suche nach dem ewigen Leben. Klett-Cotta.

Gestalte unseren Podcast mit!

Du hast ein Zahlenphänomen entdeckt, das wir besprechen sollen? Oder eine Statistik in den Medien gelesen, die wir in der »Streuspanne« einmal genauer unter die Lupe nehmen sollen? Dann melde Dich gerne über presse@itwm.fraunhofer.de bei uns!


Show more...
4 months ago
41 minutes

Streuspanne – Statistik und ihre Kuriositäten
Der Fluch einfacher statischer Maßzahlen – Harm-to-Benefit-Ratio bei Zulassungsstudien (Folge 28)

In der aktuellen Folge unseres Podcasts »Streuspanne« heißt es back to the roots! Wir werfen erneut einen kritischen Blick auf die Bewertung der Wirksamkeit von Corona-Impfstoffen – wie schon in unserer allerersten Folge. Diesmal dreht sich alles um das sogenannte Harm-to-Benefit-Ratio, eine vermeintlich neue Kennzahl, die das Schaden-Nutzen-Verhältnis von Impfstoffen besser messbar machen soll. Grundlage der Diskussion ist eine Publikation einer universitär angesiedelten Gruppe um Falk Mörl, Michael Günther und Robert Rockenfeller mit dem Titel: »Is the Harm-to-Benefit Ratio a Key Criterion in Vaccine Approval?«

Fünf Jahre nach dem ersten COVID-19-Fall gibt es immer wieder Versuche, neue Analysen oder sogar Kennzahlen für die »Risiko-Nutzen-Abwägung« von Impfstoffen zu etablieren. Der freie Journalist Martin Rücker hat uns auf eine solche neu vorgeschlagene Maßzahl und die Diskussion rund um ihren Nutzen aufmerksam gemacht. Laut den Berechnungen würde der BioNTech-Impfstoff dabei besonders schlecht abschneiden.


Doch wie belastbar ist dieser Wert wirklich? Und ist das zugrunde liegende Modell überhaupt geeignet, in der konkreten Anwendung eine valide Aussage über das Schaden-Nutzen-Verhältnis zu treffen?

Unsere bloggenden Statistiker Sascha Feth und Jürgen Fiedler schauen sich das genauer an und äußern Zweifel an den wissenschaftlichen Techniken und Methoden. Gemeinsam mit den beiden Experten diskutiert Esther Packullat unter anderem folgende Punkte:

• Harm-to-Benefit-Ratio: Was ist das überhaupt für ein Wert und wie wird er berechnet?

• Wie sieht die Kritik an diesem vorgeschlagenen Wert aus?

• Ist der Nutzen der Impfung angemessen berücksichtigt, wenn man sich auf den – relativ kurzen – Beobachtungszeitraum der Zulassungsstudie bezieht?

• Ist die neue Kennzahl überhaupt nützlich?

• Warum ist die Diskussion um die sogenannten »severe adverse events« und das gesamte Wording so entscheidend und gleichzeitig so schwierig für die Interpretation der Ergebnisse?

In der aktuellen Folge erwähnen wir folgende Links, Artikel und Podcasts:

• Meinungsartikel zur Einführung des »Harm-to-Benefit Ratios« nach Mörl et al.: https://s.fhg.de/Harm-to-Benefit-Ratio

• Zulassungsstudie von BioNTech und Supplementary Material: https://s.fhg.de/Zulassungsstudie

• Unsere erste Streuspanne-Folge unter dem Titel »Was bedeutet Wirksamkeit bei Corona-Impfungen?«: https://s.fhg.de/Wirksamkeit-Corona-Impfstoff



Außerdem sind im Nachgang zu unseren Experten-Statements folgende Artikel von Martin Rücker erschienen (beide hinter Bezahlschranke):

• Martin Rücker auf www.riffreporter.de: »Corona-Impfstoffe: 25-mal mehr Schaden als Nutzen? Wo eine spektakuläre Analyse falsch liegt«: https://s.fhg.de/Artikel-Corona-Impfstoff-Kritik

• Martin Rücker in der Berliner Zeitung »Corona-Impfstoff: Kritik an Analyse zum Schaden-Nutzen-Verhältnis«: https://s.fhg.de/Artikel-Corona-Impfstoffe


Gestaltet unseren Podcast mit!

Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen? Oder eine Statistik in den Medien gelesen, die wir in der »Streuspanne« einmal genauer unter die Lupe nehmen sollen? Dann meldet Euch gerne über presse(at)itwm.fraunhofer.de bei uns!


Show more...
4 months ago
52 minutes 21 seconds

Streuspanne – Statistik und ihre Kuriositäten
Kann man mit Statistik den nächsten Bundeskanzler vorhersagen? (Folge 27)

In der aktuellen Folge unseres Podcasts »Streuspanne« dreht sich alles um Wahlumfragen, Prognosen und ihre Unsicherheiten.

Anlässlich der überraschend deutlichen Wiederwahl von Donald Trump werfen wir einen genaueren Blick darauf, wie solche Prognosen entstehen, welche Fallstricke sie bergen und wie wir ihre Qualität bewerten können.

Schließlich stehen auch bei uns in Deutschland Wahlen vor der Tür und wir möchten wissen, ob uns eine ähnliche Überraschung wie in Amerika erwartet.

Mit den Statistik-Experten Sascha Feth und Jochen Fiedler diskutiert Esther Packullat unter anderem folgende Punkte:

· Warum Wahlumfragen keine eigentlichen Prognosen sind

· Wie sich Prognosen und Unsicherheiten mathematisch bewerten lassen

· Warum Mittelwerte aus mehreren Prognosen oft zuverlässiger sind

· Weshalb Trumps Wahlsieg 2024 zeigt, dass systematische Fehler in Prognosen ein großes Problem sind

Außerdem gibt es spannende Vergleiche zu Wettervorhersagen, Quizsendungen und sogar zur Anzahl verkaufter Schlitten!


Wir erwähnen folgende Links, Artikel und Podcasts in der aktuellen Folge:

· Streuspanne-Folge 4 »Wie funktionieren Wahlprognosen?«: www.itwm.fraunhofer.de/wahlprognose

· Streuspanne Folge 20 »Viel Lärm um Bias«: https://www.itwm.fraunhofer.de/podcast-noise

· Streuspanne Folge 6 »Haben Sie schon mal in den Badesee gemacht?«: https://www.itwm.fraunhofer.de/Streuspanne-Badesee

· Streuspanne Lexikon »K wie Konfidenzintervall“: Podcast »Streuspanne –Statistik und ihre Kuriositäten«: K wie Konfidenzintervall - Fraunhofer ITWM

· US-Wahlergebnisse in den Swingstates: https://s.fhg.de/us-wahlergebnisse-24

· Sonntagsfrage Allensbach https://s.fhg.de/sonntagsfrage-allensbach-25

· US-Election Forecast von fivethirtyeigth.com: https://s.fhg.de/US-election-forecast

· Link zur Datei: https://s.fhg.de/datei-fivethirtyeight

· Video von INSA zu sicheren Stimmen und maximal möglichem Potential: https://s.fhg.de/insa-meinungstrend


Gestaltet unseren Podcast mit und meldet Euch!

Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns.

Show more...
6 months ago
40 minutes 19 seconds

Streuspanne – Statistik und ihre Kuriositäten
KI in seichten Datengewässern - Dritter Teil der Miniserie »Künstliche Intelligenz (KI) und Statistik«

In der dritten Folge unserer Miniserie »Künstliche Intelligenz (KI) und Statistik« dreht sich alles um »Shallow Learning« oder auch in Deutsch »Seichtes Lernen«. Unser Podcast-Team –bestehend aus Sascha Feth, Jochen Fiedler und Esther Packullat – klärt in dieser Episode, was sich hinter diesem Konzept verbirgt. Gemeinsam beleuchten wir, wie unzureichende Trainingsdaten und historische Verzerrungen (Stichwort Bias) die Leistungsfähigkeit von KI-Systemen beeinflussen. Außerdem hinterfragen wir, ob Fehler in Algorithmen bereits vor der Entwicklung von KI-gestützten Systemen auftraten – und wie sich solche Probleme beheben lassen. 

Schon bald wird klar: Ohne hochwertige Daten kann keine KI ihr volles Potenzial entfalten. Um das greifbar zu machen, bringen wir konkrete Beispiele ins Spiel: 

  • Nicht repräsentative Trainingsdaten: Warum das KI-Bestellsystem von McDonald's scheiterte und welche Einblicke das Buch »Unsichtbare Frauen« liefert 

  • Historischer Bias: Was wir aus Episode 20 »Viel Lärm um Bias« lernen können 

  • Menschliche Entscheidungen versus KI: Welche Entscheidungen müssen bei einem Menschen verbleiben und die Meinung der »UNESCO«  

  • Softwarefehler vor dem KI-Zeitalter: Welche Fehler in den 90er Jahren die Raumfahrt herausforderten 

  • Probleme des Community-Engagements: Der Fall des Microsoft-Chatbots »Tay« 

Im nächsten Teil unserer Miniserie richten wir den Blick auf »Unsupervised Learning«. Hier lernen Modelle selbstständig und entdecken Muster – ganz wie Archäologen, die versuchen, eine alte Sprache zu entschlüsseln. 

Gestaltet unseren Podcast mit! 

Wie immer gilt: Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen, die wir in der »Streuspanne« analysieren sollen? Dann meldet Euch gerne bei uns und wir bringen Euer Thema in die nächste Folge! 

Darauf wird in dieser Folge verwiesen: 

Weiterführende Artikel: 

  • https://s.fhg.de/mcdonalds-ai-drive-thru  

  • https://s.fhg.de/ki-unesco 

  • https://s.fhg.de/softwarefehler-raumfahrt 

  • https://s.fhg.de/microsoft-chatbot-tay  

Buchtipp:  

Caroline Criado-Perez: Unsichtbare Frauen – Wie eine von Daten beherrschte Welt die Hälfte der Bevölkerung ignoriert. München: btb Verlag (2020). 

Passende Folge aus der »Streuspanne«-Welt: 
Folge 20: Viel Lärm um Bias – Wie Noise Entscheidungen und Statistiken verzerrt: https://www.itwm.fraunhofer.de/podcast-noise  

 

Folge 6: Haben Sie schon mal in den Badesee gemacht? 

https://www.itwm.fraunhofer.de/de/abteilungen/mf/aktuelles/blog-streuspanne/podcast-badesee-statistik-peinlichkeiten.html 

Show more...
6 months ago
26 minutes 18 seconds

Streuspanne – Statistik und ihre Kuriositäten
Neuronale Netze: Wie Maschinen das Denken lernen - Zweiter Teil der Miniserie »Künstliche Intelligenz (KI) und Statistik«

In der neuen Folge unserer Miniserie zu KI und Statistik dreht sich heute alles um Neuronale Netze. Unser Team, bestehend aus Sascha Feth, Jochen Fiedler und Esther Packullat, erklärt, wie die »künstlichen Gehirne« funktionieren und wie Maschinen mithilfe von Millionen von verbundenen Neuronen lernen, komplexe Aufgaben zu meistern – von Bilderkennung bis zur Sprachverarbeitung. Was sind Neuronale Netze eigentlich? Wie sind sie aufgebaut? Was haben Katzen damit zu tun? Wie bilden sie den Lernprozess des menschlichen Gehirns nach? Außerdem lösen wir die Aufgabe aus der vorherigen Folge zum maschinellen Erkennen eines Rechtecks.

Unser passender Buchtipp in dieser Folge, ganz neu erschienen im Fraunhofer Verlag: »Forscherinnen im Fokus – Wir schaffen Veränderung«. Im Buch werden 42 inspirierende Wissenschaftlerinnen im Porträt vorgestellt, die in verschiedenen Anwendungsgebieten mit Künstlicher Intelligenz und Simulation arbeiten – von Klimaschutz bis zu Gesundheit oder in der Mobilität. Direkt zum eBook: www.itwm.fraunhofer.de/forscherinnen-im-fokus

Wer an einem Printexemplar interessiert ist, kann sich gerne bei uns melden.

Im nächsten Teil unserer Streuspanne-Mini-Serie tauchen wir tiefer in das Thema »Training Neuronaler Netze« ein und sind mit KI dann in seichten Datengewässern unterwegs.

Gestaltet unseren Podcast mit!

Wie immer gilt: Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns.

Show more...
9 months ago
26 minutes 39 seconds

Streuspanne – Statistik und ihre Kuriositäten
Künstliche Intelligenz und Statistik – Erster Teil: Ist KI nur glorifizierte Statistik? KI hieß mal ML

In dieser ersten Episode unserer neuen Mini-Serie zu »Künstlicher Intelligenz (KI) und Statistik« gehen wir der Frage nach, ob KI wirklich nur »glorifizierte Statistik« ist – und damit »alter Wein in neuen Schläuchen«.

Gemeinsam werfen wir einen Blick auf die Begriffe KI und Machine Learning (ML). Wir zeigen anhand von greifbaren Beispielen, wie Datenwolken und Algorithmen zusammenhängen. Wie unterscheidet ein Algorithmus Kinder von Erwachsenen? Was hat es mit Random Forests und Entscheidungsbäumen auf sich hat – und warum ist das Ganze ziemlich komplex und auch mehr ist als nur einfache Statistik? Hört selbst!


Eine Aufgabe gibt es diesmal für Euch: Stellt Euch ein kariertes DIN-A4-Blatt vor. Manche Kästchen sind schwarz angemalt, andere bleiben weiß. Auf diese Weise entsteht ein verpixeltes Schwarz-Weiß-Bild. Jetzt malt auf diese Art und Weise auf dem Blatt ein einfaches Rechteck und stellt Euch vor, Ihr müsst einer KI erklären, wie sie dieses Rechteck erkennen kann.

Welche Regeln oder Algorithmen könnten verwendet werden, um die Konturen des Rechtecks zu identifizieren?

Wie würdet Ihr einem Computer diese Wenn-Dann-Regel erklären, mit der er ein Rechteck auf diesem Papier finden soll?

Schreibt uns Eure Ideen und Lösungen per E-Mail an presse(at)itwm.fraunhofer.de oder in Social Media per Direkter Nachricht oder Kommentar. Wir sind gespannt auf Eure Antworten, die wir in der nächsten Folge dann gerne aufgreifen.

Teil Eins ist ein grundlegender Einstieg ins Thema und eine gute Basis, um in einer nächsten Folge mit Neuronalen Netzen und »Künstlichen Gehirne« weiterzumachen. Mit dieser Episode legen wir die Grundlagen für weitere spannende Diskussionen rund Deep Learning und die Zukunft der KI – bleibt also dran und freut Euch auf die nächste Streuspanne!


Show more...
10 months ago
28 minutes 57 seconds

Streuspanne – Statistik und ihre Kuriositäten
Statistiken mit Links – Happy Weltlinkshänder:innentag (Folge 23)

Was haben Julius Caesar, Albert Einstein, Goethe, Marie Curie, Isaac Newton, Beethoven, Charlie Chaplin und Marilyn Monroe gemeinsam? Sie alle waren nicht nur berühmte Persönlichkeiten, sondern auch Linkshänder:innen. Heute, am 13. August, feiern wir den internationalen Tag der Linkshänder:innen – mit unserer neuen Podcast-Episode und natürlich mit kuriosen Statistiken rund um dieses Thema.

Habt Ihr schon einmal darüber nachgedacht, warum nur etwa zehn bis 15 Prozent der Menschen linkshändig sind? Wie entsteht Linkshändigkeit? Oder warum bleibt diese Quote seit etwa 500.000 Jahren nahezu konstant? Unser Team – Sascha Feth, Jochen Fiedler und Esther Packullat – geht in dieser Folge den faszinierenden Fragen und Mythen rund um die Linkshändigkeit nach. Dabei schauen wir uns mögliche biologische Erklärungen, aber auch archäologische Untersuchungen genauer an. Gibt es genetische Gründe? Was hat die rechte Gehirnhälfte damit zu tun? Gibt es Vorteile oder Nachteile im Sport oder gar Statistiken in der Gesundheit? Was hat es mit dem mathematischen Modell zum Thema Linkshändigkeit auf sich?

https://s.fhg.de/mathe-modell-links


Vom Überraschungsvorteil im Boxring bis hin zu den Vor- und Nachteilen – All das gibt es in der neuen Streuspanne-Folge. Wenn Ihr nach dem Hören der neuen Folge noch unsicher seid, ob ihr ihr rechts- oder linkshändig seid, könnt Ihr mit dem »Edinburgh Handedness Inventory« Test (https://s.fhg.de/EHI-Test) 20 Fragen rund um Eure Tätigkeiten mit den Händen beantworten.

Klingt spannend? Reinhören lohnt sich – egal mit welcher Hand Ihr schreibt!


Gestaltet unseren Podcast mit und meldet Euch!

Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns.


Show more...
1 year ago
18 minutes 24 seconds

Streuspanne – Statistik und ihre Kuriositäten
Kann das Benfordsche Gesetz Bielefeld widerlegen? (Folge 22)

Traue keiner Statistik, die Du nicht selbst gefälscht hast. Eigentlich zucken wir immer innerlich zusammen, wenn jemand dieses Zitat in die Runde wirft.

Das ändert jedoch leider nichts daran, dass in Statistiken gelegentlich betrogen wird. Es wäre doch großartig, wenn Statistik wiederrum in der Lage wäre, Betrug in der Statistik aufzudecken. Die Schlange, die sich hier selbst in den Schwanz beißen kann, heißt: Benfordsches Gesetz.

Es regelt auf scheinbar mystische Weise die Auftretenswahrscheinlichkeiten der ersten Ziffer von Zahlen in einem Datensatz. So soll nicht nur Wirtschaftsbetrug und Wahlmanipulation aufgedeckt werden, nein es soll sogar die Bielefeld-Verschwörung befeuern.

Unser Streuspanne-Team Sascha Feth, Jochen Fiedler und Esther Packullat gehen diesem ominösen Gesetz nach und klären, ob Finanzfahnder:innen jetzt arbeitslos werden, ob wir doch von einem zahnlosen Tiger sprechen. Wenn der sich dann selbst in den Schwanz beißt, tut es wenigstens nicht weh.

Klingt spannend? Reinhören lohnt sich signifikant!
Wir erwähnen folgende Links, Artikel und Podcasts in der aktuellen Folge:

Bei der Wirtschaftsprüfung:        Tarek el Sehity, Erik Hoelzl, Erich Kirchler: Price developments after a nominal shock, Benford’s Law and psychological pricing after the euro introduction. 

In: International Journal of Research in Marketing, 22, Amsterdam 2005, Nr. 4, Dezember 2005, S. 471–480

Zur Wahlmanipulation:

Christian Breunig, Achim Goerres: Searching for electoral irregularities in an established democracy: Applying Benford’s Law tests to Bundestag elections in Unified Germany. In: Electoral Studies (= Special Symposium on the Politics of Economic Crisis). Band 30, Nr. 3, 1. September 2011, S. 534–545

      Boudewijn F. Roukema: Benford’s Law anomalies in the 2009 Iranian presidential election

Joseph Deckert, Mikhail Myagkov und Peter C. Ordeshook: The Irrelevance of Benford’s Law for Detecting Fraud in Elections. (PDF) Caltech/MIT Voting Technology Project Working Paper No. 9, 2010

    Zur Bielefeldverschwörung Patrick Winter: Reply to the Comments by Peter Winkler to “Bielefeld May in Fact Not Exist – Empirical Evidence From Official Population Data”. In: Jahrbücher für Nationalökonomie und Statistik. Band 243, Nr. 1, 2023, ISSN 2366-049X, S. 43–44,

 

Gestaltet unseren Podcast mit und meldet Euch!

 

Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns.

Show more...
1 year ago
34 minutes 41 seconds

Streuspanne – Statistik und ihre Kuriositäten
Special: Es gibt keinen Rechtsruck. Leider. Die AfD in der Europawahl seit 2014

Die heutige Kurzfolge des Streuspanne-Podcasts thematisiert die Wahl zum Europäischen Parlament. Das Special steht unter der steilen Aussage: »Es gibt keinen Rechtsruck. Leider. Die AfD in der Europawahl seit 2014«. Im Mittelpunkt des Gesprächs steht – anknüpfend an die letzte Folge – u.a. das Wording von Medien in Zusammenhang mit Statistik und warum wir einen echten positiven Ruck brauchen.

Der »Rechtsruck« ist einer der am häufigsten verwendeten Begriffe rund um so ziemlich jedes Wahlergebnis der letzten Jahre, in dem auch die AfD als Partei vertreten war. So zuletzt auch bei der Europawahl. Doch stimmt das überhaupt? Gab es diesen viel beschworenen Rechtsruck?

Unser Streuspanne-Team Sascha Feth, Jochen Fiedler und Esther Packullat schaut sich das genauer an und blickt auf die deutschen Wahlergebnisse der Europawahlen 2009, 2014, 2019 und 2024.

Das Ergebnis ist leider besorgniserregend.

In diesem Kontext könnte Dich auch unsere Folge zum Thema »Wie funktionieren Wahlprognosen?« interessieren: www.itwm.fraunhofer.de/wahlprognose

Oder unsere letzte Folge »Die Polizeiliche Kriminalstatistik und der Mythos [das Narrativ] der kriminellen Ausländer« unter www.itwm.fraunhofer.de/podcast-kriminalstatistik

Gestaltet unseren Podcast mit und meldet Euch!

Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns unter presse(at)itwm. Fraunhofer.de

Show more...
1 year ago
3 minutes 17 seconds

Streuspanne – Statistik und ihre Kuriositäten
Die Polizeiliche Kriminalstatistik und der Mythos der kriminellen Ausländer (Folge 21)

In der neuen Streuspanne-Folge beschäftigen wir uns mit einem brandaktuellen und kontroversen Thema: Der Polizeilichen Kriminalstatistik – kurz PKS. Diese wird jedes Jahr vom Bundeskriminalamt herausgegeben und zieht oft ein großes Medienecho nach sich. Besonders die Daten zur Herkunft der Täter:innen werden häufig für plakative Schlagzeilen genutzt.

Im Fokus der Podcast-Folge: Wir können wir uns statistisch vor zu schnellen Presseäußerungen abgrenzen, die einfach Zahlen lautstark wiederholen und höchstens am Rande erwähnen, dass diese in einen Kontext eingebettet und erklärt werden müssen, um kein Zerrbild der Gesellschaft zu erhalten. Das Podcast-Team bezieht sich auf die PKS 2023, die im April 2024 veröffentlicht wurde.

Im Blick haben sie besonders eine Zahl, die für vermehrt Schlagzeilen gesorgt hat, die behaupteten, dass die Anzahl der ausländischen Tatverdächtigen stark gestiegen sei – namentlich um 32 Prozent seit 2019. Doch was sagen die Daten wirklich?

Unser Streuspanne-Team Sascha Feth, Jochen Fiedler und Esther Packullat erläutert nicht nur genauer wie die Statistik überhaupt erhoben wird, sondern diskutiert Fragen wie:

- Welche Aspekte müssen wir berücksichtigen, um diese Prozentzahl richtig einzuordnen? Welche Einschränkungen gibt es bei der Erhebung der Statistik?

- Was ist das Dunkelfeld oder die Dunkelziffer?

- Wie spielen Gesetzesänderungen in die Erhebung mit ein?

- Warum ist es wichtig auch das Anzeigeverhalten und die Polizeiaktivitäten bei der PKS zu betrachten?

- Was heißt Aufklärungsquote im Zusammenhang mit der PKS?

- Was haben sozioökonomische Faktoren wie Geschlecht, Bildung oder Perspektive für einen Einfluss?

- Was von all diesen Aspekten ist relevant, um eine Aussage über die Kriminalität von Menschen ohne deutschen Pass treffen zu können? Kann man die 32 Prozent wissenschaftlich bereinigen?

- Ist die PKS eher Abbild oder Zerrbild der Gesellschaft?

Klingt spannend? Reinhören lohnt sich!


Wir erwähnen folgende Links, Artikel und Podcasts in der aktuellen Folge:


• Polizeiliche Kriminalstatistik 2023: https://s.fhg.de/pks-2023

• »Streuspanne« Blogpost zur Dunkelziffer: Wie kann man mit Statistik die Dunkelziffer der Corona-Infektionen bestimmen? www.itwm.fraunhofer.de/dunkelziffer und www.itwm.fraunhofer.de/dunkelziffer-update

• »Streuspanne« Podcast Folge »Haben Sie schon mal in den Badesee gepinkelt?« www.itwm.fraunhofer.de/badesee

• »SWR Kultur Forum« Podcast Folge: Kampf gegen Kinderpornographie – Ist der Staat machtlos? https://s.fhg.de/swr-podcast

• ZEIT-Artikel »Kriminalstatistik: Warum es mehr Straftaten von Ausländern gibt«: Die Zahl ausländischer Tatverdächtiger ist laut polizeilicher Kriminalstatistik stark gestiegen. Dafür gibt es einen naheliegenden Grund, zeigen diese Daten. https://s.fhg.de/zeit-pks-2023

• ZEIT-Artikel »Es ist bizarr, wie die Zahlen überinterpretiert werden«: Die Polizei zählt mehr Gewalttaten und mehr ausländische Verdächtige. Der Kriminologe Tobias Singelnstein warnt: Die Statistik sage wenig über die echte Kriminalität. https://s.fhg.de/zeit-pks-interview

Gestaltet unseren Podcast mit und meldet Euch!


Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne bei uns.


Show more...
1 year ago
42 minutes 31 seconds

Streuspanne – Statistik und ihre Kuriositäten
»Streuspanne-Lexikon« – F wie Freiheitsgrade

Der neue Eintrag unseres »Streuspanne-Lexikons« ist »F wie Freiheitsgrade« – und das, wie immer in unseren Lexikon-Folgen, kurz und knapp in wenigen Minuten.

Freiheitsgrade beschreiben in der Statistik die Anzahl unabhängiger Informationen, die in eine Schätzung einfließen. Wenn also aus n Daten ein Mittelwert berechnet wird, dann fließen n unabhängige Informationen ein – also hat der Mittelwert n Freiheitsgrade. Bei der Standardabweichung bzw. der Varianz sind es hingegen nur n-1.  

Ein bekanntes Beispiel für die Anwendung der Freiheitsgrade ist die Varianzanalyse. Hier untersucht man, ob es signifikante Unterschiede in einem bestimmten Merkmal zwischen verschiedenen Gruppen gibt, etwa in der Lebenserwartung zwischen Geschlechtern oder zwischen Rauchenden und Nichtrauchenden. Man vergleicht dabei die Streuung der Gruppenmittelwerte mit der Streuung innerhalb der Gruppen. Um die Streuung innerhalb der Gruppen zu bestimmen, müssen so viele Gruppenmittelwerte berechnet werden, wie es Gruppen gibt. Daher wird bei der Berechnung der Freiheitsgrade vom Stichprobenumfang nicht nur 1, sondern zusätzlich die Anzahl der Gruppen abgezogen.

Falsch berechnete Freiheitsgrade führen zu ungenauen Schätzungen und verzerrten Ergebnissen. Bei großen Stichproben können kleine Fehler weniger ins Gewicht fallen, aber gerade bei Varianzanalysen ist eine genaue Berechnung der Freiheitsgrade entscheidend, da sie die Grundlage für die Interpretation der kritischen Werte bildet. Was kritische Werte sind, erklären wir Euch übrigens im Lexikon-Eintrag »K wie kritische Werte«.

Ihr habt Statistiken entdeckt oder mathematische Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es Begriffe, die wir im »Streuspanne-Lexikon« für Euch beleuchten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.

Falls Ihr gerade von einer regulären Episode des »Streuspanne«-Podcasts hierher gefunden habt, springt schnell zurück!

Show more...
1 year ago
4 minutes 27 seconds

Streuspanne – Statistik und ihre Kuriositäten
»Streuspanne-Lexikon« – K wie kritische Werte

Im neuen Eintrag unseres »Streuspanne-Lexikons« dreht sich alles um »K wie kritische Werte« – und das, wie immer in unserem Lexikon, kurz und knapp in wenigen Minuten.

Kritische Werte dienen dazu, die Signifikanz von Ergebnissen in statistischen Analysen zu bestimmen. Sie helfen also dabei, festzustellen, ob ein beobachteter Effekt auf Zufall beruht oder tatsächlich signifikant ist.

Um kritische Werte zu bestimmen, tut man so, als würde nur der Zufall agieren, und bestimmt dann extreme Rand-Ereignisse, die sehr selten sind. Dabei regelt die Signifikanz – also eine Art Seltenheitsmaß – was »selten« konkret bedeutet. Das genaue Berechnen erfordert ein wenig Kenntnisse in Wahrscheinlichkeitsrechnung, allerdingt gibt es für die gängigen Testverfahren Formelsammlungen.

Um die Bedeutung kritischer Werte zu verdeutlichen, betrachten wir in diesem Eintrag kurz ein gängiges Beispiel mit dem Wurf einer Münze: Angenommen, wir wollen herausfinden, ob eine Münze fair ist oder nicht. Dafür werfen wir die Münze zehn Mal und beobachten, dass sie neun Mal auf Kopf und nur einmal auf Zahl landet. Das mag vielleicht ungewöhnlich erscheinen, aber es könnte auch durch Zufall passieren. Um das zu überprüfen, betrachten wir die Wahrscheinlichkeiten für verschiedene Ergebnisse. Die Bereiche, in denen die Anzahl der Kopf- und Zahlwürfe als typisch für eine faire Münze betrachtet wird, werden als kritische Werte festgelegt – da Ergebnisse außerhalb dieser Bereiche als selten genug angesehen werden, um nicht auf reinem Zufall zu beruhen. Somit können wir anhand dieser kritischen Werte bestimmen, ob das beobachtete Ergebnis signifikant ist oder nicht.

Im Lexikon-Eintrag stellen wir die kritischen Werte außerdem den p-Werten gegenüber und erwähnen dabei unsere letzte reguläre Folge, die sich ausführlich mit den p-Werten befasst. Diese Folge findet Ihr hier: www.itwm.fraunhofer.de/p-werte

Außerdem spricht Jochen die Binomialverteilung an, die kurze Erklärung dazu, gibt es im »Streuspanne-Lexikon« zu B wie Binomialverteilung unter www.itwm.fraunhofer.de/binomialverteilung

Ihr habt Statistiken entdeckt oder mathematische Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es Begriffe, die wir im »Streuspanne-Lexikon« für Euch betrachten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.

Falls Ihr gerade von einer regulären Episode des »Streuspanne«-Podcasts hierher gefunden habt, dann zurück zur Folge!

Show more...
1 year ago
6 minutes 41 seconds

Streuspanne – Statistik und ihre Kuriositäten
Viel Lärm um Bias – Wie Noise Entscheidungen und Statistiken verzerrt (Folge 20)

Wie viel verdient man in der Rockmusik? Ob eure Antwort »mehrere Millionen« oder »Das ist brotlose Kunst« lauten wird, hat oft weniger mit der Frage an sich zu tun, sondern mit den eigenen, individuellen Verzerrungen und Denkfehlern – dem statistischen Rauschen oder »Noise«. 

 

Es wurde und wird viel über diese Denkfehler – Englisch Bias – geschrieben. Im Alltag ist es sehr schwer, ihnen nicht zu erliegen, weil sie sich völlig unbemerkt in unsere Entscheidungsprozesse einschmuggeln. In der Statistik kennt man den Begriff Bias ebenfalls. Dort ist es die systematische Abweichung eines Schätzverfahrens, welches im Mittel nicht den wahren Wert liefert. Gleichzeitig erfährt der Begriff hier weniger Aufmerksamkeit, weil das Problem zum einen gut verstanden ist und zum anderen mit wachsendem Stichprobenumfang immer geringer wird. 

 

Symbolisiert wird der Bias immer gerne durch die eine Zielscheibe, bei der die Punktewolke der Einschusslöcher systematisch von der schwarzen Mitte abweicht. Siehe dazu auch der Blogpost »Von zitternden Schützen« von uns: www.itwm.fraunhofer.de/standardabweichung 

 

Buch zu Noise sammelt Beispiele zu verzerrten Entscheidungen 

Der Wirtschaftsnobelpreisträger Kahnemann widmet in seinem Buch »Noise: Was unsere Entscheidungen verzerrt – und wie wir sie verbessern können« die Aufmerksamkeit der Rückseite der Zielscheibe. In der Statistik würde man sagen: Er will die Standardabweichung bzw. Streuung genauer verstehen. 

Unsere bloggenden Statistik-Experten Dr. Sascha Feth und Dr. Jochen Fiedler besprechen in der neuen Episode mit Esther Packullat, was man gewinnen kann, wenn man Streuungen zerlegt, und wieso das in der Medizin, bei Krediten oder vor Gericht viel öfter getan werden sollte. 

Ganz nebenbei erfahren wir, warum die Datengrundlage des »Healy« derart stark von einem Bias befallen ist, dass man solche Studien ohne Chance auf Korrektur direkt in die Tonne treten kann. All das und noch viel mehr in der neuen »Streuspanne«-Folge! 

Wir erwähnen folgende Links, Blogbeiträge und Bücher in der aktuellen Folge: 

  • Buchtipp: »Noise. Was unsere Entscheidungen verzerrt – und wie wir sie verbessern können« von Daniel Kahneman, Olivier Sibony, Cass R. Sunstein 

  • »Streuspanne« Blogpost »Von zitternden Schützen«: www.itwm.fraunhofer.de/standardabweichung 

  • »Streuspanne«-Podcast-Folge »Statistik beweist – Parapsychologie ist (kein) Humbug. Über parapsychologische Studien und ihre kuriosen Entdeckungen«: www.itwm.fraunhofer.de/parapsychologie 

  • ZEIT-Artikel zur neuen Resolution des UN-Menschenrechtsrats »Künstliche Intelligenz kann diskriminieren«: https://s.fhg.de/zeit-un-resolution 

  • Spiegel-Titel-Story »Das Ende der Macho-Medizin«: https://s.fhg.de/spiegel-medizin 

  • Buchtipp: »Unsichtbare Frauen –  Wie eine von Daten beherrschte Welt die Hälfte der Bevölkerung ignoriert« von Caroline Criado-Perez 

 

Ihr habt ein Zahlenphänomen oder eine Kuriosität entdeckt, die wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne über presse(at)itwm.fraunhofer.de bei uns. 

Show more...
1 year ago
29 minutes 23 seconds

Streuspanne – Statistik und ihre Kuriositäten
»Streuspanne-Lexikon« – M mit Mittelwert (oder Median)

»Streuspanne-Lexikon« – M wie Mittelwert und M wie Median 

Der neue Eintrag unseres »Streuspanne-Lexikons« erklärt »M wie Mittelwert« oder »M wie Median« – und das, wie immer in unseren Lexikon-Folgen, kurz und knapp in unter fünf Minuten.  

Der Mittelwert – auch als arithmetisches Mittel bekannt – ist der Durchschnitt einer Datenmenge. Damit soll eine Art zentraler Lagewert einer numerischen Datenreihe darstellt werden. Wenn man beispielsweise zehn verschiedene Werte hat, addiert man diese und teilt die Summe durch die Anzahl der Werte, um den Mittelwert zu erhalten. Aber nicht alle »Mittel« sind gleich!  

Der Median zum Beispiel teilt eine Stichprobe in zwei gleich große Hälften. Damit repräsentiert der Median den typischen Wert einer geordneten Gruppe, unbeeinflusst von extremen Werten am oberen oder unteren Ende. 

Für diese Robustheit gegen Ausreißer wird der Median oft gelobt. Am arithmetischen Mittel hagelt es zusätzlich oft Kritik, wenn es auf Schulnoten angewendet wird. Ob diese Robustheit wirklich so wichtig ist, und ob die Kritik im Falle der Schulnoten gerechtfertigt ist, das erfahrt Ihr hier im neuen Eintrag unseres »Streuspanne-Lexikons« 

Habt Ihr Fragen zu Mittelwerten oder Beobachtungen aus dem Alltag, die wir diskutieren oder erklären sollen? Oder gibt es andere mathematische Begriffe, die wir im »Streuspanne-Lexikon« für Euch beleuchten sollen?  Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns mit neuen Ideen.  

Falls Ihr gerade von einer regulären Episode des »Streuspanne«-Podcasts  hierher gefunden habt, springt schnell zurück! 

Show more...
1 year ago
6 minutes 32 seconds

Streuspanne – Statistik und ihre Kuriositäten
p-Werte: Nicht der Weisheit letzter Sch(l)uss (Folge 19)

Die neue Podcast-Folge dreht sich um die sogenannten »p-Werte«, auch als empirische Signifikanz bekannt. Das »Streuspanne«-Team erklärt anhand von Statistik aus dem Wilden Westen, was es damit auf sich hat und wie man zum Beispiel testen kann, ob ein Würfel gezinkt ist.

Die p-Werte sind mit das wichtigste Maß, um zu entscheiden, welche Studien überhaupt veröffentlicht werden und bestimmen dadurch auch beispielsweise, welche Medikamente zugelassen werden. Man könnte sagen: Sie entscheiden sogar über Leben und Tod. Das führt in der Praxis zu allerhand Problemen wie der Replikationskrise auf Grund von falsch positiven Studienergebnissen.

Die bloggenden Statistik-Experten Dr. Sascha Feth und Dr. Jochen Fiedler besprechen in der neuen Episode, was es mit den p-Werten auf sich hat. Aber selbst wenn Ihr mit den p-Werten schon vertraut seid, lohnt sich das Einschalten, denn auch die Kritik an diesem Konzept wird diskutiert.

Was versteht man unter p-Hacking oder »sizeless stare«? Was ist die Nullhypothese? Wie sieht der Einsatz von p-Werten im Wissenschaftsalltag aus? Und was hat das Ganze mit würfelnden Cowboys zu tun – all das und noch viel mehr in der neuen »Streuspanne«-Folge!

Wir erwähnen folgende Links, Blogbeiträge und Bücher in der aktuellen Folge:

• Streuspanne Blog-Post zu Sensitivität und Spezifität im Kontext Corona: www.itwm.fraunhofer.de/spezifitaet

• Buchtipp: »The Cult of Statistical Significance: How the Standard Error Costs Us Jobs, Justice, and Lives (Economics, Cognition, and Society)« von Stephen T. Ziliak und Deirdre Nansen Mccloskey

• »Streuspanne« Podcast-Folge »Statistik beweist – Parapsychologie ist (kein) Humbug. Über parapsychologische Studien und ihre kuriosen Entdeckungen«: www.itwm.fraunhofer.de/parapsychologie

• »Streuspanne-Lexikon« – B wie Binomialverteilung:

www.itwm.fraunhofer.de/binomialverteilung

• »Streuspanne-Lexikon« – K wie Konfidenzintervall https://itwm.fraunhofer.de/konfidenzintervall

• Shoutout an die Quarks Science Cops und ihre Arbeit:

Quarks Science Cops - quarks.de


Ihr habt ein Zahlenphänomen entdeckt, das wir besprechen sollen oder eine Statistik in den Medien gelesen und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns.

Show more...
1 year ago
42 minutes 4 seconds

Streuspanne – Statistik und ihre Kuriositäten
»Streuspanne-Lexikon« – B wie Binomialverteilung

Im heutigen »Streuspanne-Lexikon«-Eintrag geht es darum, wofür man die Binomialverteilung braucht und was das überhaupt ist. Wie gewohnt: kurz und knapp verständlich erklärt – in unter fünf Minuten. 

»Eine Figur in jedem siebten Ei!« – Im Beispiel des Lexikonbeitrags interessiert sich das »Streuspanne«-Team dafür, wie oft eine Happy-Hippo-Figur in einem Überraschungsei zu finden ist, wenn jemand einen Monat lang jeden Tag ein Ei kaufen würde. Hier wäre die individuelle Erfolgswahrscheinlichkeit »p« genau ein Siebtel, die Anzahl der Wiederholungen »N« wäre 30 Tage und »k« ist das zufällige Ergebnis, nämlich die Anzahl der Erfolge.

Wie oft man nun welchen Wert von k erwarten darf, das regelt die Binomialverteilung.

 

Neben Überraschungseiern kann man damit auch andere Wahrscheinlichkeiten (zum Beispiel für einen Münz- oder Würfelwurf) berechnen und Voraussagen über komplexe Vorgänge wie dem Verbreiten von Krankheiten treffen.

 

Die Formel für die Binomialverteilung lautet

(N über k) mal p^k mal (1-p)^(N-k).

Auf den ersten Blick sieht das kompliziert aus, aber mit ein bisschen Lesehilfe verliert die Formel ihren Schrecken.

p^k ist einfach zu verstehen: Wenn ich k Erfolge in N Wiederholungen haben möchte, dann muss k-Mal der Erfolg eintreten, was mit der Wahrscheinlichkeit p passiert. Also schlicht die Wahrscheinlichkeit p, k-mal mit sich selbst multipliziert.

 

Analog lässt sich gut nachvollziehen, wieso (1-p)^(N-k) in der Formel steht. Denn ich muss bei k Erfolgen dann mit genau N-k Misserfolgen rechnen, und jeder einzelne Misserfolg passiert mit Wahrscheinlichkeit 1-p.

 

Der letzte Bestandteil (N über k) ist etwas abstrakter. Das ist der sogenannte Binomialkoeffizient. Was das mathematisch heißt, wäre zu ausufernd für einen Lexikon-Eintrag, aber es zählt einfach, auf wie viele Möglichkeiten sich k Erfolge in N Versuchen unterbringen lassen.

Schwere Worte, aber mit einfacher Bedeutung.

 

Aber wie sieht diese Binomialverteilung aus?

Wenn N immer größer wird, nähert sich die Binomialverteilung immer weiter einer Normalverteilung an. Die Anzahl der Treffer verteilen sich links und rechts symmetrisch zum Erwartungswert, bei p=1/2 also genau der Mitte. Genau an diesem Erwartungswert ist die Anzahl der Treffer am größten, in beide Richtungen wird sie immer kleiner. 

 

Ganz in Kürze: Die Binomialverteilung zählt die Anzahl an Erfolgen in einer festgelegten Anzahl von Wiederholungen. Was das für die Überraschungseier und die Figuren heißt, hört Ihr im »Streuspanne-Lexikon«.

 

Ihr habt eine seltsame Statistik in den Medien entdeckt und wollt, dass wir sie im Podcast zum Thema machen? Oder Euch ist ein mathematisches Zahlen- oder Gedankenspiel aufgefallen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns. Auch Vorschläge für weitere Lexikon-Einträge sind willkommen.

 

Ihr seid gerade aus einer anderen langen, regulären Streuspanne-Folge hierher gesprungen? Dann schnell wieder zurück zur langen Folge!

Show more...
1 year ago
4 minutes 9 seconds

Streuspanne – Statistik und ihre Kuriositäten
Mr Bayes und Mr Frequentist streiten über einen Löwen – Was steckt hinter den zwei großen Denkschulen der Statistik? (Folge 18)

Erinnert Ihr Euch an den Skandal-Löwen aus Berlin im letzten Jahr? Mit welcher Wahrscheinlichkeit haben die Bilder denn tatsächlich einen Löwen gezeigt? Während jeder Mensch die Frage nach der Wahrscheinlichkeit recht intuitiv versteht, kann man sich damit in der Statistik relativ schwertun.

Vor allem, wenn man zur Denkschule des Frequentismus gehört, will man die Frage so gar nicht verstehen – der Frequentismus ist die am häufigsten verwendete Denkschule wohlgemerkt.

 In der neuen Streuspanne-Folge stehen sich Vertreter der zwei größten Statistik-Denkschulen im Gespräch gegenüber. So bringt das Team dem Publikum die beiden Ansätze zur Wahrscheinlichkeitsberechnung spielerisch näher: Auf der einen Seite schlüpft Jochen Fiedler in die Rolle von Mr. Bayes für die Bayes'sche Statistik und auf der anderen Seite spielt Sascha Feth Mr. Frequentist, der für die frequentistischen Denkschule spricht.

 

Welche Rolle spielen Vorwissen und Zufallsexperimente? Warum passt der alte Blog zu Losbuden, Gustav Gans und Donald Duck in die Folge und wie viel Querverweise passen in eine Podcast-Episode? Und natürlich: War es denn ein Löwe? Hört selbst!

 

Alle gesammelten Links und Tipps aus der Folge gibt es hier:

 Buchtipp »Die Illusion der Vernunft« von Philipp Sterzer

 

Blog »Losbude, Corona und Donald Duck«
www.itwm.fraunhofer.de/losbude

 

Beispiel aus dem Blog: Wir besuchen einen Jahrmarkt. Dort gibt es zwei Losbuden. Die erste, von Gustav betrieben, ist für ihre höhere Gewinnchance bekannt. Die zweite, von Donald betrieben, lässt einen deutlich seltener gewinnen. Wir schicken jetzt 100 Personen auf den Jahrmarkt und fragen sie am Ende, wie viele Gewinne sie gezogen haben. Können wir daraus erkennen, wie viele Personen bei Gustav waren?

 

Blogpost »Gibt es den Zufall wirklich?«
www.itwm.fraunhofer.de/blog-zufall

 

Podcast »Streuspanne-Lexikon: K wie Konfidenzintervall www.itwm.fraunhofer.de/konfidenzintervall

 

Podcast »Streuspanne-Lexikon: »S wie Schätzung«

www.itwm.fraunhofer.de/schaetzer

 

Der Satz von Bayes im Kontext eines Blogposts aus den Anfängen der »Streuspanne« www.itwm.fraunhofer/aussagesicherheit

 

Ihr habt ein Phänomen, Paradox oder eine kuriose Statistik entdeckt, die wir in der »Streuspanne« besprechen sollen? Oder Euch ist ein mathematisches Zahlen- oder Gedankenspiel aufgefallen, über das wir podcasten könnten? Dann meldet Euch gerne bei uns.

Show more...
1 year ago
37 minutes 54 seconds

Streuspanne – Statistik und ihre Kuriositäten
Streuspanne, dein Podcast für spannende Neuigkeiten, lustige Fun-Facts und interessantes Hintergrundwissen rund um das Thema Statistik.