Episode 215: Wenn Rauschen zu Geschichten wird - Wie Transformer halluzinieren

https://is1-ssl.mzstatic.com/image/thumb/Podcasts211/v4/83/a1/ba/83a1ba99-ae79-0ae5-f265-a0b96cb40a0d/mza_15322778499479109639.jpg/600x600bb.jpg

Knowledge Science - Alles über KI, ML und NLP

Sigurd Schacht, Carsten Lanquillon

246 episodes

1 week ago

Send us a text Wie können wir verstehen, was in einem Sprachmodell wirklich passiert? Sigurd und Carsten tauchen tief ein in ein Paper aus Deutschland, das zeigt, wie man Features in neuronalen Netzen identifizieren kann – ohne riesige Datensätze und ohne aufwändiges Training. Von Sparse Auto Encodern über Transcoders bis zur neuen Weight Lens-Methode: Erfahrt, wie Mechanistic Interpretability den Weg zu transparenteren KI-Systemen ebnet. Plus: Einblicke vom AI Transparency Days H...

All content for Knowledge Science - Alles über KI, ML und NLP is the property of Sigurd Schacht, Carsten Lanquillon and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.

Technology

Education,

Science

Episode 215: Wenn Rauschen zu Geschichten wird - Wie Transformer halluzinieren

Knowledge Science - Alles über KI, ML und NLP

36 minutes

3 weeks ago

Episode 215: Wenn Rauschen zu Geschichten wird - Wie Transformer halluzinieren

Send us a text Warum erfindet KI manchmal Fakten, die nicht existieren? In dieser Episode analysieren Sigurd und Carsten ein faszinierendes Paper, das mit Sparse Autoencodern dem Ursprung von Halluzinationen auf den Grund geht. Das Überraschende: Füttert man Transformer mit reinem statistischen Rauschen, aktivieren sie stabile interne Konzepte wie Schildkröten, Segelboote oder Baseballs. Die Erkenntnis: Je unsicherer der Input, desto stärker greift das Modell auf seinen internen Bias zurück. ...