DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

https://is1-ssl.mzstatic.com/image/thumb/Podcasts211/v4/87/b9/64/87b9640e-1fc9-0aed-c156-8510f64c1e67/mza_16556605320077894717.jpg/600x600bb.jpg

Attention Heads - Schweizer Perspektiven auf KI und die Technologie von morgen

Joel, Marius

27 episodes

2 days ago

Tauchen Sie ein in die faszinierende Welt der Künstlichen Intelligenz mit unserem Schweizer KI-Podcast, präsentiert von zwei enthusiastischen KI-Entwicklern. In jeder Episode diskutieren wir die neuesten Trends, Herausforderungen und Chancen, die KI bietet. Von ethischen Fragestellungen bis hin zu technologischen Durchbrüchen, wir erforschen, wie KI nicht nur die Technologie, sondern auch unser tägliches Leben und unsere Gesellschaft beeinflusst.

Technology

RSS

All content for Attention Heads - Schweizer Perspektiven auf KI und die Technologie von morgen is the property of Joel, Marius and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.

Technology

https://d3t3ozftmdmh3i.cloudfront.net/staging/podcast_uploaded_nologo/40296300/40296300-1705862678995-8a376aba99dac.jpg

DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

Attention Heads - Schweizer Perspektiven auf KI und die Technologie von morgen

1 hour 1 minute 54 seconds

8 months ago

DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

In dieser Folge nehmen wir das DeepSeek V3 Paper genau unter die Lupe – das Open-Source-Powerhouse, das aktuell für Furore in der KI-Szene sorgt. Wir erklären, warum dieses Modell mit seinen 671 Milliarden Parametern (37 Milliarden aktiv pro Token) und innovativen Architekturen wie Multi-Head Latent Attention und Mixture-of-Experts den Markt revolutioniert. Dabei beleuchten wir, wie DeepSeek V3 trotz geringer Kosten (nur ca. 5,58 Mio. USD für das Training) durch eine effiziente Nutzung von Nvidia H800 Chips und einen sparsamen Datenaufwand beeindruckende Leistungen erzielt. Erfahrt, was hinter dem Hype steckt, welche technischen Neuerungen das Modell auszeichnen und warum es als Gamechanger in der Open-Source-KI gilt.