Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
Sports
History
TV & Film
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts116/v4/a5/5f/b0/a55fb044-0567-b95d-b3ad-274058955e60/mza_7037390936553016243.jpg/600x600bb.jpg
YaTalks 2021: ReRun
Yandex
16 episodes
3 days ago
Избранные сессии конференции Яндекса для IT-сообщества
Show more...
Technology
RSS
All content for YaTalks 2021: ReRun is the property of Yandex and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Избранные сессии конференции Яндекса для IT-сообщества
Show more...
Technology
https://d3t3ozftmdmh3i.cloudfront.net/production/podcast_uploaded_nologo400/11558393/11558393-1640592981874-7b7954ca887ee.jpg
Дмитрий Монахов — Как кластеры Яндекса оказались в топе суперкомпьютеров
YaTalks 2021: ReRun
24 minutes 7 seconds
3 years ago
Дмитрий Монахов — Как кластеры Яндекса оказались в топе суперкомпьютеров

Из доклада вы узнаете краткую историю кластеров для обучения нейронных сетей в Яндексе:

— Зачем они нам понадобились?

— Что такое современный HPC и почему это не просто объединение нескольких сотен серверов?

— Способы создания HPC, и почему Яндекс выбрал наиболее трудный.

Поговорим о борьбе за производительность:

— Почему такие кластеры, как у нас, не работают «из коробки»?

— Как мы оптимизировали производительность одного узла от 30 до 110 терафлопс.

— Как масштабировали производительность на 200 узлов, получив в сумме 21,6 петафлопс.

Также мы подробно расскажем о том, что представляет из себя распределённое обучение и почему это сложно; и поделимся 10 правилами, без которых GPU-кластеры никогда не окупятся и будут просто дорогой игрушкой.

О спикере:

Дмитрий Монахов занимается в Яндексе поддержкой и разработкой ядра Linux для нужд инфраструктуры внутреннего облака. Отвечает за файловые системы, распределённые системы и алгоритмы, RDMA, Infiniband, HPC и GPU.

С 2008-го по 2018-й занимался разработкой ядра Linux, локальных и распределённых файловых систем в компаниях SwSoft, Parallels и Virtuozzo.

YaTalks 2021: ReRun
Избранные сессии конференции Яндекса для IT-сообщества