
Обсуждаем языковые модели, сдвиг парадигм в ML и челленджи, с которыми столкнулись при создании GigaChat от Сбера.
Среди тем выпуска:
работа с данными, претрейн и токенизация;
эксперименты с параметрами обучения;
кратно растущие требования к GPU и другому железу;
мультимодальность и встраивание LLM в экосистему;
починка фактологии и походы в поиск.
Гость выпуска: Сергей Марков — специалист в области ИИ, начальник управления экспериментальных систем машинного обучения в дивизионе общих сервисов «Салют» Сбера.
Ведущий: Александр Толмачев. Он руководит аналитикой, хранилищем и моделированием в Ozon. А еще преподает в Яндекс Практикуме, ВШЭ и Skolkovo.