Пока весь мир ждет революции в развитии искусственного интеллекта, мы говорим с теми, кто его создает. Новые сезоны подкаста «Деньги любят техно» посвящены науке о данных, машинному обучению, дата-инженерии и всему, что с этим связано. Говорим с экспертами из науки, исследователями и практиками из компаний различных отраслей – про развитие ML, данные, дата-аналитику и влияние технологий, которые принято называть «искусственным интеллектом», на бизнес.
All content for Деньги любят техно is the property of VTB Bank and is served directly from their servers
with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Пока весь мир ждет революции в развитии искусственного интеллекта, мы говорим с теми, кто его создает. Новые сезоны подкаста «Деньги любят техно» посвящены науке о данных, машинному обучению, дата-инженерии и всему, что с этим связано. Говорим с экспертами из науки, исследователями и практиками из компаний различных отраслей – про развитие ML, данные, дата-аналитику и влияние технологий, которые принято называть «искусственным интеллектом», на бизнес.
MLOps, часть II: погружаемся в специфику работы с данными
Деньги любят техно
1 hour 19 minutes
2 years ago
MLOps, часть II: погружаемся в специфику работы с данными
Во второй части большой темы про MLOps, которую мы разбили на несколько эпизодов подкаста, ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.
В этом выпуске вы услышите:
Почему общепринятых стандартов управления данными недостаточно для работы с большими данными для ML;
Что такое хвосты и артефакты в сверхбольших данных;
Может ли overfeeding стать причиной overfitting’a (или это одно и то же?);
И многое другое!
Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.
Полезные ресурсы и ссылки:
Курс MLOps (OTUS): https://otus.ru/lessons/ml-bigdata/
Основные идеи из книги «Сотрудничество в DevOps-культуре»: http://agilemindset.ru/основные-идеи-из-книги-сотрудничест/
MLOps: Continuous delivery and automation pipelines in machine learning: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning
Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана: https://habr.com/ru/companies/vk/articles/749850/
Как создавать качественные ML-системы. Часть 2: приручаем хаос: https://habr.com/ru/companies/vk/articles/749852/
The Data Engineering Cookbook: https://github.com/andkret/Cookbook
Стандарты:
ISO/IEC DIS 5259-1: https://www.iso.org/standard/81088.html
ISO/IEC DIS 5259-4: https://www.iso.org/standard/81093.html
ISO/IEC 8183:2023: https://www.iso.org/standard/83002.html
Деньги любят техно
Пока весь мир ждет революции в развитии искусственного интеллекта, мы говорим с теми, кто его создает. Новые сезоны подкаста «Деньги любят техно» посвящены науке о данных, машинному обучению, дата-инженерии и всему, что с этим связано. Говорим с экспертами из науки, исследователями и практиками из компаний различных отраслей – про развитие ML, данные, дата-аналитику и влияние технологий, которые принято называть «искусственным интеллектом», на бизнес.