Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
News
Sports
TV & Film
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts123/v4/88/4f/e9/884fe9cd-ab78-373b-0b12-b5c4cfee9e0d/mza_4487938204111846888.png/600x600bb.jpg
Лингвоподкаст
Мария Бочарова
16 episodes
9 months ago
Подкаст о языковых технологиях и лингвистические исследованиях. Обсуждаем с гостями из академии и индустрии исследования, работу в IT и академическую карьеру. 📍 Мы в telegram: https://t.me/lingvo_podcast 📍 Мы в Vk: https://vk.com/lingvopodcast 📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com Проект реализуется совместно с НИУ ВШЭ.
Show more...
Education
Technology
RSS
All content for Лингвоподкаст is the property of Мария Бочарова and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Подкаст о языковых технологиях и лингвистические исследованиях. Обсуждаем с гостями из академии и индустрии исследования, работу в IT и академическую карьеру. 📍 Мы в telegram: https://t.me/lingvo_podcast 📍 Мы в Vk: https://vk.com/lingvopodcast 📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com Проект реализуется совместно с НИУ ВШЭ.
Show more...
Education
Technology
https://ru-msk-dr3-1.store.cloud.mts.ru/mave/storage/podcasts/79e2b6c4-bbde-427f-8cf2-22f228910b5d/images/c07a5297-5a04-481d-8818-5f0e0f621338.png
Машинный перевод: история, перспективы и зачем он малым языкам | Александр Антонов, Яндекс
Лингвоподкаст
49 minutes
1 year ago
Машинный перевод: история, перспективы и зачем он малым языкам | Александр Антонов, Яндекс
Гость этого выпуска – Александр Антонов, аналитик в Яндекс.Переводчике и создатель корпусов для чувашского языка [https://huggingface.co/alexantonov]. С Александром мы обсудили механизмы автоматического перевода и специфику работы с малоресурсными языками. А еще поговорили: 📍 Об истории развития моделей машинного перевода: от словарей и статистических моделей до нейронок и LLM 📍  Об автоматической обработке малоресурсных языков: где берутся данные для обучения моделей и как создаются параллельные корпуса 📍 Как разработчики учат модели учитывать контекст, интерпретировать метафоры и идиомы Ведущая, продюсер: Мария Бочарова Монтажер: Андрей Чиркин 🎧 Подписывайтесь на нас в соц. сетях: t.me/lingvo_podcast vk.com/lingvopodcast 📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com Таймкоды: 01:20 Как все начиналось: Манхэттанский проект и правиловые переводчики 04:05 Первые модели статистического перевода 07:50 Как нейросети поменяли правила игры 10:50 Как работает перевод для разных грамматических систем 12:40 Перспективы использования больших языковых моделей 15:50 Как собираются параллельные корпуса 20:10 Как оценивать модели перевода: бенчмарки, эталонные корпуса, нейросетевые метрики, люди 25:25 Путь Александра в Яндекс и автоматический перевод 27:40 Чувашско-русский переводчик, над которым работал Александр 33:25 Зачем большому бизнесу перевод для малых языков 35:00 Какие были сложности при сборе данных для чувашского языка 36:40 Лайфхаки по обучению моделей для малых языков 40:10 Перспективы корпуса чувашского языка: распознавание и генерация речи 43:05 Достигли ли своего предела технологии перевода? Технологии speech-to-speech, мультимодальные GPT, перевод по фото, локализация.
Лингвоподкаст
Подкаст о языковых технологиях и лингвистические исследованиях. Обсуждаем с гостями из академии и индустрии исследования, работу в IT и академическую карьеру. 📍 Мы в telegram: https://t.me/lingvo_podcast 📍 Мы в Vk: https://vk.com/lingvopodcast 📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com Проект реализуется совместно с НИУ ВШЭ.