Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
Sports
History
Music
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/b6/30/64/b6306428-4bd2-8ff1-1fbf-baeec0d03e21/mza_8201432795228004465.png/600x600bb.jpg
AWS на русском
Viktor Vedmich
65 episodes
2 months ago
Подкаст AWS на русском. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS. Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке. Смотрите и слушайте #awsнарусском
Show more...
Technology
RSS
All content for AWS на русском is the property of Viktor Vedmich and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Подкаст AWS на русском. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS. Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке. Смотрите и слушайте #awsнарусском
Show more...
Technology
https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/b6/30/64/b6306428-4bd2-8ff1-1fbf-baeec0d03e21/mza_8201432795228004465.png/600x600bb.jpg
047. Как запустить LLM (generative AI) на AWS
AWS на русском
30 minutes 51 seconds
1 year ago
047. Как запустить LLM (generative AI) на AWS
Хотите понять, как работать с большими языковыми моделями в облаке AWS? В этом выпуске мы пригласили Рустема (Rustem Feyzkhanov) - специалиста по машинному обучению и AWS Hero. Мы подробно разобрали разные варианты деплоя LLM:   •Amazon Bedrock - сервис для быстрого запуска популярных моделей •Amazon SageMaker JumpStart - кастомные модели в пару кликов •Hugging Face Estimator - доступ к библиотеке моделей Hugging Face •Развертывание в контейнерах ECS и на GPU-инстансах EC2 •AWS Lambda - какие особенности надо учесть при таком запуске   С чего начать, что выбрать под свой кейс, как оптимизировать затраты - ответы в подкасте.   Слушайте, пробуйте!   Ссылки упомянутые во время подкаста:   Слайды с Реинвента https://www.dropbox.com/scl/fi/m72mosktms8k43q4ktpsx/Feyzkhanov_AWS_GenAI_Services_And_Options.pdf?rlkey=2p35imid8xxbhjyfunbj2m9ya&dl=0 Пример Mistral 7B на SageMaker JumpStart https://aws.amazon.com/blogs/machine-learning/mistral-7b-foundation-models-from-mistral-ai-are-now-available-in-amazon-sagemaker-jumpstart/ Использование HuggingFace для деплоя моделей на SageMaker https://huggingface.co/docs/sagemaker/inference Использование AWS Lambda для хостинга Mistral 7B https://aws.plainenglish.io/serverless-compute-for-llm-with-a-step-by-step-guide-for-hosting-mistral-7b-on-aws-lambda-0a267e153cae Использование ECS Fargate для хостинга LLAMA 2 https://aws.plainenglish.io/guide-for-running-llama-2-using-llama-cpp-on-aws-fargate-7086bcd1ed3c Hugging face Inferentia 2 https://huggingface.co/blog/inferentia-llama2
AWS на русском
Подкаст AWS на русском. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS. Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке. Смотрите и слушайте #awsнарусском