047. Как запустить LLM (generative AI) на AWS

https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/b6/30/64/b6306428-4bd2-8ff1-1fbf-baeec0d03e21/mza_8201432795228004465.png/600x600bb.jpg

AWS на русском

Viktor Vedmich

65 episodes

2 months ago

Подкаст AWS на русском. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS. Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке. Смотрите и слушайте #awsнарусском

Technology

RSS

All content for AWS на русском is the property of Viktor Vedmich and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.

Technology

047. Как запустить LLM (generative AI) на AWS

AWS на русском

30 minutes 51 seconds

1 year ago

047. Как запустить LLM (generative AI) на AWS

Хотите понять, как работать с большими языковыми моделями в облаке AWS? В этом выпуске мы пригласили Рустема (Rustem Feyzkhanov) - специалиста по машинному обучению и AWS Hero. Мы подробно разобрали разные варианты деплоя LLM: •Amazon Bedrock - сервис для быстрого запуска популярных моделей •Amazon SageMaker JumpStart - кастомные модели в пару кликов •Hugging Face Estimator - доступ к библиотеке моделей Hugging Face •Развертывание в контейнерах ECS и на GPU-инстансах EC2 •AWS Lambda - какие особенности надо учесть при таком запуске С чего начать, что выбрать под свой кейс, как оптимизировать затраты - ответы в подкасте. Слушайте, пробуйте! Ссылки упомянутые во время подкаста: Слайды с Реинвента https://www.dropbox.com/scl/fi/m72mosktms8k43q4ktpsx/Feyzkhanov_AWS_GenAI_Services_And_Options.pdf?rlkey=2p35imid8xxbhjyfunbj2m9ya&dl=0 Пример Mistral 7B на SageMaker JumpStart https://aws.amazon.com/blogs/machine-learning/mistral-7b-foundation-models-from-mistral-ai-are-now-available-in-amazon-sagemaker-jumpstart/ Использование HuggingFace для деплоя моделей на SageMaker https://huggingface.co/docs/sagemaker/inference Использование AWS Lambda для хостинга Mistral 7B https://aws.plainenglish.io/serverless-compute-for-llm-with-a-step-by-step-guide-for-hosting-mistral-7b-on-aws-lambda-0a267e153cae Использование ECS Fargate для хостинга LLAMA 2 https://aws.plainenglish.io/guide-for-running-llama-2-using-llama-cpp-on-aws-fargate-7086bcd1ed3c Hugging face Inferentia 2 https://huggingface.co/blog/inferentia-llama2