Подкаст AWS на русском.
Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS.
Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке.
Смотрите и слушайте #awsнарусском
All content for AWS на русском is the property of Viktor Vedmich and is served directly from their servers
with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Подкаст AWS на русском.
Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS.
Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке.
Смотрите и слушайте #awsнарусском
Хотите понять, как работать с большими языковыми моделями в облаке AWS? В этом выпуске мы пригласили Рустема (Rustem Feyzkhanov) - специалиста по машинному обучению и AWS Hero. Мы подробно разобрали разные варианты деплоя LLM:
•Amazon Bedrock - сервис для быстрого запуска популярных моделей
•Amazon SageMaker JumpStart - кастомные модели в пару кликов
•Hugging Face Estimator - доступ к библиотеке моделей Hugging Face
•Развертывание в контейнерах ECS и на GPU-инстансах EC2
•AWS Lambda - какие особенности надо учесть при таком запуске
С чего начать, что выбрать под свой кейс, как оптимизировать затраты - ответы в подкасте.
Слушайте, пробуйте!
Ссылки упомянутые во время подкаста:
Слайды с Реинвента https://www.dropbox.com/scl/fi/m72mosktms8k43q4ktpsx/Feyzkhanov_AWS_GenAI_Services_And_Options.pdf?rlkey=2p35imid8xxbhjyfunbj2m9ya&dl=0
Пример Mistral 7B на SageMaker JumpStart https://aws.amazon.com/blogs/machine-learning/mistral-7b-foundation-models-from-mistral-ai-are-now-available-in-amazon-sagemaker-jumpstart/
Использование HuggingFace для деплоя моделей на SageMaker https://huggingface.co/docs/sagemaker/inference
Использование AWS Lambda для хостинга Mistral 7B https://aws.plainenglish.io/serverless-compute-for-llm-with-a-step-by-step-guide-for-hosting-mistral-7b-on-aws-lambda-0a267e153cae
Использование ECS Fargate для хостинга LLAMA 2 https://aws.plainenglish.io/guide-for-running-llama-2-using-llama-cpp-on-aws-fargate-7086bcd1ed3c
Hugging face Inferentia 2 https://huggingface.co/blog/inferentia-llama2
AWS на русском
Подкаст AWS на русском.
Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Разбираем Generative AI (ИИ) и его применение, делимся фундаментальными знаниями и анализируем последние новости из мира AWS.
Лучшие практики и свежие инсайты из облачной экосистемы в формате интервью на русском языке.
Смотрите и слушайте #awsнарусском