
Цей уривок є доповіддю, що розповідає про стрімкий прогрес і трансформацію в галузі штучного інтелекту, особливо зосереджуючись на великих мовних моделях (LLM). Спікер, Олександр Краковецький, вітає присутніх з Днем ІТ та наголошує, що технології є "ДНК" сучасного бізнесу, проникнувши в усі його сфери. Основна частина доповіді присвячена методам оцінювання прогресу ШІ, зокрема через бенчмарки, що виходять за рамки традиційних метрик і включають нові параметри, як-от groundness (обґрунтованість) та reasoning effort (зусилля міркування). Доповідач демонструє вражаючі результати флагманських моделей у складних тестах, як-от Humanity's Last Exam та математичні олімпіади, підкреслюючи, що ШІ швидко наближається до рівня загального штучного інтелекту (AGI). Також обговорюються виклики, зокрема проблема галюцинування та важливість переходу до агентних систем, які використовують моделі не лише для міркування, але й для самостійної дії, інтегруючись через протоколи на кшталт MCP для роботи з різноманітними джерелами даних.