Ebben az epizódban azon tépelődtünk, miért a munka a leghangsúlyosabb identitás-meghatározónk, és hogy ez kizárja-e a teljesen munka nélküli társadalmat. Elég racionális-e ahhoz a kapitalizmus, hogy kiváltsa az embert az olcsóbb gépi alternatívával, ha az majd tényleg olcsóbb lesz (mert most még sokkal drágább), vagy inkább a bullshit-jobok jellemzik igazán? Elég puha-e a társadalom ahhoz, hogy minden technológiai újítást elfogadjon csak azért, mert mképesek vagyunk megcsinálni? És egyáltalán: tényleg ki lehet-e váltani egy tanárt vagy egy asztalost?
Ezen a héten az iparral foglalkozó résszel folytattuk a State of AI 2025 jelentés feldolgozását. Van-e esélye a nyílt forráskódú modelleknek a piacon? Lesznek-e egyszer nyereségesek az LLM-alapú szolgáltatások? Bejöttek-e a kódolási asszisztensek? És az enterprise-level pilot projektek? Vége van-e a Google Search-nek? Honnan lesz Kínának Ai chip ellátottsága? Mi az a szuverén AI? Elboldogulnak-e a városokban a Waymo robotaxik? Megannyi kérdés, amire a jelentés választ ad!
Idén is, ahogy minden évben rávetjük magunkat a State of AI jelentésre, ami idén 313 sűrűn teleírt oldalon igyekszik áttekinteni az elmúlt 12 hónap legfontosabb eredményeit a tudomány, ipar, politika, és biztonság szempontjai szerint csoportosítva. Ebben az epizódban a tudományos kutatással foglalkozó fejezetet lapoztuk végig együtt, és megállapítottuk, hogy az év slágere a reasoning, a nagy modelleknek van egy elméleti információsűrűségi korlátja, továbbá észreveszik, ha tesztelik őket, valamint megnyerik a matekolimpiát. Ha ez nem lenne elég, jól teljesítenek az LLM-ek kistesói, az AlphaZero sakknagymestereket tanít, az open source nem maradt le végletesen, Kína pedig egyenesen felzárkózik, és a biológiában és kémiában hatalmas lépések maradtak viszonylag kibeszéletlenül.
Az AI megoldások olykor félresikerülnek vagy inkább nem sikerül ezeket jól befejezni, emiatt tele a padlás olyan alkalmazásokkal, amelyektől égnek áll a lakosság haja. Összegyűjtöttünk néhányat ezek közül: a hallucináció, a formátumok közötti konverzió, az autocomplete és retargeting elől elvitte a pálmát az AI segítségével írt üzleti ajánlat és termékweboldal, az ajánlórendszerek, a Tesla gyerekőr és az ügyfélszolgálati hangasszisztensek. A nagyszabású ventillálás előtt azonban ajánlottunk néhány remek konferenciát is: HTE, Future IT, LT intelligence, conTEXT és MSZNY.
Feri az Internet Hungaryn vezette az AdTech termet és legnagyobb meglepetésére végig az AI-ról volt szó, és ez alatt nem CSAK az LLM-et értették az előadók! Bevezettük a lakossági AI fogalmát, hiszen már a magyar internetezők fele is kipróbálta és jelentős hányaduk használja is egy friss NRC kutatás szerint, sokszor keresésre. A Google mégis magabiztos, miközben a keresője lényegében LLM chatbottá alakul (lásd AI Overview és AI Mode), a hirdetéskiszolgáló szakma is magabiztos, mert az AI-ban csak okos segédet lát, nem pedig azt, aki elveszi a munkáját és mindenki (még mi is) megérkezni látja az Agentic AI-t és a chatbotokon belüli vásárlást és ezért a chatbotnak szóló reklámot is. A SEO helyét a Zero Click miatt átveszi a GEO, mi pedig örülünk, ha véget ér a "bullshit kora".
Texasban a Meta 2023-ban ledózerolt egy félkész adatközpontot, hogy másfajtát építsen a helyére. Miért kell annyira más data center az AI számára? Miért fogyaszt sokkal több áramot a ChatGPT a Netflixnél? Hány AI adatközponot tudna árammal táplálni a Paksi Atomerőmű? És miért nem jó erre a napenergia? Végül: vajon van-e köze az LLM-ek lustaságának az energiatakarékossághoz, illetve vannak-e zöld irányú LLM fejlesztések? Az AI energiaigényét jártuk körül.
Az MIT NANDA kezdeményezés tanulmánya (State of AI in Business 2025) nyomán mindenki megírta, hogy a nagy cégek GenAI beruházásainak 95%-a egyelőre nem teremt üzleti értéket. Daria Kulikova SaaS menedzser pedig elmondja videójában, hogy a GenAI üzleti modellje egyelőre fenntarthatatlannak látszik a magas üzemi költségek okozta alacsony árrés miatt. Az is kérdéses, összejöhet-e a Frontier Labek idei árbevételi terve - márpedig, ha nem, akkor csak a kamu üzletek menthetik meg a befektetői kedvet. Van ebből kiút? Nem az okos villanyszerelő fogja megmondani, pedig ő hozta a legvidámabb pillanatot.
Halljuk, mit gondolnak az AI előretöréséről és társadalmunkra gyakorolt hatásáról korunk népszerű szakértői! Sőt, ne csak halljuk, hanem kommentáljuk is! - így döntött a szigorú szerkesztőség. Pogi, Fridi, Artúr és főleg Pogi: mit gondolunk a népszerű-tudományos megközelítésről, a sommás állításokról, a ténybeli pontatlanságokról és a hatékony problémafelvetésről egy-két podcast-idézetet véve alapul.
Kirándulás az LLM sötét(ebb) oldalára: generált vásárlói vélemények, hallucinációval fűszerezett jogászi érvelések, kitalált tudományos publikációk és középszerű szemináriumi dolgozatok - nem kellemes dolgok, de nem is látjuk bennük a világ végét. Ahogy a fake news, a kreatívipari visszaélések és a hamis egészségügyi tanácsok sem állítják meg a Föld forgását. Akkor most mi lesz?
Körülnéztünk, milyen áttörések történtek AI területen az elmúlt években, amelyek nem esnek bele a nagy nyelvi modell hype hullámba. Robotika, sőt kobotika, kvantumszámítástechnika, neuromorfikus chipek (Intel Loihi 2 és IBM NorthPole) és neuro-szimbolikus AI rendszerek, edge computing, önjáró laboratóriumok és a zöld AI - érdekes, hogy elsősorban hardver-központú területeket találtunk. Meg egy kérdést: tényleg mindenbe kell AI?
Sam Altman augusztusban újságírók jelenlétében többször is kimondta a "AI buborék" kifejezést! Nekünk meg a dotcom lufi jutott eszünkbe, és Vágási Feri. Szó volt arról, hogy a technológiai óriáscégek (Magnificent Seven) milyen mértékben járulnak hozzá az USA GDP-növekedéséhez, miközben részvényeik túlértékeltek, és igazi AI-profitot még nem termeltek. Megbámultuk az AI fejlesztések körüli hype-ot és annak gazdasági hatásait, felvetve, hogy egy piaci korrekció várható, de az AI technológia fejlődése nem fog leállni. Egy fontos „mellékhatás” lehet az adatközpontok hatalmas energiaigénye miatt a fenntartható energia fejlesztése, ahogy annak idején a vasútépítési boomból lett a távközlés.
Hogyan jutottak el az amerikai PBC-k (kb. közhasznú vállalatok) formájában működő AI-cégek vezetői oda, hogy a morális működés csak opció? Ki tehet az USA AI stratégia terjedelméről? A kínai államkapitalizmus legyőzi-e az alapkutatások terén a amerikai üzleti szemléletű kutatásokat? Igaza van-e az LLM hype-ot hűteni igyekvő megmondó embereknek? Ezekre a kérdésekre keressük a választ az eheti hírösszefoglalóban.
Elindult a Minerva Intézet, a műsorvezetők AI-alapú telefonos közvéleménykutató szolgáltatása, ami egyfajta ágens alapú AI. Ilyenek mostanában sorra jelennek meg, a "rakj össze 10 perc alatt egy vállalatot" tartalmú videókkal együtt. Vajon van-e ennek értelme, és hihetünk-e a "one person unicorn", azaz az olyan egyszemélyes vállalatok eljövetelének, amelyek elérhetik az egymilliárd dolláros értékeltséget? Védhető-e egy ilyen "üzleti ötlet" a másolatoktól, avagy hol van az economic moat? Másfelől: hogy lehetséges, hogy a Booking.com értékeltsége ugyanannyi, mint a hét legnagyobb légitársaságé együtt, miközben azok árbevételének töredékét éri csak el?
Könnyed nyári híradónak indult, de súlyosan végződött: az EU AI Act elhalasztását kérő cégek kapcsán az európai versenyképességen vitáztunk, a szerzői jogtulajdonosok kontra Meta és Anthropic perek kimenetele miatt a szerzői jogi rendszer elavultságáról koppantak keményen a szavak, az AI-tól cidriző tanárokon csak hümmögtünk, az apró jobbra hangolástól benácult Grok modell miatt pedig a balra tolódott sajtón és a meglepett konzervatívokon feszültünk egymásnak. Nesze neked vízparti tartalom!
A Mozilla Corporation, a Firefox böngésző gyártója 2017-ben megvette az egyik legnépszerűbb könyvjelző-gyűjtő alkalmazást, a 2007-ben Read-it-later néven alapított Pocketet, amit idén egyszercsak bezárt a megváltozott felhasználói szokásokra hivatkozva. Miben bízhat az egyszeri felhasználó, ha a jól működő és sokak által használt szolgáltatásokat is bezárják a cégek, vannak-e fenntartható üzleti modellek a startupoknál, milyen korábbi nagy bezárások borzolták a kedélyeket, és hogy nézett ki az Excelben elrejtett repülőszimulátor?
A nagy nyelvi modellek eredményességét nehéz mérni, hiszen egy meglehetősen szubjektív tevékenységet kellene összehasonlítható és objektív módon értékelni. A régebbi benchmark-adatbázisok, mint pl. az MMLU vagy a GPQA már nem jelentenek kihívást az LLM-eknek (ahogy ezt az LMArena Leaderboardján is láthatjuk), mert rájuk tanultak - de akkor mi a megoldás? Az Apple tanulmánya szerint (The Illusion of Thinking) úgysem tudnak komplex problémákat megoldani az LLM-ek, és Caiwei Chen is azt írja, hogy válságban a benchmarking (Can We Fix AI's Evaluation Crisis?). Amíg ezek vitatkoznak, mi versenyezhetünk az LLM-ekkel - ki az okosabb?
Az OpenAI konkurenseit bemutató sorozatunk második részében a Claude LLM-et fejlesztő Anthropicot mutatjuk be, amelyet az OpenAI-ból kiugrott kutatók, élükön az Amodei testvérpárral alapítottak. A közhasznú, de for-profit vállalat a biztonságosabb AI-t tűzte ki célként, az alapítók kissé hippik, de azért sikerült a crypto-bűnözőtől elfogadni a kezdőtőkét, majd az Amazon befektetésein felnövekedni meghatározó piaci szereplővé. A CEO Dario Amodei blogján olvashatunk a szerető kegyelem gépeiről és az AI magyarázhatóságának szükségszerűségéről, mikközben máshol a neten pedig az Anthropic számairól találunk érdekes grafikonokat.
Az American Dialect Society 2013-ban az év szavának választotta a Cory Doctorow által népszerűvé tett kifejezést, az "enshittification"-t, azaz elszaródást. Arról szól, hogy a szolgáltatások eleinte a felhasználókra fókuszálnak, később inkább az üzleti partnerekre, végül főleg a saját részvényeseikre - a felhasználók pedig (sőt egy idő után már az üzleti partnerek is) egyre jobban érzik magukat figyelmen kívül hagyva. Hogyan hat ez a folyamat az MI esetében? És mi köze van mindennek Yann LeCun itthon idén megjelent könyvéhez, amelynek a címe A mesterséges intelligencia és a mélytanulás forradalma? Erről beszélgettünk, illetve még megemlítettük Gyuri előadását is.
Gyuri és Feri kimentek a BusinessFest elnevezésű konferencia-kiállítás-vásár rendezvényre, és egy-egy mikrofonnal a kezükben kóboroltak a standok, színpadok és foodtruckok között. Később Gyuri eltűnt, Feri viszont egy jót beszélgetett Mihalik Judittal, az IBS oktatójával arról, mire használják az MI-t a diákok és az oktatók, és milyen különbségek mutatkoznak ebben a különböző kontinensekről érkezettek körében.
Ne csak mindig az OpenAI szolgáltatásairól beszéljünk, ezzel a céllal néztük át a Google kínálatát, amire jó apropót szolgáltatott az idei fejlesztői konferencia, a Google I/O 2025. A kiterjesztettvalóság-szemüveget meghajtó Android XR-on (és a két szemüveg-partneren: Warby Parker és Gentle Monster) kívül minden az AI-ról szólt: egyebek mellett a Google Meet közel valós idejű fordítási képességéről, a kissé idegen Gmail összefoglalókról (Personal Context) és a NotebookLM-ről. Említettük még a Genimi 2.5 Pro vezető helyét az LMArena Leaderboardon, és bónuszként az Italian Brainrot mémet.