
Matej Gjurković je doktorand na FER-u, gdje radi u TakeLabu, laboratoriju za analizu teksta i inžinjerstvo znanja (Text Analysis and Knowledge Engineering Lab). U svom doktoratu bavi se računalnom analizom ličnosti autora teksta. Radio je na mnogim projektima koji uključuju obradu prirodnog jezika u raznovrsnim domenama, a 2023. godine pokrenuo je Semadot, startup za konverzacijsko semantičko pretraživanje dokumenata. Teme o kojima smo razgovarali: 00:45 TakeLab i obrada prirodnog jezika (NLP) 01:35 ChatGPT i rast interesa za NLP 02:41 Osnovno o (velikim) jezičnim modelima 04:16 Usporedba korištenja jezika između ljudi i jezičnih modela 05:43 Mane jezičnih modela 07:23 Područja u kojima jezični modeli rade dobro 08:34 Jezični modeli znaju samo jezik, još smo daleko od generalne inteligencije 11:00 Uloga društvenih mreža za strojno razumijevanje komunikacije 12:29 Što računala mogu zaključiti iz teksta o ličnosti autora teksta + ličnost modela 15:11 Kako specifično treniranje modelima omogućuje da prate instrukcije 17:17 Kako jezični modeli mogu biti korisni u poslu + AI pravni savjetnik 20:22 ChatGPT nije kraj NLP-a, nego još jedna prekretnica i izvor novih tema 22:40 Budućnost umjetne inteligencije je multi-modalna 24:55 Problem malih jezika (kao što je hrvatski) 30:09 Kako će svijet izgledati za 5 godina 32:34 Rizici umjetne inteligencije 34:20 Open source u svijetu jezičnih modela 37:25 Savjet za one koji se žele baviti umjetnom inteligencijom Linkovi: - TakeLab: https://takelab.fer.hr/ - ChatGPT: https://chat.openai.com/ - MistralAI: https://mistral.ai/ - Semadot: https://www.linkedin.com/company/sema-dot/about/ - YugoGPT: https://www.yugochat.com/en - Nikola Ljubešić: https://nljubesi.github.io/ - yt kanal Andreja Karpathyja: https://www.youtube.com/@AndrejKarpathy Voditelj: Ivan Gavran Snimljeno 12.1. u BIZkoshnici (https://bizkoshnica.biz/coworking/) Za više informacija o udruzi Penkala posjetite naš web: https://udruga-penkala.hr/ ili blog: https://medium.com/penkala-blog