Seekord vaatame lähemalt DuckDB-d. Analüütiline andmebaas, mis jookseb efektiivselt ühe masina peal.
Mis oleks võimalikud kasutusjuhud?
Kas DuckDB asendab kõik muud analüütilised andmebaasid?
Kas suurandmed on surnud?
00:00 Sissejuhatus
03:31 DuckDB ajalugu
07:26 MotherDuck ja suurandmed on surnud
12:23 Võrdlus pandasega
15:52 Võrdlus postgrega
20:53 Andmete laadimine ja pärimine
28:25 VM-is jooksutamine
37:10 32TB mälu
41:57 Analüütilised päringud
45:00 Mõttemaailma muutus
Saatejuhid Lauri Koobas ja Kristo Raun.
Marika Eik on Mainor Ülemiste info- ja andmearhitekt. Räägime Ülemiste City andmetest. Mida kujutab endast Ülemiste City Radar? Milliseid andmeid üks tark linn töötleb? Mis rolli mängivad andmed ühes targas linnas?
Ülemiste City Radar:
https://www.ulemistecity.ee/radar/
00:00 Sissejuhatus
03:16 Ülemiste City Radar
08:13 Andmeallikad
11:53 Küsimustikud ja IoT andmed
14:00 Välised mõjud
23:02 Tuleviku suunad ja arenguruum
26:29 Tark linn ja koostöö Tallinna linnaga
31:57 Võrdlus teiste linnadega maailmas
36:01 Olekuvõrrandite valideerimine
41:05 Eluruumid Ülemiste Citys?
Saatejuhid Lauri Koobas ja Kristo Raun.
Lauri avab Tallinn Data Weeki konverentsi külastajate statistika. Teeme koos andmeanalüütikat kasutades Google Sheetsi (peamiselt pivot tabelit). Leiame vastused kõige põletavamatele konverentsiga seotud küsimustele.
00:00 Andmestik
02:00 Google Sheets ja registreerumise statistika
06:03 Osalejate staatused
09:00 Ürituste külastatavus
14:14 Statistika ja andmete visualiseerimine
23:30 Kes jäi kohale tulemata?
29:05 Kes käis kõige rohkem kohal?
35:30 Õppimiskohad ja kokkuvõte
Saatejuhid Lauri Koobas ja Kristo Raun.
Vaatame tagasi Tallinn Data Week 2025 nädalale.
TDW tõi kokku mitmeid üritusi kus arutati andmeinseneeriast, andmeanalüütikast, andmeteadusest ja andmehaldusest. Võtame nädala kokku ja arutame, mis seisus on Eesti andmemaastik aastal 2025.
00:00 Sissejuhatus
02:00 Konverentsi avapäev
13:05 Google Cloud
15:20 Wizon
17:53 Terasky ja dbt Labs
26:40 Sparkle ja Microsoft
29:18 Proekspert
33:20 Bolt
42:08 Snowflake ja Solita
45:08 Veriff
47:30 Tartu Ülikool
51:00 SelectZero
52:47 BCS Koolitus ja Vali Andmetarkus
54:54 Lõpuüritus ja kokkuvõte
Saatejuhid Lauri Koobas ja Kristo Raun.
Mis andmed üldse vajavad kaitsmist?
Kelle ülesanne organisatsioonis on andmekaitse?
Seekord on meil külas Piia Laks-Järve ja Kaisi Elo andmekaitsetarkvara pakkuvast ettevõttest DataVie.
Räägime sellest, et mida ettevõtted peaksid kindlasti silmas pidama ja tegema, selleks et andmekaitsega oleks asjad korras. Ja kui korras saavad asjad üldse olla?
DataVie: www.datavie.ee
00:00 Andmekaitse tähtsus
03:21 Ettevõtete andmekaitse probleemid
06:04 Töötajate andmekaitse ja eraelu
08:55 Igapäevaelu andmekaitse aspektid
12:06 Andmekaitse ja tehnoloogia areng
14:49 Tarkvara lahendused andmekaitseks
20:37 Tuleviku suunad andmekaitses
32:26 DataVie tarkvara
39:08 Andmekaitse regulatsioonide mõju
50:56 Andmekaitse vastutuse jagamine ettevõttes
56:43 DataVie tulevikuplaanid
Saatejuhid Lauri Koobas ja Kristo Raun.
Tauno Tamm, Statistikaameti andmearhitekt, räägib:
- mis toimub Statistikaameti kõhus?
- kuidas Statistikaamet andmeid töötleb?
- mis mõju on statistika seadusel?
- kuidas toimib Statistikaameti andmehaldus?
- kas ja kui palju kasutatakse Statistikaametis masinõpet?
00:00 Sissejuhatus
02:45 Andmete töötlemine Statistikaametis
05:27 Andmeallikad
07:19 Regulatiivne pool
12:18 Eurostat ja andmete edastamine
14:10 Andmepõhine aruandlus
17:25 Lineage, andmekataloogid
21:16 Andmete õiguste haldamine
22:38 Andmete kustutamine ja säilitamine
24:21 Andmete versioonimine
28:42 ETL protsessid ja andmete transformatsioon
30:00 Andmebaasid ja tehnilised lahendused
31:43 Masinõpe ja statistika tootmine
34:00 Riigi digitaalne kaksik
36:18 Andmete muutmine
41:48 Inimese elukaar
45:35 Tulevased Statistikaameti projektid
Saatejuhid Lauri Koobas ja Kristo Raun.
Lauri räägib konverentsi ettevalmistusest. Kes konverentsil üles astuvad? Milline konverentsinädal välja näeb? Mida üks andmeinimene konverentsilt saab? Lisaks räägime ka võimalikest tulevikuplaanidest.
Tallinn Data Week 2025 toimub 29. september - 3. oktoober:
00:00 Konverentsi ettevalmistused
05:43 Konverentsi "arhitektuur"
08:31 Konverentsi sisuline pool ja esinejad
11:25 Erinevad päevad ja teemad konverentsil
20:16 Tuleviku plaanid ja ootused konverentsile
27:48 Konverentsi idee ja selle areng
34:51 Tagasiside ja tuleviku plaanid
39:42 Tiimide kaasamine ja õppimise võimalused
Saatejuhid Lauri Koobas ja Kristo Raun.
Saates on külas Erik Vetemaa. Erik on rahatarkuse äpi Bilance üks kaasasutajatest.
Räägime Erikuga sellest, kuskohast Bilance andmeid saab, miks on inimestel raske oma kulutusi jälgida ja mis kasu Erik ise Bilance-i kasutamisest saanud on.
Samuti räägime ka Bilance-i lähituleviku plaanidest, AI kasutamisest ning andmetega seotud väljakutsetest väljaspool Baltikumi.
Bilance: https://www.bilanceapp.com/
00:00 Rahatarkuse rakendus
03:18 Open Banking ja selle mõju pangandusele
06:30 Tehnilised väljakutsed ja integratsioonid
09:25 Kulude kategoriseerimine
11:43 Bilance-i laienemine
14:39 Konkurents ja turuolukord
17:21 Tuleviku plaanid ja arendused
23:33 Andmete olulisus
26:35 Andmete haldus ja analüüs
30:51 AI Roll
33:16 Jagatud kontod
36:25 Väljakutsed ja edusammud
39:49 Tuleviku visioon
Saatejuhid Lauri Koobas ja Kristo Raun.
Külas on Joosep Lassmann, pikaajalise kogemusega andmeteadlane ning ettevõtte KratTrade asutaja. Räägime elektriturust ja elektrituru toimimisest. Millised andmed on elektriturul olulised? Kuidas on võimalik elektritootmist optimeerida ja mis rolli selles mängivad andmed?
KratTrade: https://krattrade.com/
00:00 Sissejuhatus
03:23 Elektrituru muutused ja andmete roll
06:16 Sageduse hoidmine ja turu tasakaal
11:26 Pakkumiste tegemine
14:21 Optimeerimine
17:18 Süsteemide integreerimine
20:11 Energiavarade haldamine ja turu võimalused
29:18 Turuolukord ja hindade dünaamika
37:26 Tuleviku prognoosimine
42:31 Andmete jagamine ja läbipaistvus energiatootmises
46:49 Investeeringud energiatootmisse
Saatejuhid Lauri Koobas ja Kristo Raun.
Saatekülaline on Karmen Reinpõld - vastupidavusspordi treener ja terviseteaduste doktor. Teemaks on terviseandmed. Terviseandmete kogumine nutikellade ja muude seadmetega. Ning mida nende andmetega pihta hakata? Kas alati tasubki terviseandmeid jälgida?
Karmeni kodulehekülg: https://karmenreinpold.com/
00:00 Tervise ja spordi seosed
03:17 Andmete kogumine ja analüüs
06:18 Subjektiivne ja objektiivne info
08:59 Treeneri väljakutsed ja individuaalsus
11:54 Mõõtmise kasulikkus ja piirangud
14:45 Bioloogilised süsteemid ja nende keerukus
17:54 Mõõtmise ja taastumise seosed
20:43 Andmete valideerimine ja usaldusväärsus
23:40 Elu ja treeningu tasakaal
25:28 Päeviku pidamine ja enesehinnang
25:55 Stressi ja enesetunde seosed
30:06 Une kvaliteet ja taastumine
34:19 Andmete kogumine ja analüüs
38:53 Uued ideed ja teadusuuringud
42:07 Tehnoloogia areng ja tulevik
46:45 Inimese ja süsteemi suhe
Saatejuhid Lauri Koobas ja Kristo Raun.
Räägime keskkondadest. Miks andmetega töös pole alati mitme keskkonna (toodang, test, arendus, ...) kasutamine mõistlik? Mis juhtudel on mõistlik? Kuidas sellest mõelda? Kuidas käib, või võiks käia, testimine?
00:00 Toodang ja keskkonnad
03:21 Tööriistade haldamine ja versioonide uuendamine
06:29 Keskkondade haldamine
09:00 Andmeinseneeria ja tarkvaraarenduse erinevused
12:05 Konsultandi roll
14:52 Andmete anonüümsus ja testkeskkonnad
31:04 Arenduskeskkondade loomine
33:40 Tundlike andmete haldus
39:01 Andmete testimise lähenemised
42:13 Andmete usaldusväärsus ja juhtkonna otsused
45:17 Väljakutsed
48:22 Andmete kvaliteedi kontroll
Saatejuhid Lauri Koobas ja Kristo Raun.
Külas on Gerlyn Tiigemäe, AI ja andmehalduse ekspert ning koolitaja, ja AIPowerment podcasti üks saatejuhtidest.
Räägime Gerlyniga kuidas ettevõtted on AI-d kasutusele võtmas.
Mis on praegused takistused?
Kuidas andmed ja andmehaldus suhestub AI kasutuselevõtuga?
Kuidas AI-d (LLM-e) eksperdina kasutada?
00:00 Sissejuhatus
01:00 AI kasutuse jaotus seoses andmetega
06:04 AI rakendamine ja keerukus
10:30 AI kasutuselevõtu takistused
17:25 Kas AI on innovatsiooniks või produktiivsuseks?
19:39 Finantsanalüütikute roll ja andmehaldus
24:43 Analüütikute erinevad rollid ja tööriistad
31:08 Andmehalduse küpsus ja tõhusus
38:07 Andmehalduse struktuur, juhtkonna roll
42:33 Mis juhtub enne andmehaldust?
48:20 AI kasutamine eksperdina
Saatejuhid Lauri Koobas ja Kristo Raun.
Saatekülaline on Kei Olbrei, pika kogemusega HR ekspert kes on eelmise aasta lõpust alustanud vibe koodimise teekonda. Räägime karjäärist ja karjäärivalikutest, mida AI-ga ehitades silmas pidada ning mis on oluline oskus praegu IT-d õppivatel inimestel.
Kei hetkel ehitatav toode Shipout:
00:00 Sissejuhatus
03:25 Kei karjäär ja AI-tööriistade kasutamine
06:02 Vektorandmebaasi loomine ja selle tähtsus
08:45 Oskuste analüüs ja karjäärivõimalused AI ajastul
11:43 AI tööriistade kasutamine ja takistused
14:38 Üksikettevõtja väljakutsed ja lahendused
17:10 Toote arendamine ja accountability buddy
20:08 Turu kasv ja tuleviku visioon
23:03 Aja juhtimine ja keskendumine
25:53 AI tööriistade kasutamine igapäevaelus
28:00 Süsteemipromptide ja AI tööriistade tõhusus
31:47 AI ja koodikirjutamine: väljakutsed ja võimalused
35:21 Töömaailma muutused ja AI mõju karjäärile
40:28 Koolitus ja haridus: AI roll tulevikus
Saatejuhid Lauri Koobas ja Kristo Raun.
Laomees ja Torumees on nüüd ühe-aastased.
Teeme taastutvuse ning arutame kuidas podcasti tegemine läinud on.
00:00 Sissejuhatus
00:35 Kristo teekond andmevaldkonnas
07:36 Lauri teekond andmevaldkonnas
22:00 Andmeürituste korraldamine
26:35 Mida teeb head of data?
32:40 Operatiivne analüütika
37:00 Podcasti loomine ja areng
Saatejuhid Lauri Koobas ja Kristo Raun.
Märt Ridala on Solita Eesti juht ja andmetarkuse võrgustiku üks eestvedajatest.
Räägime Märdiga andmete kasutamise tähtsusest. Katame privaatsuse ja andmekaitse teemasid, avaliku sektori andmekasutust ning regulatsioone. Mis roll on küberturvalisusel? Mis on Eesti andmehalduse väljakutsed? Mis on positiivsed aspektid andmete kasutamisel?
Andmete kasutamine toob ühiskondlikke kasu, kuid samas tuleb leida tasakaal privaatsuse ja ühiskonna vajaduste vahel.
00:00 Andmete kasutamine ja selle tähtsus
02:50 Poliitika ja ekspertide roll
05:38 Privaatsus ja andmete jälgimine
08:58 Regulatsioonid ja nende rakendamine
11:42 Andmete kasutamise ja kontrolli tasakaal
14:29 Tulevik ja andmete haldamine
23:39 Privaatsuse ja majanduse tasakaal
26:17 Ettevõtete vastutus ja probleemide lahendamine
29:22 Rahvusvahelised lähenemised ja liiklusturvalisus
32:12 Privaatsuse ja avalike andmete dilemma
36:28 Kompromissid privaatsuse ja ühiskonna vahel
40:18 Andmete kasutamise eelised ja teadlikkus
Saatejuhid Lauri Koobas ja Kristo Raun.
Külas on Anni Sild ja Virve Räni BCS Koolitusest. Räägime augustis algavast programmist "Vali Andmetarkus".
Räägime programmi struktuurist, eesmärkidest, tööturu vajadustest ning praktilisest lähenemisest.
Puudutame karjäärivõimalusi, tehisintellekti rolli andmeanalüüsis ja andmehalduse teemasid.
Vali Andmetarkus:
https://vali-it.ee/andmetarkus
00:00 Andmetarkuse programmi tutvustus
02:51 Programmi struktuur ja sisu
05:44 Tööturu vajadused ja programmide areng
08:30 Praktiline õpe ja ettevõtete kaasamine
11:28 Karjäärivõimalused ja portfoolio loomine
14:04 Tehisintellekti roll andmetöös
17:22 Andmeanalüütika ja probleemide lahendamine
20:00 Tööturu rollide määratlemine ja vajadused
23:01 Väikeste ettevõtete kaasamine ja areng
26:03 Koolituse ja karjäärimuutuste võimalused
29:34 Kandideerimise protsess ja tähtajad
33:13 Teooria ja praktika tasakaal koolituses
37:02 Andmehalduse ja tehisintellekti teemad
40:10 Koolituse tulevik ja arengusuunad
Saatejuhid Lauri Koobas ja Kristo Raun
Külas on Kea Kohv - Telia generatiivse tehisaru insener (GenAI engineer).
Räägime sellest, mida teeb üks GenAI insener?
Kuidas Kea sai GenAI inseneriks, kuidas AI mõjutab äriprotsesse, kuidas mõelda GenAI rakendamisest ettevõttes.
Lisaks jagab Kea oma kogemust Kaggle-i võistlustel osalemisest.
00:00 Kea teekond andmemaailma
05:28 Kaggle-i võistlused
15:00 Töö Telias ja generatiivse tehisaru rakendamine
20:14 AI kasutusvaldkonnad
20:23 Klienditeenindus ja generatiivne tehisaru
23:33 Vabavaralised või tasulised AI lahendused
28:11 AI orkestreerimine
35:51 Andmekorraldus ja andmehaldus
40:30 LLM-i vastuste ettearvamatus
44:46 Süsteemide iteratsioon ja parendamine
46:42 Mis edasi saab?
Saatejuhid Lauri Koobas ja Kristo Raun.
Külas on Kristjan Lõhmus. Kristjan on andmeinsener Rush Street Interactive-s ja hiljuti lõpetanud andmeteaduse magistri Tartu Ülikoolis. Oma lõputöö raames lõi Kristjan Avaandmeaida. Räägime kuidas üht kaasaegset andmeplatvormi vabavaraliste tööriistadega üles panna ning mis on piirangud, väljakutsed ja võimalused avaandmete kasutuse puhul.
00:00 Kristjani taust ja lõputöö teema
05:15 Avaandmete probleemid
10:35 Failistruktuurid ja andmete lugemine
17:40 Andmete kasutusvõimekuse tõstmine
22:33 Arhitektuurilised lahendused
29:07 Avaandmete potentsiaal ja väljakutsed
32:43 Open Source tööriistade eelised ja piirangud
36:16 Eesti riigi roll andmeplatvormide arenduses
Saatejuhid Lauri Koobas ja Kristo Raun.
Vaatame üle viimaste nädalate andmeuudised - Tallinna linnamudeldamine; politsei ja numbrituvastuse kaamerad; Rahapesu andmebüroo (RAB) uus andmeladu.
Kas on probleeme privaatsusega, või on pigem tegemist heade andmelahendustega?
Lisaks arutame refleksiivse tehisaru kasutuse teemadel.
00:00 Tallinna linnamudeldamine
02:40 Politseikaamerad
09:15 Rahapesu andmebüroo andmeladu
18:24 Refleksiivne AI
31:25 AI voice-mode
Saatejuhid Lauri Koobas ja Kristo Raun.
Sigrid Kõiv on Infopanga konkurentsianalüütik. Räägime, kuidas toimib Eesti andmemajanduse lipulaev Infopank.
Milliseid andmeid kogutakse?
Kuidas andmed loovad ettevõtetele väärtust?
Kuidas näha mustreid andmetes?
Mille jaoks kasutada masinõpet ning tehisaru?
Infopank: https://www.infopank.ee/
00:00 Infopankur
02:26 Mis on Infopank?
05:43 Andmete kogumine
08:07 Tooted ja teenused
11:19 Ajakohased andmed
14:17 Kliendid ja nende vajadused
16:53 Infopanga plaanid
19:47 Ootamatud avastused
22:41 Uued suunad ja mustrid majanduses
25:20 Masinõpe ja AI rakendused
28:28 Prognoosimide väljakutsed
31:28 Muutuv majanduskeskkond ja analüüs
37:10 Andmemajandus ja tulevikusuunad
Saatejuhid Lauri Koobas ja Kristo Raun.