XQR (parte 3): "Vede la luce il sistema di editing guidato dall'AI"
TechnoPillz
XQR (parte 3): "Vede la luce il sistema di editing guidato dall'AI"
Titolo episodio: XQR, Transcriber e LLM per il pre-montaggio (con Alex Raccuglia) 🎧🛠️ Breve riassunto Alex racconta lo stato dei suoi strumenti per il montaggio/trascrizione: XQR e NQR, le novità introdotte in Transcriber (generazione del contesto, gradi di “aderenza” delle frasi, metadati, estrazione di sottoliste e capitoli) e come sfrutta modelli LLM per automatizzare il pre-montaggio video/audio. Condivide risultati, tempi di elaborazione, limiti (sincronia e accuratezza dei timecode) e idee future (capitoli JSON, individuazione delle frasi più impattanti per il lancio). Chiude con note personali sulle vacanze e qualche aneddoto d’ufficio. 🎬🤖 Ospiti / Interviste - Nessuna intervista né ospite esterno: episodio a cura di Alex Raccuglia (host, sviluppatore/regista/producer). Brand, nomi, servizi e link citati (con descrizione) - Alex Raccuglia — conduttore dell’episodio; sviluppatore e regista/producer che lavora sui tool presentati. - Techno Pillz — il podcast (creato e condotto da Alex) nel podcast network Runtime Radio. - Runtime Radio — podcast network citato come contesto di produzione. - XQR / NQR — strumenti/app citati da Alex:  - XQR: componente di elaborazione/estrazione usata per creare sottoliste e comporre prompt.  - NQR: applicazione che “racchiude tutte le possibilità ” e permette di comporre prompt; integra anche copia/incolla di codice Swift. - Transcriber — applicazione in cui Alex ha implementato le funzionalità descritte: generazione contesto, valutazione aderenza frase‑contesto (tanto/poco/nullo), metadati, estrazione sottoliste e capitoli. - Modelli GPT / LLM (citati) — Alex confronta diversi modelli:  - “nano” (modello economico, poco performante sul task)  - “gpt‑4.1 mini” (modello intermedio che dà risultati soddisfacenti)  - riferimento a gpt‑3.5 e gpt‑4.1 classico per confronto di prestazioni/costi  (nota: sono menzionati come tipologie di modelli LLM usati per il processamento e il riassunto). - Swift — riferimento al codice Swift (linguaggio) che NQR permette di copiare/incollare comodamente. - Producer (menzione generica) — Alex ipotizza l’uso del sistema anche in un prodotto tipo “Producer” per supportare il montaggio in background (non è indicato un prodotto specifico con link). - Spotify / Apple Podcasts — piattaforme citate come canali dove lasciare like/recensioni. - Telegram / gruppo Techno Pillz:  - telegram.me/technopillsriot — gruppo Telegram citato per contatti e suggerimenti.  - Numero telefonico citato: 392 87 077 65 — numero che Alex invita a contattare (come da trascrizione). Note tecniche e takeaways rapidi - Funziona: estrazione sottoliste e generazione capitoli usando LLM — risultati buoni usando modelli più potenti (gpt‑4.1 mini), ma non perfetti. - Tempi: un’ora di video (~400 frasi) → 5–8 min di processamento + ~30–35s per estrarre le sottofrasi finali. - Limiti: precisione dei timecode non 100% (quindi è pre‑montaggio basato sul testo, non montaggio finale completo); occasionali errori di formato dell’output LLM (numeri dispari di frasi, sincronie). - Idee future: output JSON blindato per i capitoli, estrazione delle “frasi più impattanti” per clip di lancio, migliorare UI/UX di Transcriber. Emoji finali Se ti interessa l’editing assistito da AI, i tool per transcribe/summary e i trucchi su come parlare agli LLM, questo episodio è per te. Buon ascolto e lasciaci un feedback! 🚀💬 [00:10:47] Spot [00:17:41] Spot [00:26:55] Il riassunto di Sciatta GPT TechnoPillz Flusso di coscienza digitale. Vieni a chiacchierare sul riot: https://t.me/TechnoPillzRiot Sono su Mastodon: @shylock74@mastodon.uno I video di The Morning Rant sul canale YouTube di Runtime: https://www.youtube.com/playlist?list=PLgGSK_Rq9Xdh1ojZ_Qi-rCwwae_n2Lmzt Ascoltaci live tutti i giorni 24/7 su:...
Back to Episodes