XQR (parte 3): "Vede la luce il sistema di editing guidato dall'AI"

https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/51/64/fb/5164fb68-8554-c905-699d-5e66df98f05a/mza_17173197882176631976.jpg/600x600bb.jpg

TechnoPillz

Alex Raccuglia

828 episodes

3 days ago

Una trasmissione semplice ed essenziale, più o meno condotta da Alex Raccuglia e dedicata al mondo della tecnologia e dello sviluppo di app.
In ogni episodio, auto conclusivo, verranno spiegate come funzionano le cose, e perché.
Si parla di hardware, di software, di comunicazione, di programmazione iOS e macOS.
In brevissime puntate questa trasmissione contribuirà a raccontarvi il mondo dell'informatica, della telecomunicazione, della produzione video, insomma tutto quello che ruota attorno alla parola "digitale".

All content for TechnoPillz is the property of Alex Raccuglia and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.

XQR (parte 3): "Vede la luce il sistema di editing guidato dall'AI"

TechnoPillz

27 minutes

1 month ago

XQR (parte 3): "Vede la luce il sistema di editing guidato dall'AI"

Titolo episodio: XQR, Transcriber e LLM per il pre-montaggio (con Alex Raccuglia) 🎧🛠️
Breve riassunto
Alex racconta lo stato dei suoi strumenti per il montaggio/trascrizione: XQR e NQR, le novità introdotte in Transcriber (generazione del contesto, gradi di “aderenza” delle frasi, metadati, estrazione di sottoliste e capitoli) e come sfrutta modelli LLM per automatizzare il pre-montaggio video/audio. Condivide risultati, tempi di elaborazione, limiti (sincronia e accuratezza dei timecode) e idee future (capitoli JSON, individuazione delle frasi più impattanti per il lancio). Chiude con note personali sulle vacanze e qualche aneddoto d’ufficio. 🎬🤖
Ospiti / Interviste
- Nessuna intervista né ospite esterno: episodio a cura di Alex Raccuglia (host, sviluppatore/regista/producer).
Brand, nomi, servizi e link citati (con descrizione)
- Alex Raccuglia — conduttore dell’episodio; sviluppatore e regista/producer che lavora sui tool presentati.
- Techno Pillz — il podcast (creato e condotto da Alex) nel podcast network Runtime Radio.
- Runtime Radio — podcast network citato come contesto di produzione.
- XQR / NQR — strumenti/app citati da Alex:
- XQR: componente di elaborazione/estrazione usata per creare sottoliste e comporre prompt.
- NQR: applicazione che “racchiude tutte le possibilità” e permette di comporre prompt; integra anche copia/incolla di codice Swift.
- Transcriber — applicazione in cui Alex ha implementato le funzionalità descritte: generazione contesto, valutazione aderenza frase‑contesto (tanto/poco/nullo), metadati, estrazione sottoliste e capitoli.
- Modelli GPT / LLM (citati) — Alex confronta diversi modelli:
- “nano” (modello economico, poco performante sul task)
- “gpt‑4.1 mini” (modello intermedio che dà risultati soddisfacenti)
- riferimento a gpt‑3.5 e gpt‑4.1 classico per confronto di prestazioni/costi
(nota: sono menzionati come tipologie di modelli LLM usati per il processamento e il riassunto).
- Swift — riferimento al codice Swift (linguaggio) che NQR permette di copiare/incollare comodamente.
- Producer (menzione generica) — Alex ipotizza l’uso del sistema anche in un prodotto tipo “Producer” per supportare il montaggio in background (non è indicato un prodotto specifico con link).
- Spotify / Apple Podcasts — piattaforme citate come canali dove lasciare like/recensioni.
- Telegram / gruppo Techno Pillz:
- telegram.me/technopillsriot — gruppo Telegram citato per contatti e suggerimenti.
- Numero telefonico citato: 392 87 077 65 — numero che Alex invita a contattare (come da trascrizione).
Note tecniche e takeaways rapidi
- Funziona: estrazione sottoliste e generazione capitoli usando LLM — risultati buoni usando modelli più potenti (gpt‑4.1 mini), ma non perfetti.
- Tempi: un’ora di video (~400 frasi) → 5–8 min di processamento + ~30–35s per estrarre le sottofrasi finali.
- Limiti: precisione dei timecode non 100% (quindi è pre‑montaggio basato sul testo, non montaggio finale completo); occasionali errori di formato dell’output LLM (numeri dispari di frasi, sincronie).
- Idee future: output JSON blindato per i capitoli, estrazione delle “frasi più impattanti” per clip di lancio, migliorare UI/UX di Transcriber.
Emoji finali
Se ti interessa l’editing assistito da AI, i tool per transcribe/summary e i trucchi su come parlare agli LLM, questo episodio è per te. Buon ascolto e lasciaci un feedback! 🚀💬
[00:10:47] Spot
[00:17:41] Spot
[00:26:55] Il riassunto di Sciatta GPT

TechnoPillz
Flusso di coscienza digitale.
Vieni a chiacchierare sul riot:
https://t.me/TechnoPillzRiot
Sono su Mastodon: @shylock74@mastodon.uno
I video di The Morning Rant sul canale YouTube di Runtime:
https://www.youtube.com/playlist?list=PLgGSK_Rq9Xdh1ojZ_Qi-rCwwae_n2Lmzt
Ascoltaci live tutti i giorni 24/7 su:...