Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
Sports
History
Music
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/f3/ca/fb/f3cafb1b-7029-4569-4726-3b53ea3fb641/mza_1507657791759120472.jpg/600x600bb.jpg
Big Data Hebdo
Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
227 episodes
5 days ago
Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.
Show more...
Technology
Business,
Management
RSS
All content for Big Data Hebdo is the property of Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.
Show more...
Technology
Business,
Management
https://d3wo5wojvuv7l.cloudfront.net/t_rss_itunes_square_1400/images.spreaker.com/original/745a2c3f4dd8d3b6f75a2a33c841d999.jpg
Episode 224 : Données non structurées et modern OCR
Big Data Hebdo
51 minutes
1 week ago
Episode 224 : Données non structurées et modern OCR
Dans cet épisode on explore les défis et les évolutions du RAG (Retrieval-Augmented Generation) dans le contexte de l'IA. L'équipe du Bigdata Hebdo discute des promesses des éditeurs, des difficultés rencontrées par les utilisateurs, et des mécanismes d'IA nécessaires pour traiter efficacement les documents.

On parle des enjeux liés à l'OCR, au chunking, et à l'importance des modèles d'embeddings.

00:00 Introduction
03:06 La promesse des éditeurs
08:05 Comprendre le RAG et son fonctionnement
11:06 Difficultés liées à l'OCR et à l'extraction de données
19:05 Recommandations pour l'optimisation des documents
28:46 Mistral Document AI et ses fonctionnalités
33:49 Chunking et gestion des documents
40:55 Fine-tuning des modèles d'embeddings
43:00 Formats de documents et leur pérennité
47:23 Conclusion et perspectives

Notes et ressources 
https://bigdatahebdo.com/podcast/episode-224-donnees-non-structurees-et-modern-ocr
Big Data Hebdo
Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.