đïž DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en Data et particuliĂšrement en Data Engineering.
đïž DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en Data et particuliĂšrement en Data Engineering.
âïžÂ Dans cet Ă©pisode, Bertrand Fabre, Axel Mauroy et leur invitĂ© Baptiste Vlodarczyk (AI Engineer chez SFEIR, en mission chez LâOrĂ©al) discutent de plusieurs sujets liĂ©s Ă lâintelligence artificielle et Ă lâingĂ©nierie des donnĂ©es.Baptiste prĂ©sente un article de Google sur la sĂ©curisation des serveurs MCP (Model Context Protocol), standard proposĂ© par Anthropic pour connecter les modĂšles de langage Ă des outils via des interfaces comprĂ©hensibles par les LLM. Ils abordent les risques de sĂ©curitĂ© (exposition de donnĂ©es, vol de tokens, dĂ©tournement de session) et la solution proposĂ©e par Google : un proxy centralisĂ© avec des couches de contrĂŽle telles que Model Armor, IAM et Secret Manager.La conversation se poursuit sur les diffĂ©rences entre API et SDK, les standards ouverts (notamment lâOpenAI SDK), et lâimportance de ces outils pour unifier lâĂ©cosystĂšme IA.Enfin, les intervenants commentent lâarticle de Daniel Beach sur le rĂŽle du YAML Engineer, en dĂ©battant de la surutilisation du YAML et de Terraform dans la data et des limites en termes de flexibilitĂ© et de crĂ©ativitĂ©.LâĂ©pisode se conclut sur une rĂ©flexion sur la place du code, la lisibilitĂ©, et la bonne rĂ©partition entre logique applicative et infrastructure.
đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ Axel sur LinkedIn
â Blog de Bertrand
Liens vers les articles :
đ SDK vs API
đ Le YAML Engineer
Dans cet épisode, Bertrand Fabre explore les différences entre SQLMesh et dbt, deux outils de transformation de données. Il met en avant les fonctionnalités de SQLMesh, notamment son intégration de Python, son versioning et son orchestration intégrée. La discussion aborde également les tests et CI/CD, ainsi que les environnements de développement. Bertrand conclut en soulignant l'importance de SQLMesh dans le paysage des outils de transformation de données.
đ â â â â â Bertrand sur LinkedInâ â â â â
â â â â â â Newsletter de Bertrand â â â â â
â â â â â â Blog de Bertrandâ â â â
Article : Les différences entre SQLMesh et dbt
âïžÂ Dans cet Ă©pisode, Axel Mauroy et Bertrand Fabre explorent les nuances de l'architecture mĂ©daillon, un concept popularisĂ© par Databricks. Ils discutent des couches de donnĂ©es bronze, silver et gold, et remettent en question la nĂ©cessitĂ© de certaines de ces couches. L'Ă©pisode aborde Ă©galement l'impact du marketing sur les nouvelles technologies et l'importance de rester pragmatique dans l'adoption de nouvelles architectures. Enfin, ils partagent des nouvelles du secteur, notamment le rachat de Tobiko Data par Fivetran et l'introduction par Google Cloud de son SDK avec Rust.
đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â â â Axel sur LinkedInâ â â â
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â â
Articlesđ Nouvelles du Secteur - Rachat de Tobico Data đ Google Cloud et le SDK Rustđ Impact du Marketing sur les Technologiesđ DĂ©cryptage de l'Architecture MĂ©daillon
Dans cet épisode, Bertrand Fabre explore le concept de data virtualisation, un mécanisme qui permet aux organisations de partager et d'exploiter des données sans les déplacer. Il discute des avantages, des défis et des implications environnementales de cette approche, tout en mettant en lumiÚre des exemples concrets d'application et les perspectives d'avenir dans le domaine de la gestion des données.
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â
Article :
Dans cet Ă©pisode, Bertrand Fabre explore un article sur le protocole MCP de Snowflake, qui permet d'exĂ©cuter des requĂȘtes SQL en langage naturel. Il discute des avantages de l'automatisation des analyses de donnĂ©es, de l'optimisation des coĂ»ts et des performances, ainsi que des dĂ©fis liĂ©s Ă l'utilisation de l'IA dans la Data Engineering. L'Ă©pisode aborde Ă©galement des cas d'utilisation concrets et les implications de cette technologie pour les Ă©quipes de donnĂ©es.
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â
Article :Snowflake MCP
Dans cet épisode de "Lecture à chaud", Bertrand Fabre explore les nouveautés des CTEs récursives sur Databricks, en les comparant avec d'autres plateformes comme BigQuery. Il partage ses réflexions en direct sur l'article, en expliquant comment ce type de CTE permet de naviguer dans des hiérarchies de données. Bertrand illustre le concept avec des exemples pratiques, notamment la construction d'un vélo à partir de sa nomenclature.
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â
Article :
Dans cet épisode de "Lecture à chaud", Bertrand Fabre explore un article de Clarisse Véron sur la modélisation avancée avec dbt, un outil incontournable dans la transformation des données modernes. Bertrand partage ses réflexions à chaud sur les pratiques de modélisation, l'importance de la documentation et les défis liés à l'utilisation de dbt dans les entreprises. Découvrez comment structurer efficacement vos pipelines de données et les meilleures pratiques pour garantir la qualité et la pérennité de vos projets.
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â
Article :
Dans cet épisode de DataWatch, Bertrand Fabre explore un article sur Monte Carlo, un outil de data quality et d'observabilité. Il partage ses réflexions sur les défis de la qualité des données, notamment la recherche des causes racines des anomalies, et discute des solutions possibles pour améliorer l'efficacité des équipes Data et IA.
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â
Article :
Dans cet épisode de DataWatch, Bertrand Fabre inaugure un nouveau format plus spontané et interactif. Il explore un article récent de Decideo sur l'importance des bases de données sécurisées pour les banques françaises, partageant ses réflexions en temps réel. Découvrez pourquoi ces bases de données sont essentielles pour la conformité, la fiabilité des opérations bancaires, et la satisfaction client.
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrand â â â â
â â â â â Blog de Bertrandâ â â
Article :
âïžÂ Dans cet Ă©pisode, Axel Mauroy et Bertrand Fabre explorent divers sujets liĂ©s au Data Engineering, notamment les nouvelles fonctionnalitĂ©s d'Airbyte, l'impact de l'IA sur l'intĂ©gration des donnĂ©es, et les outils comme le standard MCP et Starburst qui facilitent l'accĂšs et la gestion des donnĂ©es. Ils discutent Ă©galement de l'importance de la qualitĂ© des donnĂ©es et de la prĂ©paration des modĂšles d'IA pour la production, ainsi que de l'automatisation de l'infrastructure avec PyInfra.
đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â â Axel sur LinkedInâ â â
đ â â â Bertrand sur LinkedInâ â â
â â â â Newsletter de Bertrand â â â
â â â â Blog de Bertrandâ â â
Articles
đ Introduction du chargement direct dans Airbyte đ PyAirbyte MCP : Le Standard de Connexion pour LLM đ L'association de SFEIR et Starburst đ RedĂ©finir les donnĂ©es data pour l'IA en vue de la production đ Automatisation de l'infrastructure avec PyInfra
âïž Dans cet Ă©pisode, Axel Mauroy et Bertrand Fabre explorent les derniĂšres tendances en Data Engineering et en intelligence artificielle, en mettant l'accent sur la nouvelle plateforme de donnĂ©es d'OVH, les innovations de BigQuery, et l'analyse des dĂ©penses cloud qui continuent d'augmenter, notamment en raison de la demande croissante pour des solutions d'IA.
đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â Axel sur LinkedInâ â
đ â â Bertrand sur LinkedInâ â
â â â Newsletter de Bertrand â â
â â â Blog de Bertrandâ â
Articles
đOVHcloud prĂ©sente la Data Platform idĂ©ale đ Les dĂ©penses mondiales en infrastructure cloud ont augmentĂ© de 21 % au premier trimestre 2025 đ PrĂ©sentation de BigQuery ObjectRef
âïž Dans cet Ă©pisode, Axel Mauroy et Bertrand Fabre abordent des sujets clĂ©s de la Data Engineering, notamment Cloud Run, l'essor de Rust dans la Data Engineering, et les amĂ©liorations de BigQuery. Cloud Run se distingue par sa capacitĂ© Ă s'adapter rapidement aux besoins, tandis que Rust offre des performances supĂ©rieures et des Ă©conomies de coĂ»ts significatives. BigQuery, quant Ă lui, Ă©volue avec des techniques de vectorisation avancĂ©es pour optimiser la gestion des donnĂ©es.
đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â Bertrand sur LinkedInâ
â â Newsletter de Bertrand â
Articlesđ Google Cloud Run propose des GPU sans serveur pour l'IA et le traitement par lots : đ L'essor de Rust dans l'ingĂ©nierie des donnĂ©es : đ AmĂ©liorations de gestion de donnĂ©es de BigQuery et de sa vectorisation
âïž Dans cet Ă©pisode, nous parlons du rachat de la sociĂ©tĂ© Informatica par Salesforce, de Google Cloudâs s'ouvrant au Lakehouse, des nouveautĂ©s 2025 de dbt et de DuckLake, prĂ©sentant SQL au format Lakehouse.
đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ Axel sur LinkedIn
â Blog de Bertrand
Articles
đ DuckLake - SQL au format Lakehouse
đ Les nouveautĂ©s 2025 de dbt
âïž Dans cet Ă©pisode, nous parlons de la prĂ©sentation du serveur MCP pour DBT, de la version 3 d'Apache Airflow, des pistes pour devenir un « meilleur » Data Engineer, et la diffĂ©rence entre le clustering et les partitions.
đïž DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â â â â Axel sur LinkedInâ â â â â
đ â â â â â Bertrand sur LinkedInâ â â â â
â â â â â â Newsletter de Bertrandâ â â â â
â â â â â â Blog de Bertrandâ â â
Articles
đ PrĂ©sentation du serveur MCP pour DBT
đ Sortie d'Apache Airflow 3
âïž Dans cet Ă©pisode, nous parlons de l'annonce de la prise en charge de Git dans BigQuery, du lancement de dbt copilot pour amĂ©liorer lâefficacitĂ© des dĂ©veloppeurs, du Shift Left, du Sommet Databricks Data + AI 2025, et de l'investissement de Snowflake Ventures dans DataOps.live.đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â â â Axel sur LinkedInâ â â â
đ â â â â Bertrand sur LinkedInâ â â â
â â â â â Newsletter de Bertrandâ â â â
â â â â â Blog de Bertrandâ â Articlesđ Annonce des dĂ©pĂŽts BigQuery đ DBT Labs lance un copilote d'IA đ Databricks Data + AI 2025 đ Snowflake Ventures investit dans DataOps.live đ Le Manifeste des donnĂ©es de Shift Left
âïž Dans cet Ă©pisode, nous parlons des nouveautĂ©s de Databricks SQL de fĂ©vrier 2025, du rachat de DataStax par IBM pour renforcer watsonx et l'IA gĂ©nĂ©rative, de la sortie d'Apache Beam 2.63.0, des graphiques d'utilisation des ressources BigQuery, du rĂ©examen du GROUP BY ROLLUP avec un exemple plus rĂ©aliste, des difficultĂ©s du mĂ©tier de Data Engineer et de l'Ă©tat actuel de l'architecture Lakehouse.
đïž DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â â Axel sur LinkedInâ â â
đ â â â Bertrand sur LinkedInâ â â
â â â â Newsletter de Bertrandâ â â
â â â â Blog de Bertrandâ â
Articlesâ đ Graphiques d'utilisation des ressources BigQuery đ The State of Lakehouse Architectuređ IBM rachĂšte DataStax pour renforcer watsonx et l'IA gĂ©nĂ©rativeđ Etre Data Engineer ça craintđ Apache Beam 2.63.0 đ NouveautĂ©s de Databricks SQL, fĂ©vrier 2025 đ RĂ©examen du GROUP BY ROLLUP avec un exemple plus rĂ©aliste
âïž Dans cet Ă©pisode, nous parlons de l'acquisition de Voyage AI par MongoDB, de l'exĂ©cution des LLM open-source sur BigQuery ML, de l'acquisition d'Upsolver par Qlik, de la levĂ©e de fonds de 47 millions de dollars par Prophecy, de l'optimisation du moteur vectoriel d'OpenSearch, de la mĂ©thode pour simplifier votre code Python avec l'opĂ©rateur walrus, l'avenir du mĂ©tier de Data Engineer face aux IA et l'avenir des donnĂ©es non structurĂ©es dans le Data Engineering.
đïž DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â Axel sur LinkedInâ â
đ â â Bertrand sur LinkedInâ â
â â â Newsletter de Bertrandâ â
Articles
đ MongoDB annonce l'acquisition de Voyage AI pour permettre aux organisations de construire des applications dâIA fiables â
đ Prophecy lĂšve 47 millions de dollars de fonds
đ Optimisation du moteur vectoriel d'OpenSearch â
đ Les Data Engineers vont ils devenirs obsolĂštes ?
đ Les donnĂ©es non structurĂ©es sont l'avenir du Data Engineering
âïž Dans cet Ă©pisode, nous parlons du rachat de SDF par dbt, du plan de Donald Trump de 500 milliards de $ pour l'IA, des outils essentiels en Data Engineering et de l'architecture des pipelines de donnĂ©es chez BlaBlaCar. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ â Axel sur LinkedInâ đ â Bertrand sur LinkedInâ â â Newsletter de Bertrandâ â â Blog de Bertrand Articles đ Tobiko - dbt + SDF : Ce qui change et ce qui ne change pas đ Donald Trump annonce son plan de 500 milliards de $ pour l'IA đ Architecture des pipelines de donnĂ©es chez BlaBlaCar đ La boĂźte Ă outils en Data Engineering : Les Outils essentiels
âïž Dans cet Ă©pisode, nous parlons de Microsoft Drasi, de la bascule de lâELT vers lâesprit Graphe, de la tendance Ă utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering, des conseils de prĂ©paration dâentretien pour un post de Staff Data Engineer chez Airbnb Ă 575K$ et les tendances 2025 pour la Data Engineering et lâIA. đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data. đ Axel sur LinkedIn đ Bertrand sur LinkedIn â Newsletter de Bertrand â Blog de Bertrand Articles đ Microsoft Drasi pour la gestion des donnĂ©es en streaming đ La bascule de lâELT vers lâesprit Graphe đ La tendance Ă utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering đ La prĂ©paration dâentretien pour un post de Staff Data Engineer chez Airbnb đ Les tendances 2025 pour la Data Engineering et lâIA
âïž Dans cet Ă©pisode, nous parlons de la montĂ©e des traitements incrĂ©mentaux et lâimpact sur la Data Quality, des Data Products pour amĂ©liorer la Data Quality des traitements incrĂ©mentaux, des Data Rooms Virtuelles, des diffĂ©rents design de pipelines de donnĂ©es, de Snowflake Intelligence et ses agents de donnĂ©es ; đïž DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre Ă©changent autour dâarticles publiĂ©s rĂ©cemment en data.
đ â â â â Axel sur LinkedInâ â â â
đ â â â â Bertrand sur LinkedIn â â â â
â â â â â Newsletter de Bertrandâ â â â
â â â â â Blog de Bertrandâ â
Articles đ La montĂ©e des traitements incrĂ©mentaux et lâimpact sur la Data Quality đ Les Data Products pour amĂ©liorer la Data Quality des traitements incrĂ©mentaux đ Les Data Rooms Virtuelles đ Les diffĂ©rents design de pipelines de donnĂ©es đ Snowflake Intelligence et ses agents de donnĂ©es