DataWatch

EXPLORE

Society & Culture

© 2024 PodJoint

00:00 / 00:00

Sign in

or

Don't have an account?

Sign up

Forgot password

https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/d4/cc/f6/d4ccf642-bb60-ca4c-9e71-97e22cf9f473/mza_570708124785136326.jpg/600x600bb.jpg

DataWatch

Bertrand Fabre

46 episodes

4 hours ago

🎙️ DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en Data et particulièrement en Data Engineering.

Show more...

All content for DataWatch is the property of Bertrand Fabre and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.

🎙️ DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en Data et particulièrement en Data Engineering.

Show more...

Episodes (20/46)

DataWatch

MCP, une sécurité en danger ?

☝️ Dans cet épisode, Bertrand Fabre, Axel Mauroy et leur invité Baptiste Vlodarczyk (AI Engineer chez SFEIR, en mission chez L’Oréal) discutent de plusieurs sujets liés à l’intelligence artificielle et à l’ingénierie des données.Baptiste présente un article de Google sur la sécurisation des serveurs MCP (Model Context Protocol), standard proposé par Anthropic pour connecter les modèles de langage à des outils via des interfaces compréhensibles par les LLM. Ils abordent les risques de sécurité (exposition de données, vol de tokens, détournement de session) et la solution proposée par Google : un proxy centralisé avec des couches de contrôle telles que Model Armor, IAM et Secret Manager.La conversation se poursuit sur les différences entre API et SDK, les standards ouverts (notamment l’OpenAI SDK), et l’importance de ces outils pour unifier l’écosystème IA.Enfin, les intervenants commentent l’article de Daniel Beach sur le rôle du YAML Engineer, en débattant de la surutilisation du YAML et de Terraform dans la data et des limites en termes de flexibilité et de créativité.L’épisode se conclut sur une réflexion sur la place du code, la lisibilité, et la bonne répartition entre logique applicative et infrastructure.

🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 Axel sur LinkedIn

👉 Bertrand sur LinkedIn

➕ Newsletter de Bertrand

➕ Blog de Bertrand

Liens vers les articles :

👉 Le MCP et sa sécurité

👉 SDK vs API

👉 Le YAML Engineer

2 days ago

1 second

DataWatch

Les différences entre SQLMesh et dbt 💪

Dans cet épisode, Bertrand Fabre explore les différences entre SQLMesh et dbt, deux outils de transformation de données. Il met en avant les fonctionnalités de SQLMesh, notamment son intégration de Python, son versioning et son orchestration intégrée. La discussion aborde également les tests et CI/CD, ainsi que les environnements de développement. Bertrand conclut en soulignant l'importance de SQLMesh dans le paysage des outils de transformation de données.

👉 ⁠⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠⁠

➕ ⁠⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠⁠

➕ ⁠⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠⁠

Article : Les différences entre SQLMesh et dbt

1 month ago

DataWatch

L’architecture médaillon du marketing ?!

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre explorent les nuances de l'architecture médaillon, un concept popularisé par Databricks. Ils discutent des couches de données bronze, silver et gold, et remettent en question la nécessité de certaines de ces couches. L'épisode aborde également l'impact du marketing sur les nouvelles technologies et l'importance de rester pragmatique dans l'adoption de nouvelles architectures. Enfin, ils partagent des nouvelles du secteur, notamment le rachat de Tobiko Data par Fivetran et l'introduction par Google Cloud de son SDK avec Rust.

🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠⁠

Articles👉 Nouvelles du Secteur - Rachat de Tobico Data 👉 Google Cloud et le SDK Rust👉 Impact du Marketing sur les Technologies👉 Décryptage de l'Architecture Médaillon

1 month ago

DataWatch

Data Virtualisation : plus besoin de Data Warehouse ?

Dans cet épisode, Bertrand Fabre explore le concept de data virtualisation, un mécanisme qui permet aux organisations de partager et d'exploiter des données sans les déplacer. Il discute des avantages, des défis et des implications environnementales de cette approche, tout en mettant en lumière des exemples concrets d'application et les perspectives d'avenir dans le domaine de la gestion des données.

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Article :

Data Virtualisation

2 months ago

DataWatch

Snowflake MCP : la fin des Data Engineers SQL ?!

Dans cet épisode, Bertrand Fabre explore un article sur le protocole MCP de Snowflake, qui permet d'exécuter des requêtes SQL en langage naturel. Il discute des avantages de l'automatisation des analyses de données, de l'optimisation des coûts et des performances, ainsi que des défis liés à l'utilisation de l'IA dans la Data Engineering. L'épisode aborde également des cas d'utilisation concrets et les implications de cette technologie pour les équipes de données.

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Article :Snowflake MCP

2 months ago

1 second

DataWatch

Disponibilité des CTEs Récursives dans Databricks !

Dans cet épisode de "Lecture à chaud", Bertrand Fabre explore les nouveautés des CTEs récursives sur Databricks, en les comparant avec d'autres plateformes comme BigQuery. Il partage ses réflexions en direct sur l'article, en expliquant comment ce type de CTE permet de naviguer dans des hiérarchies de données. Bertrand illustre le concept avec des exemples pratiques, notamment la construction d'un vélo à partir de sa nomenclature.

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Article :

CTEs Récursives dans Databricks

2 months ago

DataWatch

Modélisation avancée DBT : optimisez votre pipeline analytique

Dans cet épisode de "Lecture à chaud", Bertrand Fabre explore un article de Clarisse Véron sur la modélisation avancée avec dbt, un outil incontournable dans la transformation des données modernes. Bertrand partage ses réflexions à chaud sur les pratiques de modélisation, l'importance de la documentation et les défis liés à l'utilisation de dbt dans les entreprises. Découvrez comment structurer efficacement vos pipelines de données et les meilleures pratiques pour garantir la qualité et la pérennité de vos projets.

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Article :

Modélisation avancée DBT

2 months ago

1 second

DataWatch

Identification des causes racines en Data Engineering

Dans cet épisode de DataWatch, Bertrand Fabre explore un article sur Monte Carlo, un outil de data quality et d'observabilité. Il partage ses réflexions sur les défis de la qualité des données, notamment la recherche des causes racines des anomalies, et discute des solutions possibles pour améliorer l'efficacité des équipes Data et IA.

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Article :

Identification des causes racines

3 months ago

DataWatch

Des bases de données fiables pour les banques françaises

Dans cet épisode de DataWatch, Bertrand Fabre inaugure un nouveau format plus spontané et interactif. Il explore un article récent de Decideo sur l'importance des bases de données sécurisées pour les banques françaises, partageant ses réflexions en temps réel. Découvrez pourquoi ces bases de données sont essentielles pour la conformité, la fiabilité des opérations bancaires, et la satisfaction client.

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Article :

Des bases de données fiables pour les banques françaises

3 months ago

DataWatch

Airbyte et son MCP dans Cursor !

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre explorent divers sujets liés au Data Engineering, notamment les nouvelles fonctionnalités d'Airbyte, l'impact de l'IA sur l'intégration des données, et les outils comme le standard MCP et Starburst qui facilitent l'accès et la gestion des données. Ils discutent également de l'importance de la qualité des données et de la préparation des modèles d'IA pour la production, ainsi que de l'automatisation de l'infrastructure avec PyInfra.

🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠Axel sur LinkedIn⁠⁠⁠

👉 ⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠

➕ ⁠⁠⁠Newsletter de Bertrand ⁠⁠⁠

➕ ⁠⁠⁠Blog de Bertrand⁠⁠⁠

Articles

👉 Introduction du chargement direct dans Airbyte 👉 PyAirbyte MCP : Le Standard de Connexion pour LLM 👉 L'association de SFEIR et Starburst 👉 Redéfinir les données data pour l'IA en vue de la production 👉 Automatisation de l'infrastructure avec PyInfra

3 months ago

1 second

DataWatch

OVH sort sa Data Platform !

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre explorent les dernières tendances en Data Engineering et en intelligence artificielle, en mettant l'accent sur la nouvelle plateforme de données d'OVH, les innovations de BigQuery, et l'analyse des dépenses cloud qui continuent d'augmenter, notamment en raison de la demande croissante pour des solutions d'IA.

🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠Axel sur LinkedIn⁠⁠

👉 ⁠⁠Bertrand sur LinkedIn⁠⁠

➕ ⁠⁠Newsletter de Bertrand ⁠⁠

➕ ⁠⁠Blog de Bertrand⁠⁠

Articles

👉OVHcloud présente la Data Platform idéale 👉 Les dépenses mondiales en infrastructure cloud ont augmenté de 21 % au premier trimestre 2025 👉 Présentation de BigQuery ObjectRef

4 months ago

DataWatch

70% de coûts en moins en utilisant Rust ?!

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre abordent des sujets clés de la Data Engineering, notamment Cloud Run, l'essor de Rust dans la Data Engineering, et les améliorations de BigQuery. Cloud Run se distingue par sa capacité à s'adapter rapidement aux besoins, tandis que Rust offre des performances supérieures et des économies de coûts significatives. BigQuery, quant à lui, évolue avec des techniques de vectorisation avancées pour optimiser la gestion des données.

🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠Axel sur LinkedIn⁠

👉 ⁠Bertrand sur LinkedIn⁠

➕ ⁠Newsletter de Bertrand ⁠

➕ ⁠Blog de Bertrand⁠

Articles👉 Google Cloud Run propose des GPU sans serveur pour l'IA et le traitement par lots : 👉 L'essor de Rust dans l'ingénierie des données : 👉 Améliorations de gestion de données de BigQuery et de sa vectorisation

4 months ago

DataWatch

dbt fait sa Fusion !

☝️ Dans cet épisode, nous parlons du rachat de la société Informatica par Salesforce, de Google Cloud’s s'ouvrant au Lakehouse, des nouveautés 2025 de dbt et de DuckLake, présentant SQL au format Lakehouse.

🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 Axel sur LinkedIn

👉 Bertrand sur LinkedIn

➕ Newsletter de Bertrand

➕ Blog de Bertrand

Articles

👉 DuckLake - SQL au format Lakehouse

👉 Les nouveautés 2025 de dbt

👉 Google Cloud’s s'ouvre au Lakehouse

👉 Rachat d'Informatica par Salesforce

4 months ago

DataWatch

☝️ Dans cet épisode, nous parlons de la présentation du serveur MCP pour DBT, de la version 3 d'Apache Airflow, des pistes pour devenir un « meilleur » Data Engineer, et la différence entre le clustering et les partitions.

🎙️ DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠⁠

👉 ⁠⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠⁠

➕ ⁠⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠⁠

➕ ⁠⁠⁠⁠⁠Blog de Bertrand⁠⁠⁠

Articles

👉 Présentation du serveur MCP pour DBT

👉 Sortie d'Apache Airflow 3

👉 Comment devenir un « meilleur » Data Engineer

👉 Clustering vs Partitions

6 months ago

DataWatch

Shift Left, la data change de responsable !

☝️ Dans cet épisode, nous parlons de l'annonce de la prise en charge de Git dans BigQuery, du lancement de dbt copilot pour améliorer l’efficacité des développeurs, du Shift Left, du Sommet Databricks Data + AI 2025, et de l'investissement de Snowflake Ventures dans DataOps.live.🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠Articles👉 Annonce des dépôts BigQuery 👉 DBT Labs lance un copilote d'IA 👉 Databricks Data + AI 2025 👉 Snowflake Ventures investit dans DataOps.live 👉 Le Manifeste des données de Shift Left

7 months ago

DataWatch

Data Engineer, ça craint ou pas ?

☝️ Dans cet épisode, nous parlons des nouveautés de Databricks SQL de février 2025, du rachat de DataStax par IBM pour renforcer watsonx et l'IA générative, de la sortie d'Apache Beam 2.63.0, des graphiques d'utilisation des ressources BigQuery, du réexamen du GROUP BY ROLLUP avec un exemple plus réaliste, des difficultés du métier de Data Engineer et de l'état actuel de l'architecture Lakehouse.

🎙️ DataWatch est un podcast de veille en data.Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠Axel sur LinkedIn⁠⁠⁠

👉 ⁠⁠⁠Bertrand sur LinkedIn⁠⁠⁠

➕ ⁠⁠⁠Newsletter de Bertrand⁠⁠⁠

➕ ⁠⁠⁠Blog de Bertrand⁠⁠

Articles⁠👉 Graphiques d'utilisation des ressources BigQuery 👉 The State of Lakehouse Architecture👉 IBM rachète DataStax pour renforcer watsonx et l'IA générative👉 Etre Data Engineer ça craint👉 Apache Beam 2.63.0 👉 Nouveautés de Databricks SQL, février 2025 👉 Réexamen du GROUP BY ROLLUP avec un exemple plus réaliste

7 months ago

1 second

DataWatch

La disparition des Data Engineers !

☝️ Dans cet épisode, nous parlons de l'acquisition de Voyage AI par MongoDB, de l'exécution des LLM open-source sur BigQuery ML, de l'acquisition d'Upsolver par Qlik, de la levée de fonds de 47 millions de dollars par Prophecy, de l'optimisation du moteur vectoriel d'OpenSearch, de la méthode pour simplifier votre code Python avec l'opérateur walrus, l'avenir du métier de Data Engineer face aux IA et l'avenir des données non structurées dans le Data Engineering.

🎙️ DataWatch est un podcast de veille en data.

Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠Axel sur LinkedIn⁠⁠

👉 ⁠⁠Bertrand sur LinkedIn⁠⁠

➕ ⁠⁠Newsletter de Bertrand⁠⁠

➕ ⁠⁠Blog de Bertrand⁠

Articles

👉 MongoDB annonce l'acquisition de Voyage AI pour permettre aux organisations de construire des applications d’IA fiables ⁠

👉 Prophecy lève 47 millions de dollars de fonds

👉 Optimisation du moteur vectoriel d'OpenSearch ⁠

👉 Les Data Engineers vont ils devenirs obsolètes ?

👉 Les données non structurées sont l'avenir du Data Engineering

👉 Exécuter des LLM open-source sur BigQuery ML

👉 Qlik acquiert Upsolver pour proposer l’ingestion et l’optimisation à faible latence pour Apache Iceberg

8 months ago

1 second

DataWatch

Les outils essentiels du Data Engineer ! 500Mds$ dans la data 💰

☝️ Dans cet épisode, nous parlons du rachat de SDF par dbt, du plan de Donald Trump de 500 milliards de $ pour l'IA, des outils essentiels en Data Engineering et de l'architecture des pipelines de données chez BlaBlaCar. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 ⁠Axel sur LinkedIn⁠ 👉 ⁠Bertrand sur LinkedIn⁠ ➕ ⁠Newsletter de Bertrand⁠ ➕ ⁠Blog de Bertrand Articles 👉 Tobiko - dbt + SDF : Ce qui change et ce qui ne change pas 👉 Donald Trump annonce son plan de 500 milliards de $ pour l'IA 👉 Architecture des pipelines de données chez BlaBlaCar 👉 La boîte à outils en Data Engineering : Les Outils essentiels

9 months ago

1 second

DataWatch

575K$ comme Staff Data Enginneer chez Airbnb ! Ses conseils pour décrocher ce poste

☝️ Dans cet épisode, nous parlons de Microsoft Drasi, de la bascule de l’ELT vers l’esprit Graphe, de la tendance à utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering, des conseils de préparation d’entretien pour un post de Staff Data Engineer chez Airbnb à 575K$ et les tendances 2025 pour la Data Engineering et l’IA. 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data. 👉 Axel sur LinkedIn 👉 Bertrand sur LinkedIn ➕ Newsletter de Bertrand ➕ Blog de Bertrand Articles 👉 Microsoft Drasi pour la gestion des données en streaming 👉 La bascule de l’ELT vers l’esprit Graphe 👉 La tendance à utiliser les outils Apache Kafka, Apache Flink et Apache Iceberg en Data Engineering 👉 La préparation d’entretien pour un post de Staff Data Engineer chez Airbnb 👉 Les tendances 2025 pour la Data Engineering et l’IA

11 months ago

1 second

DataWatch

De l’incrémental au Data Product en passant par l'IA : ce qui redéfinit le Data Engineering

☝️ Dans cet épisode, nous parlons de la montée des traitements incrémentaux et l’impact sur la Data Quality, des Data Products pour améliorer la Data Quality des traitements incrémentaux, des Data Rooms Virtuelles, des différents design de pipelines de données, de Snowflake Intelligence et ses agents de données ; 🎙️ DataWatch est un podcast de veille en data. Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en data.

👉 ⁠⁠⁠⁠Axel sur LinkedIn⁠⁠⁠⁠

👉 ⁠⁠⁠⁠Bertrand sur LinkedIn ⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Newsletter de Bertrand⁠⁠⁠⁠

➕ ⁠⁠⁠⁠Blog de Bertrand⁠⁠

Articles 👉 La montée des traitements incrémentaux et l’impact sur la Data Quality 👉 Les Data Products pour améliorer la Data Quality des traitements incrémentaux 👉 Les Data Rooms Virtuelles 👉 Les différents design de pipelines de données 👉 Snowflake Intelligence et ses agents de données

11 months ago

1 second

DataWatch

🎙️ DataWatch est un podcast de veille en data.
Axel Mauroy et Bertrand Fabre échangent autour d’articles publiés récemment en Data et particulièrement en Data Engineering.