Épisodes

  • #215 - Le CEO d’Airbyte partage sa vision (Open Source, GenAI, Souveraineté)
    Jul 9 2025

    Michel Tricot est CEO et co-fondateur d'Airbyte, l’un des outils d’ingestion modernes leader sur le marché. Leur dernière levée de fonds en 2021 s'élève à 150 millions de dollars avec une valorisation à 1.5 milliards de dollars.


    On aborde :


    🔥 La genèse d'Airbyte et le choix de l’Open Source

    🔥 Le positionnement actuel d’Airbyte par rapport aux concurrents

    🔥 L’impact de la GenAI : données non structurées, ingestion pour le Software Engineering

    🔥 L’autre tendance que Michel suit de près : l’enjeu de la souveraineté


    ❤️ PARTENAIRE


    Ce podcast est rendu possible par Airbyte, l'outil d'ingestion moderne valorisé 1.5 milliards de $.

    👉 Découvrir la solution

    👉 Contacter Michel sur LinkedIn


    📚 RESSOURCES


    - Le LinkedIn de Michel

    - Le livre High Output Management d’Andy Grove (ex-CEO d'Intel)


    🎬 CHAPITRES


    00:48 La genèse d’Airbyte

    02:36 Sa stratégie Open Source

    05:50 Ses avantages

    10:02 La version 1.0

    12:26 La tendance des IA génératives

    16:39 L’enjeu de la souveraineté

    18:41 Monter une licorne Data : France vs USA ?

    19:59 Le livre recommandé par Michel


    🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


    #203 - Masterclass | Mettre en place une Modern Data Stack avec Matthieu Rousseau

    #186 - On compare dbt & SQLMesh avec Christophe Blefari (aka Blef)

    #175 - Stack Open Source, Être Manager "doer" & S’adapter à la GenAI avec Christelle (ex-Head of Data @Lydia) et Blef


    💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN


    On a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.

    📚 Découvrir le programme du bootcamp ici

    🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBird


    DataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂


    👋 PLUS DE CONTENU DATA ?


    1/ Suivez-moi sur LinkedIn ici 🤳

    2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

    3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


    🎙 SOUTENEZ LE PODCAST GRATUITEMENT


    1/ Abonnez-vous 🔔

    2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    Afficher plus Afficher moins
    21 min
  • #214 - Adeo : Déployer la stratégie IA du Groupe (Leroy Merlin, Bricoman, Weldom…)
    Jul 7 2025

    Benjamin Rey est Head of AI au sein du Groupe Adeo, le leader européen du bricolage qui rassemble notamment Leroy Merlin, Bricoman, Saint-Maclou et Weldom dans 11 pays avec 115 000 collaborateurs. Ex-CDO de Leroy Merlin, il pilote désormais la stratégie IA du groupe.


    On aborde :


    🔥 Le contexte et la genèse de la stratégie IA du groupe

    🔥 Ses missions en tant que Head of AI : aligner tout le monde, construire les plateformes et tester les technologies

    🔥 L’identification de 200+ use cases et le déploiement des 1ers projets (commerce, supply…)

    🔥 Leur stack GenAI et leurs plus grosses difficultés (gouvernance de l’IA et cohérence globale)


    💪 VOUS AVEZ UN PROJET DATA ?


    DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).

    Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.


    👉 Nous rencontrer ici


    📚 RESSOURCES


    - Le LinkedIn de Benjamin

    - Le blog de Philip Schmidt, chercheur chez DeepMind (ex-Hugging Face)

    - L'édition spéciale "Les 100+ ressources des leaders data invités sur DataGen" de notre newsletter


    🎬 CHAPITRES


    00:00 Le contexte et la genèse de la stratégie IA

    04:51 1ère étape : cartographier les initiatives existantes

    06:41 2 cas d’usage prioritaires : Commerce et Supply

    08:25 La définition d’un MVP AI chez Adeo

    12:30 La stack GenAI : Google, OpenAI, Mistral...

    13:32 Les plus gros challenges rencontrés

    15:27 Les prochaines étapes

    17:07 Ses ressources préférées


    🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


    #172 - Mirakl : Intégrer la GenAI dans le Produit

    #165 - BNP Paribas : Les 6 piliers de leur programme IA

    #146 - L’Oréal : Mettre en place une Stratégie IA Génératives


    👋 PLUS DE CONTENU DATA ?


    1/ Suivez-moi sur LinkedIn ici 🤳

    2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

    3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


    🎙 SOUTENEZ LE PODCAST GRATUITEMENT


    1/ Abonnez-vous 🔔

    2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    Afficher plus Afficher moins
    20 min
  • #213 - Red Bull : Gagner le Tour de France grâce à la Data Science
    Jul 2 2025
    Kevin Yven est Head of Data Science chez Red Bull-BORA-Hansgrohe, l’une des plus grandes équipes du Tour de France.On aborde :🔥 Leurs projets Data Science : détection de talents, entraînement, analyse concurrentielle🔥 Un projet clé pour le Tour : calcul des watts rapportés au poids des coureurs🔥 Une analyse live qui a fait gagner une étape🔥 Leur stack data, l’organisation et la réalité du métier sur le terrain💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBirdDataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂📚 RESSOURCES- Le LinkedIn de Kevin- La série Netflix sur le Tour de France : Au Coeur du Peloton- Le film Le stratège de Bennett Miller avec Brad Pitt- Le livre Atomic Habits de James Clear- L’assistant IA pour les professionnels du sport développé par Kevin : Sports Science AI- L'édition spéciale "Les 100+ ressources des leaders data invités sur DataGen" de notre newsletter🎬 CHAPITRES00:00 Kevin et de l’équipe Red Bull en quelques mots01:19 Les projets Data Science de l’équipe02:26 Un projet clé pour préparer le Tour de France08:07 Une analyse live qui a permis de gagner une étape11:35 Leur orga et leur stack data14:41 Leurs plus grosses difficultés16:36 Les pré-requis du métier18:56 Réalité vs fantasmes du métier21:44 Ses ressources préférées🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#181 - Olympique de Marseille : L’ex-Head of Data partage sa stratégie Data#164 - Jeux Olympiques : Améliorer la performance des athlètes avec la Data & l’IA#193 - Comprendre l’impact de l’IA sur le Climat avec Lou Welgryn de Data For Good, ex-Carbon4👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
    Afficher plus Afficher moins
    27 min
  • #212 - BlaBlaCar : Déployer un projet GenAI qui rapporte 1 million par an
    Jun 30 2025

    Raphaël Berly est Data Science Lead chez BlaBlaCar, la licorne française qui a l’une des équipes Data les plus matures en France. Aujourd’hui, on parle de son plus gros challenge de ces dernières années : déployer un projet GenAI qui rapporte 1 million d’euros par an à BlaBlaCar.


    On aborde :


    🔥 Le contexte autour de ce projet GenAI : la modération

    🔥 Comment la solution fonctionne : zoom sur l’embedding

    🔥 Les 2 axes méthodologiques du projet, l’organisation & la stack GenAI

    🔥 Les plus grosses difficultés & les prochaines étapes du projet


    💪 VOUS AVEZ UN PROJET DATA ?


    DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).

    Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.


    👉 Nous rencontrer ici


    📚 RESSOURCES


    - Le LinkedIn de Raphaël

    - Ses articles Medium sur la place du Machine Learning chez BlaBlaCar

    - Les Règles du Machine Learning de Google

    - L'édition spéciale "Les 40 chantiers Data & IA à lancer en 2025" de notre newsletter


    🎬 CHAPITRES


    00:00 La modération de texte chez BlaBlaCar

    03:00 Comment ça fonctionne ?

    05:45 L’embedding : définition et avantages

    09:32 Les 2 axes méthodologies clés du projet

    14:21 La stack GenAI

    17:03 L’orga de l’équipe

    18:27 Leurs plus gros challenges

    23:51 Les prochaines étapes du projet

    25:33 Les questions de la fin


    🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


    #188 - Le VP Data de BlaBlaCar partage ses 3 priorités de 2025, avec Blef

    #196 - Pigment : Monter l'équipe GenAI appliquée au Produit (Licorne, +230 millions levés)

    #192 - Gorgias : Mettre en place une approche Self-Service Analytics grâce aux IA Génératives


    👋 PLUS DE CONTENU DATA ?


    1/ Suivez-moi sur LinkedIn ici 🤳

    2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

    3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


    🎙 SOUTENEZ LE PODCAST GRATUITEMENT


    1/ Abonnez-vous 🔔

    2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    Afficher plus Afficher moins
    28 min
  • #211 - Brevo : Mettre en place une approche DataOps
    Jun 23 2025

    Antoine Tanguy est DataOps chez Brevo, la licorne française qui propose une solution de marketing automation. Arrivé il y a 4 ans chez Brevo, il a évolué du poste de SRE vers celui de Data Ops il y a 1 an et demi. Il accompagne une équipe Data de 15 personnes répartie en 3 sous-équipes : Data Science, Data Engineering et Data Analytics.


    On aborde :

    🔥 Le rôle et les missions d’un DataOps chez Brevo

    🔥 Les chantiers concrets : MLOps avec ZenML, Semantic Layer avec Cube.js, CI/CD avec Terraform et GitHub

    🔥 Les plus grosses difficultés du DataOps : cibler le besoin, comprendre son interlocuteur, rester pragmatique…

    🔥 Les prochaines étapes de l’équipe : renforcer le MLOps, adopter Kafka, recruter un 2ème Data Ops


    📚 RESSOURCES


    - Le LinkedIn d'Antoine

    - La Newsletter TLDR

    - L'édition spéciale "Les 100+ ressources des leaders data invités sur DataGen" de notre newsletter


    🎬 CHAPITRES


    00:00 Le parcours d’Antoine

    02:46 Les chantiers d’un DataOps

    10:23 Ses principales difficultés

    13:45 Ses prochaines étapes

    16:17 Les questions de la fin


    🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


    #184 - Brevo : Mettre en place de l’Embedded Analytics dans le Produit

    #142 - Brevo : Structurer l’équipe Data d’un centaure

    #143 - Tout comprendre sur le DataOps


    💪 VOUS AVEZ UN PROJET DATA ?


    DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).

    Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.


    👉 Nous rencontrer ici


    👋 PLUS DE CONTENU DATA ?


    1/ Suivez-moi sur LinkedIn ici 🤳

    2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

    3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


    🎙 SOUTENEZ LE PODCAST GRATUITEMENT


    1/ Abonnez-vous 🔔

    2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    Afficher plus Afficher moins
    19 min
  • #210 - Informatica : Préparer ses données pour l’IA
    Jun 18 2025

    Are Hegdal est un Expert Data Management. Il travaille chez Informatica depuis 5 ans et est dans la data depuis presque 20 ans. Informatica est un leader mondial du secteur du Data Management. Ils ont été rachetés 8 milliards de dollars par Salesforce en 2025.


    On aborde :


    🔥 La genèse et les grandes briques d’Informatica (Intégration, Vision 360°, Data Quality…)

    🔥 Leur positionnement sur le marché (plateforme globale, approche neutre, R&D…)

    🔥 2 cas d’usage Data & GenIA dans la Pharma et l’Assurance

    🔥 L’impact de la GenAI sur Informatica depuis quelques années


    ❤️ PARTENAIRE


    Ce podcast est rendu possible par Informatica, leader mondial du Data Management utilisé par des grands groupes comme Sanofi, Apple mais aussi des plus petites comme Garance en France.

    👉 S’inscrire aux cafés de la data d’Informatica

    👉 Contacter Are sur LinkedIn


    📚 RESSOURCES


    - Le LinkedIn d'Are

    - Le podcast Business de McKinsey

    - Le podcast Business du BCG

    - L'édition spéciale "Les 40 chantiers Data & IA à lancer en 2025" de notre newsletter


    🎬 CHAPITRES


    00:00 Informatica en quelques mots

    02:07 Les grandes briques d’Informatica

    05:04 Son positionnement face aux concurrents

    08:51 Les types de clients

    10:21 2 cas d’usage : Pharma et Assurance

    17:10 L’impact de la Gen AI

    20:32 Leurs webinars Data Management

    21:03 La recommandation de contenu d’Are


    🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


    #205 - La Lead Data Scientist de Pernod Ricard partage sa stratégie (orga, stack, projets)

    #168 - Comprendre les rôles clés de la Data Gouvernance avec Charlotte Ledoux (30K abonnés LinkedIn)

    #144 - Mettre en place une Data Gouvernance avec Charlotte Ledoux (20K abonnés LinkedIn)


    👋 PLUS DE CONTENU DATA ?


    1/ Suivez-moi sur LinkedIn ici 🤳

    2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

    3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


    🎙 SOUTENEZ LE PODCAST GRATUITEMENT


    1/ Abonnez-vous 🔔

    2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    Afficher plus Afficher moins
    24 min
  • #209 - Mirakl : Déployer des Agents IA pour le Business
    Jun 16 2025

    Laure Menissier est AI & Analytics Director chez Mirakl, la licorne française qui accompagne les entreprises sur le développement de leur eCommerce avec des solutions SaaS notamment pour la marketplace ou le retail media, et qui a réalisé une levée de fonds record de 555 millions de dollars.


    On aborde :

    🔥 Le contexte et le lancement d’un pilote avec Dust

    🔥 Des exemples d’Agents IA qu’ils ont déployés (Support, RFP, onboarding…)

    🔥 Les plus gros challenges : évangélisation sur les attentes et formation

    🔥 La stack déployée et leur objectif de l’année : 50% des collaborateurs ont créé leur agent


    💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN


    On a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.

    📚 Découvrir le programme du bootcamp

    🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines


    DataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂


    📚 RESSOURCES


    - Le LinkedIn de Laure

    - Les postes à pourvoir chez Mirakl

    - La chaîne YouTube 3Blue1Brown

    - La plateforme de formation DeepLearning.ai

    - Les meetups Generative AI Paris

    - L'édition spéciale Les 100+ ressources des leaders data invités sur DataGen de notre newsletter


    🎬 CHAPITRES


    00:00 Laure & Mirakl en quelques mots

    03:41 Le contexte autour du déploiement des Agents IA

    05:40 Les étapes & l’organisation du projet

    07:32 Les agents types qu’ils ont déployés

    11:51 La stack centrée sur Dust

    16:23 Les plus gros challenges de Laure dans le cadre de ce projet

    23:33 Les questions de la fin (recommandations, conseils…)


    🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


    #197 - Salesforce : Déployer des agents IA dans le Retail avec Agentforce

    #172 - Mirakl : Intégrer la GenAI dans le Produit

    #159 - Malt : Mettre en place un assistant IA pour booster l'efficacité en interne (Dust, Gemini…)


    👋 PLUS DE CONTENU DATA ?


    1/ Suivez-moi sur LinkedIn ici 🤳

    2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

    3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


    🎙 SOUTENEZ LE PODCAST GRATUITEMENT


    1/ Abonnez-vous 🔔

    2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    Afficher plus Afficher moins
    26 min
  • #208 - Alan : Déployer des algorithmes pour lutter contre la fraude
    Jun 9 2025
    Gabrielle Prat est dans l'équipe Data chez Alan, la licorne française qui a révolutionné la complémentaire et la mutuelle santé. Avec 500 millions d'euros de revenus annuels, c'est l'un des plus beaux succès de la startup nation. Aujourd’hui, elle revient sur la stratégie Data Science qu’ils ont mis en place pour lutter contre la fraude à l’assurance.On aborde :🔥 Qu’est-ce que la fraude à l’assurance et quel est l’enjeu pour Alan ?🔥 Les 4 étapes du projet : Data Mining, Rule-based, Machine Learning et UX🔥 Le déploiement d’agents IA pour augmenter l’équipe Ops🔥 La culture chez Alan (transparence radicale, peu de meetings, culture de l’écrit…)📅 VOUS AVEZ ENTENDU PARLER DE L'IA SUMMIT A LILLE LE 1ER JUILLET ?La Cité de l'IA Summit à Lille est le rendez-vous dédié à l’Intelligence Artificielle et à la Data. Il aura lieu le 1er juillet 2025 de 8h30 à 18h45 à Marcq-en-Baroeul (59). 📚 Découvrir l'événement🎙 Découvrir le programmeCeci n'est pas une collaboration commerciale. :)📚 RESSOURCES- Le LinkedIn de Gabrielle- L’article Why data-driven product decisions are hard de Andrew Chen- L'édition spéciale Les 40 chantiers Data & IA à lancer en 2025 de notre newsletter🎬 CHAPITRES00:00 Alan en quelques mots04:24 L’équipe Data chez Alan09:15 Les différents types de fraude13:06 Etape 1 : Data mining14:18 Etape 2 : Rule based17:25 Etape 3 : Machine learning18:48 Etape 4 : UX21:03 Mise en place d’agents IA25:44 La culture chez Alan29:45 Les questions de la fin (incl. ses ressources pref)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#170 - Leboncoin : De la Data Science au ML Engineering#166 - Defacto : Déployer des algorithmes pour scorer la solvabilité des entreprises#162 - Le Lead Data Science de Back Market partage leur stratégie GenAI💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
    Afficher plus Afficher moins
    32 min