Synchronisation des données : fonctionnement et points de défaillance

Points clés

La synchronisation des données maintient la cohérence et la précision des données d'entreprise sur tous les systèmes connectés, en temps réel ou selon un calendrier défini.
Les principaux points de défaillance sont la résolution de conflits, la latence et les incompatibilités de schémas entre systèmes.
La synchronisation bidirectionnelle en temps réel est beaucoup plus difficile à implémenter correctement que ne le suggèrent la plupart des éditeurs.
L'architecture appropriée dépend du volume de données, de la fréquence des mises à jour et du nombre de systèmes connectés.

La plupart des entreprises font fonctionner en parallèle au moins une poignée de systèmes : un ERP, un CRM, une plateforme e-commerce, un PIM, un portail fournisseur. Chacun stocke des données. Certaines de ces données se chevauchent. Et dès que le même enregistrement existe à deux endroits, vous avez un problème de synchronisation.

La synchronisation des données est le processus qui maintient la cohérence et la précision de ces enregistrements entre les systèmes. Un prix de produit mis à jour dans l'ERP devrait apparaître dans la boutique en ligne. Un changement d'adresse client dans le CRM devrait se refléter dans le système de facturation. Quand la sync fonctionne, les utilisateurs de chaque système voient la même réalité. Quand ce n'est pas le cas, vous avez des erreurs de commandes, des lacunes de conformité et des décisions prises sur la base de données obsolètes. Selon Gartner, le coût annuel moyen de la mauvaise qualité des données est de 12,9 millions de dollars par organisation (source : integrate.io). L'incohérence des données entre systèmes non synchronisés est l'un des facteurs principaux de ce chiffre.

Ce que la synchronisation fait réellement

Au cœur de son fonctionnement, la synchronisation des données détecte un changement dans un système et le propage à un ou plusieurs autres. Les mécanismes varient, mais l'objectif reste toujours le même : chaque système connecté conserve la même version d'un enregistrement, maintenant ainsi l'intégrité des données sur l'ensemble du flux de données.

Deux dimensions définissent tout dispositif de sync. La première est la direction. La synchronisation unidirectionnelle pousse les changements d'une source vers une cible. La source fait autorité ; la cible reçoit uniquement. La synchronisation bidirectionnelle permet aux changements de circuler dans les deux sens, ce qui signifie que n'importe quel système peut mettre à jour un enregistrement, et l'autre doit le refléter. La sync bidirectionnelle est beaucoup plus complexe car les changements peuvent se produire simultanément dans les deux systèmes, créant des conflits qui nécessitent une détection et une résolution actives.

La deuxième dimension est le calendrier. La synchronisation planifiée (aussi appelée sync par lots) s'exécute à intervalles fixes : toutes les heures, chaque nuit ou chaque semaine. Elle est plus simple à implémenter et met moins de charge sur les systèmes, mais les données ne sont fraîches que depuis la dernière exécution. La synchronisation continue, ou synchronisation en temps réel, propage les changements dès qu'ils se produisent, généralement en quelques secondes. La sync quasi temps réel se situe entre les deux : les changements sont mis en buffer brièvement avant la propagation, réduisant la charge d'infrastructure tout en maintenant la cohérence des données et en conservant les échanges de données fréquents. La plupart des flux de travail opérationnels exigent soit une synchronisation continue, soit une synchronisation quasi temps réel, mais les deux exigent davantage de l'infrastructure que le traitement par lots.

La synchronisation bidirectionnelle en temps réel entre deux ou plusieurs systèmes d'entreprise est techniquement réalisable. Le défi ne réside pas dans la sync elle-même, mais dans la logique de résolution de conflits qui s'exécute en arrière-plan.

Comment la sync est déclenchée

La méthode utilisée pour détecter et transmettre les changements compte autant que la direction ou le calendrier.

Capture de données modifiées (CDC)

La CDC surveille le journal des transactions d'une base de données et capture chaque insertion, mise à jour et suppression dès qu'elle se produit. Seuls les enregistrements modifiés sont transmis dans ce qui est effectivement une synchronisation incrémentale : pas de transferts de datasets complets, pas de réplication de données redondante des enregistrements qui n'ont pas changé. C'est courant dans les environnements à haut volume où l'interrogation créerait trop de surcharge, et c'est l'approche la plus proche d'une synchronisation vraiment continue au niveau de la base de données.

Interrogation et requêtes planifiées

Les requêtes s'exécutent contre le système source à intervalles réguliers et comparent les résultats à un snapshot précédent. Plus simple à mettre en place que la CDC, mais cela introduit un délai égal à l'intervalle d'interrogation. Tout changement qui se produit et est ensuite annulé entre deux interrogations est invisible pour le système cible. Pour la plupart des données d'entreprise, cela signifie qu'une synchronisation périodique convient aux enregistrements qui changent lentement, mais pose problème pour les données opérationnelles.

Synchronisation basée sur les événements

Le système source émet un événement (un webhook, une entrée de file d'attente de messages, un appel API) quand un enregistrement change. La cible écoute et traite l'événement. Cette approche a une faible latence et évite les transferts de datasets complets, mais exige que les deux systèmes supportent le même modèle d'événements.

Synchronisation basée sur les API

Les API REST ou autres poussent et tirent les données entre systèmes à la demande. Flexible et largement supportée, mais les connexions API point à point se multiplient rapidement à mesure que le nombre de systèmes connectés augmente. Un environnement à cinq systèmes avec des liens API directs entre chaque paire nécessite dix intégrations distinctes à maintenir. Les plateformes iPaaS et les architectures hub-and-spoke existent spécifiquement pour résoudre ce problème d'évolutivité.

Quand la synchronisation échoue

La plupart des défaillances de synchronisation des données se répartissent en un petit nombre de catégories.

Défaillances de résolution de conflits.
En sync bidirectionnelle, le même enregistrement peut être mis à jour dans les deux systèmes avant que l'un ou l'autre changement se soit propagé. L'horodatage le plus récent est le brise-glace évident, mais les horloges sur les systèmes distribués ne sont pas toujours fiables. Sans une politique claire de détection et de résolution de conflits (dernier écrit gagne, hiérarchie de source de vérité ou file d'attente d'examen manuel), les conflits écrasent silencieusement les données valides ou bloquent complètement la sync.

Incompatibilités de formats de données.
Le système A stocke le nom complet d'un client dans un seul champ. Le système B le divise en prénom et nom de famille. Le système C ajoute un champ de salutation obligatoire que le système A n'a pas. Chaque différence structurelle nécessite une transformation de données et une règle de mappage. Quand ces règles sont manquantes ou obsolètes après une mise à niveau du système, les enregistrements ne se transfèrent pas ou arrivent malformés, compromettant la précision et l'intégrité des données sur tout le pipeline.

Problèmes de latence et d'ordre.
Dans les systèmes basés sur les événements ou en temps réel, les événements n'arrivent pas toujours dans l'ordre où ils ont été créés. Un événement de mise à jour peut arriver avant l'événement de création original. Une suppression peut arriver avant que la mise à jour associée soit traitée. Les systèmes qui ne gèrent pas les événements hors d'ordre produisent des états corrompus et une perte de données.

Défaillances partielles de sync.
Un travail de sync traitant 10 000 enregistrements peut échouer à l'enregistrement 7 000. Sans mécanisme de point de contrôle, certains systèmes contiennent des données mises à jour tandis que d'autres ne les ont pas. Cela crée une incohérence des données qui peut être difficile à détecter et encore plus difficile à réparer, surtout quand les systèmes en aval ont déjà agi sur les données incomplètes.

Mises à jour en cascade.
En sync bidirectionnelle, un changement dans le système A déclenche une mise à jour dans le système B, qui déclenche une autre sync vers le système A. Sans détection de boucle, cela provoque des cycles de mise à jour infinis qui inondent les systèmes d'écritures redondantes, un mode de défaillance auquel les architectures point à point sont particulièrement sujettes.

Dans les projets que nous avons implémentés (connectant SAP ou Oracle NetSuite à Shopify ou des portails fournisseurs, par exemple), les incompatibilités de formats de données et la logique de résolution de conflits manquante représentent la grande majorité des problèmes de synchronisation des données. La configuration initiale semble fonctionner. Les défaillances apparaissent des semaines plus tard, quand les cas limites frappent la production.

Ce qu'une architecture fiable de synchronisation des données doit avoir

L'architecture elle-même doit gérer les cas difficiles, y compris les cas limites qui n'apparaissent jamais dans les démonstrations.

Une seule source de vérité (ou au minimum une source de vérité clairement définie par entité de données) élimine la plupart des ambiguïtés de conflits. Si l'ERP fait autorité pour la tarification et le PIM pour les descriptions de produits, la résolution de conflits découle de la hiérarchie : le système autorisé gagne pour son domaine. La plupart des équipes sautent cette étape et construisent d'abord la sync, puis essaient de définir la propriété des données plus tard. C'est à ce moment que les enregistrements en double et les conflits de données silencieux commencent à s'accumuler.

La validation et la transformation des données au point de sync empêchent les enregistrements malformés d'atteindre les systèmes cibles. Les contrôles des champs obligatoires, des plages de valeurs, des contraintes de format de données et de l'intégrité référentielle doivent s'exécuter avant qu'un enregistrement ne soit écrit, pas après. C'est là que la gouvernance des données s'applique en pratique : déduplication, vérifications de complétude et règles métier qui s'appliquent uniformément sur tous les systèmes connectés. Sans cette couche, la gestion de la qualité des données devient une tâche de nettoyage réactive plutôt qu'une garantie structurelle.

Les journaux de réplication et les pistes d'audit au niveau des champs rendent le débogage possible. Quand une valeur arrive mal, vous devez tracer quel système l'a envoyée, quand et quelle était la valeur précédente. Sans journaux, l'analyse des causes racines devient de la devinette.

La logique de nouvelle tentative et de gestion des erreurs garantit qu'un événement de sync en échec ne disparaît pas silencieusement. Les événements doivent être mis en queue, faire des nouvelles tentatives avec backoff et être signalés pour examen manuel quand les nouvelles tentatives sont épuisées.

La plateforme d'intégration AtroCore gère la synchronisation des données entre les systèmes ERP, e-commerce, CRM et fournisseur en tant que hub central de gestion des données maitresses. Plutôt que de construire des connecteurs point à point entre chaque paire de systèmes, chaque système échange des données avec une seule plateforme dans un modèle hub-and-spoke. Cette architecture réduit directement le risque de mises à jour en cascade et simplifie la détection de conflits : moins de chemins directs système à système signifie moins de boucles de rétroaction. La transformation et la validation des données intégrées résolvent les incompatibilités de formats au point de sync, avant que les enregistrements n'atteignent tout système cible. Le mappage de données configurable, la déduplication et l'enregistrement d'audit au niveau des champs couvrent les exigences restantes de gouvernance des données.

Lots ou temps réel : choisir en fonction de l'impact

La synchronisation en temps réel est nécessaire pour les données opérationnelles : niveaux de stock, statut de commande et tarification. Mais la sync continue exerce une charge soutenue sur les systèmes et nécessite une gestion d'erreurs solide pour chaque cas limite. La sync planifiée est plus facile à exploiter et à récupérer, et elle est souvent suffisante pour les données qui changent peu fréquemment : enregistrements fournisseurs, spécifications de produits, hiérarchies organisationnelles.

De nombreuses architectures utilisent les deux. Synchronisation en temps réel ou quasi temps réel pour les enregistrements opérationnellement critiques à haute fréquence. Lots pour les mises à jour en masse, les chargements historiques et les flux de gestion des données maitresses qui ne pilotent pas les transactions en direct.

La question pratique est la rapidité avec laquelle une valeur obsolète cause un vrai problème. Pour le stock partagé entre une boutique en ligne et un système d'entrepôt, chaque minute compte. Pour les modalités de paiement d'un fournisseur, probablement pas. Concevoir le processus de synchronisation des données autour de cette question, plutôt que de défaut vers une sync continue pour tout, tend à produire des architectures qui sont plus faciles à exploiter et à récupérer quand quelque chose tourne mal.

Les défaillances de synchronisation des données ne sont rarement causées par le protocole ou l'outil. Elles viennent d'une propriété des données mal spécifiée, d'une validation manquante et d'une logique de sync qui n'a jamais été testée contre des cas limites. L'ingénierie se situe dans cette couche, non dans le choix du format API.