Comment réussir l'étape cruciale de la reprise des données ?

Comment réussir l’étape cruciale de la reprise des données ?

Temps de lecture : 4 minutes

Qu'est ce qu'une reprise de données ?

Les entreprises peuvent être amenées à faire des changements dans leur système informatique pur diverses raisons. Modification du SGBD, changement de progiciel, passage au cloud etc... Ces évolutions mettent en péril la fiabilité et l’intégrité des ressources présentes dans les database. Les informations existantes doivent être transférées vers un nouveau système sans être endommagées durant le process. Réaliser une stratégie de data migration efficace passe par l'étape de la reprise des données. Comment fonctionne une reprise de données ? Et quels sont ses enjeux ?  





Qu’est-ce qu’une reprise de données ?


La reprise des données est une étape cruciale du processus de migration des données. Cependant, toutes les migrations n’incluent pas cette étape.

L’organisation déploie une reprise des données lorsqu'elle souhaite conserver des ressources existantes. La reprise des données consiste donc à récupérer des informations existantes dans un système avant de les transférer vers un nouvel emplacement cible.

 

Une entreprise envisage une reprise de données lorsque son environnement informatique évolue. Bien souvent, ce processus a lieu lors de modifications importantes au sein d'u SI comme une refonte globale ou le déploiement d'un MDM ou d'un ESB. L’acquisition de nouveaux outils tels qu'un CRM ou un ERP peut être également à l’origine d’une reprise. Ces évolutions sont nécessaires dans certains cas : logiciel trop vieillissant, fusion des applications, mise en conformité des bases de données client avec le RGPD etc...  

 

La sauvegarde des fichiers détenus par l’entreprise est essentielle. L’objectif de la reprise est de sauvegarder les données et les travaux précédents pour les intégrer dans le nouvel environnement. En fonction des besoins, il est possible d’effectuer une reprise avec du code ou par le biais d’un outil ETL. 

Il est important de voir la reprise comme un projet de migration à part entière. Une stratégie solide doit être mise en place pour mener à bien la sauvegarde et le déplacement. La société peut s’occuper du plan de migration en interne ou en faisant appel à un prestataire externe.  



Comment préparer une reprise de données ?


On considère souvent (à tort) la récupération de données comme une manœuvre simple à effectuer. Pourtant, le cahier des charges pour un projet de telle envergure est assez lourd tant les possibilités d’erreurs sont élevées. Une méthodologie cadrée et une bonne anticipation sont les clés du bon déroulement de ce type de projet. Pour une reprise de données réussie, le prestataire et les équipes métiers doivent travailler en étroite collaboration tout au long du projet. 

 

Etude des données 

 

Avant de commencer, l’entreprise doit mener une étude préalable des tables de son système. Quelles sont les informations utiles ? Quelles sont les données obsolètes ou endommagées ? Faire un premier tri est un gain de temps pour les prochaines étapes. La sélection permet d’établir un périmètre de champ d’action. Seules les valeurs exploitables sont retenues pour le transfert. 

 

 

Cadrage du projet 

 

L’entreprise doit ensuite estimer son volume de données à nettoyer, qualifier et transférer. Faire l’inventaire des tables permet de repérer les valeurs endommagées et de supprimer les doublons. La société pourra donc mesurer l’ampleur du travail du travail à effectuer par les collaborateurs. C’est à partir de cette étape que le prestataire pourra élaborer une stratégie pour le client. 

 

 

Mise en place d’une stratégie 

 

Le prestataire doit proposer un plan stratégique pour la reprise des données. Rédigé sous forme de cahier des charges, il explicite de manière précise les différentes étapes de la migration. Le plan doit également faire part du choix technique concernant la méthode de migration : par le code ou un logiciel. Ce document permet au prestataire et aux équipes de collaborer.  


Data preparation 

 

Les informations ne peuvent pas être transférées telles qu’elles vers un nouvel entrepôt. Les enregistrements des tables doivent être nettoyés, complétés et qualifiés. Une nouvelle estimation de la volumétrie doit être effectuée. Il faut ensuite unifier les données en les convertissant dans un format compatible avec le champ cible dans lequel elles seront transférées.  

 

 

Chargement et tests  

 

Avant de se lancer dans un transfert définitif, il est nécessaire d’effectuer plusieurs tests en conditions réelles. Pour cela, un échantillon représentatif de valeurs existantes est chargé sur un datawarehouse neutre. Le but est de rifier si les données sont transférées correctement dans les bonnes catégories. Si les tests sont concluants, les informations peuvent être basculées vers le système cible. 

 

 

Basculement vers l’entrepôt 

 

Avant de passer à l’intégration, il est préférable de faire une sauvegarde de données afin de palier à tout problème lors du chargement. L’idéal est d’opter pour une sauvegarde dans un cloud. Quand les résultats des tests sont satisfaisants, on procède au basculement des données vers le nouvel entrepôt. A ce stade, le projet est presque terminé. Les collaborateurs doivent porter une réflexion sur la gestion des erreurs dans le nouveau système.  



Quels sont les enjeux ?


Comme nous l’avons vu plus haut, un projet de reprise des données n’est pas anodin. Il implique des changements majeurs dans le système de l'entreprise, l'obligeant à mettre en place un protocole de récupération et d’intégration d’informations 

 

La reprise a pour but premier de conserver les données collectées précédemment et de les transférer dans un nouveau système. Cette récupération évite la re-saisie manuelle des ressources qui peut occasionner des erreurs et de pertes. De plus, réintroduire manuellement les informations dans le nouveau système est une perte de temps considérable pour les équipes.


Téléchargez votre guide pour préparer votre projet de migration de données


En effectuant une reprise de données, les valeurs existantes sont triées. Elles sont prêtes à l’emploi grâce aux étapes de préparation et de tests avant leur transfert définitif. Les collaborateurs n’ont pas à trier entre les informations qui sont exploitables ou obsolètes.

Une récupération efficace permet aux équipes métiers de retrouver rapidement les informations sources dès la première utilisation du nouveau système 

 

Un projet de reprise de données peut être mis en place par le biais d’un outil ETL. Talend Data Integration est une solution ETL open source. Son environnement graphique permet de gérer une reprise sans avoir recours au code. 


Vous avez une reprise de données à mettre en oeuvre ?  

 

Axysweb accompagne les PME et ETI dans leurs projets de migration de données.
Nous assurons le conseil, la conception et le suivi de votre projet.
Nos experts sont certifiés sur les solutions Talend pour mener à bien votre reprise de données.

Prenons contact lors d'un échange téléphonique de 30 minutes !
Nous souhaitons comprendre votre environnement pour vous apporter la solution la plus adaptée.