Comment bien choisir une solution ETL pour un projet d'intégration ?

Comment bien choisir une solution ETL ?


L’exploitation des données est devenue un réel enjeu pour l’entreprise face au volume d’information produit et collecté chaque jour. Intégrer une solution ETL au sein de son organisation peut être un moyen pour répondre à ce défi. Ces outils permettent à l’entreprise de mieux gérer et exploiter ses données afin d’en tirer parti pour décider et agir. Votre système d’information se compose de données éparses ? Vos données ne communiquent pas entre elles ? Vous souhaitez utiliser un logiciel ETL pour mieux les traiter ? Axysweb vous donne quelques pistes pour bien choisir votre solution ETL.





Qu'est ce qu'un ETL ?


Définition et objectif d’un ETL

 

ETL signifie : Extract, Transform and Load. C’est un processus par lequel les données sont extraites, transformées puis chargées dans un emplacement cible : le data warehouse.

Les solutions ETL permettent d’assister les entreprises dans la manipulation, le traitement et l’exploitation de grandes quantités de données provenant de plusieurs sources.

L’objectif d’un ETL est de rendre des données hétérogènes compatibles entre elles, mais aussi avec la base de données de référence de l’organisation pour une meilleure analyse. Pour cela, l’ETL structure, nettoie, compile puis agrège les données extraites des différents composants du système de l’entreprise.

 

 

Fonctionnement d’une solution ETL

 

Dans une première phase, l’ETL extrait les données depuis différentes sources du SI de l’entreprise : base de données des applications métier, CRM, ERP, site web etc…

Ces données sont extraites dans leur format d’origine grâce à de multiples connecteurs. L’ETL va stocker toutes ces données sur un serveur virtuel avant le traitement.

L’ETL va ensuite transformer les données extraites afin de les rendre exploitables dans l’emplacement cible. Dans cette phase les données sont converties au bon format, nettoyées et enrichies.

Enfin les données qualifiées sont envoyées vers un entrepôt cible où elles seront exploitées par les différents services de l’entreprise.




Les critères de choix d'un ETL


De nombreuses solutions ETL sont aujourd’hui disponibles sur le marché. Chaque éditeur propose ses spécificités. Votre outil ETL doit correspondre précisément aux besoins et objectifs de l’entreprise.

Le choix d’une solution doit se faire en fonction de plusieurs critères à évaluer : la portée du projet ETL, la volumétrie des donnés, les ressources et compétences disponibles, le budget, le délai de réalisation etc…  Voici plusieurs indicateurs à regarder avant de choisir votre solution ETL.

 

 

Le type de solution ETL

 

Le type de solution peut être un critère qui vous influencera dans votre choix d’un ETL. Les éditeurs proposent des solutions on-premise, cloud, ou open source.

Les solutions ELT Cloud sont généralement proposées sous forme d’abonnement alors que les solutions propriétaires à installer sont davantage proposées sous forme de licence à l’utilisateur.

Un logiciel on premise sera directement installé sur les serveurs de l’entreprise et demande donc une certaine disponibilité et maintenance. Au contraire, un ETL cloud est géré par l’éditeur sur un serveur distant et ne nécessite donc aucune maintenance.

On retrouve également des solutions Open Source sur le marché des ETL. Ce type d’ETL est une alternative aux solutions propriétaires et représente bien souvent un coût moindre.

 

 

L’accessibilité de la solution ETL : les compétences et formation requise

 

Interrogez-vous également sur l’accessibilité en termes de compétences avant de choisir une solution ETL. La prise en main du logiciel nécessite-t-elle une formation ou une certification ? Quel est le niveau technique requis ?

Les équipes en charge du projet ETL au sein de l’entreprise ont-elles les compétences pour se servir de l’outil ? Allez-vous devoir faire appel à un prestataire spécialisé en externe ?

 

 

Les systèmes d’exploitation supportés

 

La liste des systèmes d’exploitation supportés est un indicateur à absolument vérifier lors du choix de votre solution ETL.

Le logiciel est-il accessible sur les systèmes que vous utilisez au quotidien comme Windows ou Linus ? Si vous travaillez sous Mac, la solution choisie est-elle adaptée ?

 

 

La connectivité de la solution

 

Une des fonctionnalités principales d’un ETL est d’extraire les données de sources hétérogènes. La capacité d’accès aux sources de données de l’outil est donc un critère de choix important.

Regardez bien la liste des connecteurs proposés. La solution propose-t-elle des connecteurs aux principales bases de données, plateformes cloud, CRM, ESB et API du marché ?

Vérifiez également que la solution ETL propose le développement de connecteurs sur-mesure.

 

 

Les outils de préparation et de qualification proposés

 

Les fonctionnalités de transformation sont également des indicateurs à regarder sur une solution ETL. L’outil doit vous permettre de préparer et qualifier vos données avant le chargement vers le data warehouse.

Vérifiez que la solution intègre bien des fonctionnalités de nettoyage, d’enrichissement et de standardisation des données.

 

 

L’ouverture aux langages de programmation

 

La solution ETL est elle ouverte aux langages de programmation que votre équipe maîtrise ? Si l’outil nécessite du codage manuel, est-ce dans un langage avec lequel votre entreprise à l’habitude de travailler ?

 

Les outils graphiques

 

Plusieurs solutions tirent leur force de leurs outils graphiques qui facilitent la création des processus ETL. Avant de choisir un outil, pensez à le tester pour découvrir son interface et ses outils graphiques.

 

La dimension collaborative

 

La dimension collaborative d’une solution ETL est un critère important. L’outil permet-il de travailler en équipe sur un projet ? Si oui, dans quelles conditions ? Interrogez-vous également sur la manière dont sont gérés les utilisateurs et leurs droits.

 

 

Le support et la maintenance

 

Le choix d’une solution de business intelligence est toujours influencé par le support utilisateur et la maintenance proposé par l’éditeur. Votre licence vous donne-t-elle accès à un support technique ? Quels sont la rapidité et le niveau de réponse de ce support ? La maintenance de la solution ETL est-t-elle comprise dans le coût ?

 

 

Le coût

 

Le coût de la solution va dépendre du type d’ETL pour lequel vous optez. Pour de très nombreuses entreprises le coût est un critère de choix majeur dans le choix d’une nouvelle solution.

Si c’est une solution open source proposée en version gratuite, calculez bien les coûts cachés liés au déploiement, aux formations ou aux certifications nécessaires.




Zoom sur l'ETL de Talend


Talend est un éditeur de solutions dédiées à la gestion des données d’entreprises depuis 2005. La solution ETL de Talend est Talend Open Studio for Data Integration, aussi connu sous l’abréviation TOS. Cet outil est proposé dans une licence open source gratuite et dans une version enterprise payante au nombre d’utilisateurs.

La solution ETL de Talend est une solution très complète pour réaliser des projet ETL en un temps record. Elle propose une grande variété de connecteurs avec les principaux systèmes de gestion de base de données, logiciels CRM et suites marketing du marché.

Talend Open Studio for Data Integration est assez simple à implémenter grâce à son interface graphique ne nécessitant pas de code. Cette solution permet aux utilisateurs de créer des flux de données de manière intuitive en glissé/déposé. L’ETL génère ensuite automatiquement un code en langage Java.

La solution ETL de Talend est ouverte et souple, elle permet aux entreprises de développer leurs propres fonctionnalités afin de répondre au mieux à leurs besoins.

Enfin, Talend met à disposition une documentation très complète et une communauté particulièrement active et engagée.  



Un projet d'intégration ETL ? 

 

Vous cherchez un prestataire spécialisé dans l'intégration de solutions ETL ?
Notre équipe d'experts intégrateurs accompagne les entreprises dans leurs projets de gestion de données.
Nous sommes formés et certifiés sur l'ETL Talend Data Integration.