icon loading
Le Data Management – Une introduction

Le Data Management – Une introduction

L’objectif de cette série d’articles est d’avoir une vision claire des avantages, besoins et challenges liés au développement d’une stratégie de « Gestion des Données ».

Les projets de « Gestion des Données » sont de nature transversal et mettent en relation les différents entités de l’entreprise. L’un des principaux défis est de rendre toutes les informations commerciales disponibles.

Il faut noter que les méthodologies de gestion des données s’intéressent à ce qui doit être fait et non sur la façon de le faire. Ainsi, les managers de la gestion des données sont responsables de la gestion des changements, et non de leurs mise en oeuvre.

Néanmoins, ils auront un rôle crucial dans ce type de projets, notamment dans la gouvernance des données. Ils doivent être des leaders qui conduisent et favorisent le parcours de digitalisation.

À la fin de ces séries d’articles, vous serez en mesure de comprendre les principaux concepts liés à la gestion des données, à savoir :

  • La gouvernance
  • L’architecture
  • La qualité
  • La sécurité
  • La modélisation
  • Les données de référence

 

Pour chaque concept, nous explorerons les perspectives de base du point de vue des :

  • Personnes impliquées (L’entreprise)
  • Processus (Les activités)
  • Technologies (le minimum à avoir pour développer chaque étape)

 

Dans ce premier article, nous allons traiter les concepts fondamentales et la raison derrière le développement d’une stratégie de gestion des données, comme élément clé du parcours de digitalisation au sein d’une entreprise.

Pourquoi la gestion des données ?

 

Au cours des dernières années, nous avons constaté une croissance importante du volume de données dans les organisations. Les données sont devenues la base de la compétitivité, de la productivité, de la croissance et de l’innovation dans de nombreuses entreprises. Facebook, Amazon, Spotify et Netflix sont quelques exemples qui ont complètement bouleversé le monde de l’industrie grâce à leur stratégie de gestion des données.

L’explosion des données au niveau des systèmes opérationnels des entreprises et l’apparition d’internet, des réseaux sociaux et du multimédia ont permis aujourd’hui de mieux connaitre le client, ses préférences et ses exigences.

Aujourd’hui, la gestion des données est devenue une priorité au sein de l’entreprise car elle permet de  répondre aux objectifs stratégiques de cette dernière. En effet, il devient plus que jamais nécessaire de disposer de données de qualité pour prendre les meilleures décisions. La donnée en elle-même est considérée comme un actif pour les entreprises.

La gestion des données définit les politiques, les processus, les rôles et les responsabilités de chacun au sein de l’entreprise. Un modèle de gouvernance des données efficace demande une structure bien complète qui facilite la collaboration entre les différents départements de l’entreprise. Ainsi, la gouvernance des données a un impact grandiose sur la génération d’une vision holistique de l’information d’entreprise.

De plus, il est important de comprendre les facteurs clés à prendre en considération lors de la définition d’une gouvernance des données efficace, et de connaître les aspects technologiques et méthodologiques pour mettre en œuvre les techniques de gouvernance des données.

In fine, l’objectif de la gestion des données est d’augmenter la valeur des données d’une organisation grâce à la gouvernance des données.

Les nouveaux domaines de connaissances ?

 

Au cours des dernières années, nous avons connu l’émergence des technologies liées à la science des données ( Data Science ). On peut citer :

Ingénierie des données :

 

L’ingénierie des données s’intéresse à la construction d’infrastructures appropriées qui permet de faciliter la circulation des données au sein des entreprises, et qui prépare ces données pour qu’elles soient dans un format utile.

Analyse des données :

 

Data Analytics ou ce qu’on appelle l’analyse des données est une branche de la science des données qui aide dans l’analyse descriptive des données, et qui se focalise sur la recherche des informations utiles à partir de ces données. Elle implique également l’aspect de la Data Visualization (un domaine entièrement distinct).

Machine Learning :

 

Machine Learning est la capacité des ordinateurs à apprendre par eux-mêmes à partir des données. Pour ce faire, ils apprennent les corrélations entre certaines caractéristiques des données conduisant à certains résultats, de sorte que lorsque les ordinateurs sont devant de nouvelles données, ils peuvent faire des prévisions précises.

Deep Learning :

 

Deep Learning est une branche du Machine Learning qui consiste à reproduire les mécanismes d’apprentissage que les êtres intelligents utilisent pour apprendre. Ceci se fait en décomposant les concepts complexes en concepts plus simples.

Tous ces domaines liées à la science des données ont changé les règles du jeu grâce aux nouvelles technologies et à la capacité de traitement des données en temps réel. Nous disposons de plus de données provenant de plusieurs de sources en moins de temps. De plus, la démocratisation de la puissance de calcul permet de suivre le rythme du traitement des données, grâce à des technologies comme Amazon Web Services, Google Cloud Platform, Azure…

Le développement des infrastructures n’est plus une mission impossible, le nouveau challenge aujourd’hui consiste à donner de la valeur aux données.

On peut extraire les données à partir des réseaux sociaux, des appareils mobiles… Ainsi, pour que les informations traitées soient en notre faveur, nous devrons développer des techniques d’analyse et de gestion des données qui offrent une vision à 360º des informations de l’entreprise. Cela se fera en optant pour une initiative de gouvernance des données dans l’entreprise.

Qui dirigera cette initiative de gouvernance des données ?

 

 Une enquête Gartner a défini un nouveau statut dans les entreprises, le CDO ou Chief Data Officer.

Le CDO est chargé de valoriser les données pour aider dans le processus de prise de décisions. Il sera responsable de la gouvernance des données et préparera l’organisation à la transformation digitale qui nécessitera l’intégration des données, auparavant séparées.

Les missions du CDO consistent à :

  • Définir la politique de gouvernance des données.
  • Préparer et impliquer l’entreprise pour développer la culture de la Data.

 

Le CDO aide à la prise de décision en garantissant d’abord que les données représentent une source d’informations de qualité, ensuite, en mettant en œuvre toutes les décisions pour rendre les informations crédibles.

Dans les années qui suivent, les entreprises qui n’appliquent pas les techniques de la gouvernance des données seront rares, et certainement, elles perdront  énormément par rapport à celles qui les appliquent.

Qu’est-ce qu’on entend par la gestion des données ?

 

 Il s’agit de définir des méthodes efficaces pour que l’information soit disponibles à tout moment, où nous en avons besoin et avec les caractéristiques qu’on souhaite.

La gouvernance des données est une responsabilité conjointe de la direction et de l’informatique. Elle demande une amélioration et un développement en continu, et pour l’adopter, on fait recours à des Frameworks spécifiques.

La gestion des données implique la gestion efficace de l’ensemble du cycle de vie des données. Nous parlons du stockage, de la transformation, des mouvements entre les différents systèmes et de l’utilisation des données. De même, définir un modèle de gouvernance des données est primordial pour les entreprises désirant répondre aux attentes des clients et des gouvernements.

Il s’agit d’un processus itératif qui nécessite de vérifier en permanence la qualité des données.

Le framework DAMA

 

Le framework DAMA est une structure internationale qui chapeaute la structure de la gestion des données. C’est une collection qui rassemble les bonnes pratiques de la gestion des données. L’illustration ci-dessous représente les 11 fonctions qui permettent d’assurer le succès de la gestion des données :

Source: DAMA International

  • Architecture des données
  • Modélisation et conception des données
  • Stockage et exploitation des données
  • Sécurité des données
  • Intégration et interopérabilité des données
  • Gestion de documents et de contenus
  • Données maîtres et de référence
  • Entreposage de données et BI
  • Métadonnées
  • Qualité des données

 

L’illustration suivante représente une approche agile, plus pratique. 

 

Quelles sont les technologies utilisées dans la stratégie de gestion des données ?

 

 Le choix des technologies dans une démarche de gestion des données dépend en fait des besoins spécifiques et de l’infrastructure de chaque entreprise. Néanmoins, certaines des technologies les plus populaires et les plus utilisées sont :

  • Bases de données : Oracle Database 12c et PostgreSQL
  • Modélisation : Data Modeler avec SQL Developer, Power AMC
  • Qualité des données : Talend Preparation et Trifacta Wrangler
  • Intégration de données : Oracle Data Integrator et Talend Data integration

 

Dans les prochains articles, nous allons dans un premier temps traiter chacun de ces domaines, puis dans un deuxième temps, nous allons découvrir les principaux acteurs et les meilleures technologies à adopter au niveau de chaque étape du parcours de gestion des données.

ARTICLES SIMILAIRES

Pourquoi l’Agile est-il si important dans la gestion de…

La Gouvernance des Données : une Nécessité pour les…

Transformation numérique : le guide du DSI