Rappel de définitions de l'informatique décisionnelle et du Big Data
Le point commun de l’informatique décisionnelle et du Big Data est la donnée. La donnée est également l’élément qui les différencie lorsque l’on la décline sous différents aspects (volume, variété…). Et c’est enfin l’élément qui peut les rapprocher lorsque l’on exploite le potentiel d’analyse de la donnée aussi bien dans un projet d’informatique décisionnelle que de Big Data.
Définition de l'informatique décisionnelle
L’informatique décisionnelle ou Business Intelligence est l’ensemble des applications, outils et pratiques permettant l’analyse d’une information afin d’améliorer les décisions prises par l’entreprise en vue d’une performance accrue. L’informatique décisionnelle est apparue grâce à la prolifération des logiciels de production, de relation client ou encore de logistique apportant une masse de données utiles à l’entreprise à condition de savoir l’analyser. Le rôle de l’informatique décisionnelle est donc : analyser, décrypter et rendre lisible une information disponible mais cachée. Il s’agit d’un enjeu considérable pour les entreprises et plus particulièrement pour la DSI qui voient leur marché de plus en plus concurrentiel.
Définition du Big Data
Le Big Data est lui aussi issu de la massification des données existantes. En effet, on compte aujourd’hui en pétaoctets les données disponibles. Le volume de données ne cesse d’augmenter car les natures de données se multiplient : logs, réseaux sociaux, internet des objets, audio, vidéo, mails.. etc. Ainsi, le Big Data peut se définir comme le stockage et le traitement des données disponibles pour en faire ressortir tout d’abord des analyses descriptives, c’est-à-dire comprendre le pourquoi des évènements. Puis, il permet également des analyses prédictives qui vont donner les moyens d’agir pour favoriser ou éviter un évènement. Et enfin, il offre des analyses prescriptives qui permettent de savoir comment atteindre un objectif. En résumé, le Big Data est la capacité de la machine à absorber et analyser des données en constante explosion.
Association entre Business Intelligence et Big Data
A la lecture de ces deux définitions, on pourrait être amené à les associer ou à les confondre puisque, nous le verrons par la suite, les entreprises tirent avantages du Big Data pour leur développement et incluent entre autres, le BiG Data dans leur processus de Business Intelligence mais pas seulement. En réalité, le Big Data et la Business Intelligence sont différents tant sur la manière de procéder que sur le type de données qu’ils traitent.
Vous souhaitez intégrer de la donnée externe à votre projet de BI - Parlons-en
Les principales différences entre le Big Data et l'informatique décisionnelle
Les environnements de départ dans lesquels évoluent naturellement l’un et l’autre sont à l’origine de leurs différences. En effet, l’informatique décisionnelle évolue dans un cadre « entreprises » et s’appuie sur des logiciels dont les bases de données sont dites relationnelles. Quant au Big Data, son environnement est global et traite des données non structurées et ne possède pas de schéma de structuration. C’est le point de départ des différences qui en découlent.
Le processus d'analyse
Dans un projet de Business Intelligence, on recherche des réponses à des questions connues : quel est le mix produit le plus vendu ? Quel est mon secteur de vente le plus rentable ? etc…Le cadre de l’analyse est préparé, les données sont préstructurées, les requêtes sont définies et les résultats sont pensés à l’avance. Dans un contexte de Big Data, c’est le schéma inverse. On ne connait pas les résultats de l’analyse des données. Ainsi, on va davantage faire ressortir des questions que des réponses. C’est un système évolutif sur le traitement des données qui aboutit à une série d’interrogations sur un marché par exemple.
Le type et sources de données différents
On l’a dit précédemment, le type de données est différent en informatique décisionnelle et en Big Data. Du côté Business Intelligence, on travaille sur des données structurées. Les bases de données sont dites relationnelles afin de créer des cubes de données appelés OLAP. Du côté Big Data, les données sont brutes, elles sont non structurées et textuelles (mail, word, powerpoint) ou non structurées et non textuelles (jpeg, flash, mp3…). Les bases de données sont non relationnelles et la technologie No-SQL offre une réponse adaptée à cette problématique d’hétérogénéité.
La sources de données est également différente. Dans un projet de BI, les données sont opérationnelles et proviennent de logiciels internes. Ce sont des données saisies ou issues des machines de production. Elles sont ensuite transformées et injectées par un ETL dans un datawarehouse pour être ensuite analysées. Dans un projet de Big Data, les données sont externes principalement et opérationnelles. Le défi du traitement des données est plus important.
Le volume de données est différent
Le volume de données traitées est un axe différenciant majeur entre l’informatique décisionnelle et le Big Data. Ce dernier en fait d’ailleurs sa marque de fabrique. Les architectures de stockage et de lecture des données ne sont pas les mêmes. Le traitement nécessite des applications dites distribuées et scalables comme Hadoop par exemple. L’architecture est conçue spécifiquement pour ce type de traitement de données.
Vélocité des données
C’est une limite importante pour une entreprise qui souhaite exploiter le Big Data. Il s’agit de la vitesse avec laquelle les données sont générées, capturées et partagées. En effet, il existe un fort décalage entre le temps de traitement et d’analyse de la données avec le temps de génération des données. Le temps de réponse d’une requête faite sur ces données générées est encore trop long pour une entreprise qui dispose des outils de Business Intelligence.
Intégrer du Big Data dans la Business Intelligence : opportunités et risques
L’informatique décisionnelle fonctionne en circuite fermé pour la majorité des projets d’entreprises. Or, prendre des décisions sans ternir compte de son marché peut vous amener dans la mauvaise direction. Fort de constat, les logiciels de BI s’ouvrent à la donnée externe, vous pouvez charger des données venant de sites institutionnels par exemple. Dans ce cas de figure, la donnée externe chargée est structurée et peu volumineuse souvent. Ainsi, nous ne sommes pas dans un cas d’intégration de Big Data offrant des analyses prédictives, systèmes Hadoop ou data mining.
Analyses prédictives et business intelligence
Les analyses prédictives sont le résultat de l’utilisation du Big Data et de l’informatique décisionnelle. En effet, grâce au Big Data, la quantité de donnée collectée est plus importante et comporte des éléments externes à l’entreprise. Prenons un cas concret d’analyse comportementale des clients face à une volatilité du prix. On peut faire cette analyse à partir de ces données internes venant du CRM. L’analyse serait très certainement peu probante du fait du peu d’informations. En incluant le comportement de milliers de clients des entreprises concurrentes de l’ensemble du marché, vous obtenez une analyse prédictive plus probante. Il s’agit naturellement de probabilité et d’extrapolation.
Système Hadoop et Business Intelligence
Nous avons évoqué la limite des outils de Business Intelligence a traité des volumes de données importantes et hétérogènes. Hadoop est une solution Open Source permettant le stockage de données volumineuses et hétérogènes, c’est-à-dire conservées dans leur format original. L’enjeu est de pouvoir convertir ses données en tableaux d’analyse. Certains outils de BI peuvent examiner, transformer et analyser ces données dans Hadoop et en faire de la data visualisation. On combine alors l’analyse de volumes de données important et non triées et cela en temps réel.
Valeur et retour sur investissement
Un risque de taille est le ROI d’un projet Big Data adapter à la Business Intelligence. En effet, La différence de coût est importante entre un projet de Business Intelligence et de Big Data. Le retour sur investissement ou ROI d’un projet de Big Data n’est pas suffisamment intéressant pour une entreprise de taille moyenne. Cela tend à s’estomper du fait de la démocratisation de certains outils de Big Data mais ça reste un risque à maîtriser.
Véracité des données
Un autre risque et pas des moindre du Big Data associé à la Business Intelligence est la véracité des données. Il est certain que l’entreprise ne peut prendre des décisions appuyées sur des données pas assez fiables. Le Big Data se nourrit notamment des données des réseaux sociaux dont l’exactitude n’est pas garantie.