Le mode importation des données
Choisir entre le Direct Query ou l’importation des données dans le Desktop nécessite de se projeter dans l’utilisation futur de ses indicateurs à la fois sur la manière de consommer les données et plus particulièrement sur le besoin du temps réel.
Avant de rentrer dans la description détaillée de chacun des deux modes, un point important à noter tout de suite : toutes les sources de données ne sont pas compatibles avec le mode Direct Query. En revanche, lorsque l’on parle de base de données, les deux modes sont possibles.
En fin d’article, nous évoquerons le mode Live Connection, très utile pour du SQL server.
Les avantages du mode import des données
Le principal avantage du mode Import est de pouvoir utiliser toutes les options de transformation et de modélisation de vos bases de données dans la partie Editeur et toutes les fonctions DAX dans la partie visualisation.
L’autre avantage très important est de pouvoir importer des données de sources différentes et de pouvoir les combiner dans l’éditeur et de créer des relations entre elles.
Enfin, la vitesses de calcul est plus importante grâce à xVelocity et à la compression des données.
Le mode Direct Query ou connexion directe aux données
Le mode Direct Query ne conserve pas les données dans Power BI. La source de données est interrogée à chaque fois que l’on interagit avec Power BI visualisation. Les données ne sont donc pas chargées dans Power BI à l’exception des métadonnées tels que le nom des tables, le type de données, les relations. Ainsi, le fichier de travail est très léger et Power BI est utilisée uniquement pour la partie visualisation. Vous n’êtes donc pas limité par la puissance de la machine sur laquelle vous travaillez ou sur celle de publication de vos rapports.
Les limites du mode Direct Query
Le mode Direct Query comporte de nombreuses limites à bien connaitre avant de faire ce choix de mode de connexion.
Performance d'exécution des rapports
Si la performance des requêtes ne dépend pas de votre machine, elle dépend en revanche de celle de la source de données. Si elle n’est pas suffisamment rapide, l’exécution des requêtes risque d’être abandonnée. A chaque fois qu’un utilisateur travaille sur un visuel, cela envoie une requête à la source de données et cela pour tous les utilisateurs au même instant. Vous devez donc vous assurer de la performance de la machine des sources de données.
Une seule source de données à la fois
Le mode Direct Query ne vous permet pas de combiner des données de différentes sources.
Nombre de transformation limite
Toutes les transformations de données ne sont pas autorisées dans le mode Direct Query. Par exemple, aucune transformation n’est permise lorsque vous interrogez une base de donnée SAP. Pour une base SQL Server, certaines transformations sont possibles. Il est à noter que les transformations sont appliquées à chaque fois que vous travaillez sur un visuel alors qu’elles le sont lors d’un rafraîchissement des données du côté de l’import.
Limitations pour la modélisation des données
Il existe également un certain nombre de limitations dans la modélisation des données qui concernent la création de mesures, l’ajout de colonnes ou tables calculées, les relations, les hiérarchies.
De façon générale, la limitation se fait sur des mesures susceptibles de causer des problèmes de performance. Aussi, la fonction de hiérarchie Parent-Enfant n’est pas possible dans le mode Direct Query. Elle
doit être construite dans la source de données. Autre limitations concernant la table Date. Elle n’est pas intégrée pour chaque colonne de temps comme pour le mode import. La table de date est nécessaire pour les fonctions temporelles de Time Intelligence. Il est donc nécessaire d’utiliser celle de la source de données ou de la créer dedans.
Limitation sur la sécurité
Lorsque vous utilisez la connexion directe, vous avez les mêmes droits de consultation dans le Power BI service lorsque vous publiez. La confidentialité peut-être différente selon les utilisateurs si celle -ci a été définie au niveau des lignes.
Quand utiliser le mode import des données ou Direct Query
Pour disposer de la meilleure expérience d’utilisation de Power BI, le mode import est à privilégier.
Deux cas de figure peuvent vous orienter vers le mode Direct Query :
- Lorsque le model de données est trop important pour rentrer dans le moteur de mémoire de Power BI, alors le mode Direct Query est une solution à privilégier à condition de disposer d’une puissance suffisante sur la machine qui détient les sources de données.
- L’autre cas est quand les données sous-jacentes changent très fréquemment et que vous avez besoin de voir des rapports constamment mis à jour. Dans ce cas de figure, un autre mode est également à opter : Live Connection.
Le mode live connection
Une option de connexion est possible et très performante lorsque vous travaillez sur des sources de données
SQL Server. Dans ce cas, la connexion est différente de celle du Direct Query.
- Pas de création de relation
- Pas de transformation possible
- La modélisation de données est limitée à la création de mesures
On privilégie le mode Live Connection à l’import de données pour la sécurité renforcée qui est rendue plus
dynamique et surtout pour la possibilité de rafraîchir les données autant de fois que nécessaire.