Je me demande que cette question n'a pas déjà été posée. Google n'a que très peu de résultats pour moi qui ne montrent pas un outil de haute qualité
Quelles sont les solutions Open Source (également gratuites est ok) pour les entrepôts de données et plus spécifiquement les outils de Business Intelligence? Quelles sont vos expériences avec eux. J'ai suivi un cours dans mon programme de maîtrise et nous avons travaillé avec MS Business Intelligence et MSSQL en tant que stockage d'entrepôt de données. Maintenant, je veux approfondir ce sujet avec des outils "ouverts".
Existe-t-il des outils comparables pour la Business Intelligence (principalement indépendants des bases de données) et avez-vous une expérience avec eux?
modifier Avec le commentaire de Marian à la réponse de Stephanie, je vois que j'ai mal formulé la question. Je suis conscient que les DWH ne sont que des bases de données "optimisées pour les rapports", l'explication de Stéphanie était très claire à ce sujet. Je suis plus intéressé par la façon d'obtenir les données dans de telles formes optimisées avec QUEL type de logiciel / outils / autres techniques de BI.
Réponses:
Je travaille avec Pentaho depuis environ un an maintenant.
Pentaho est une suite Open Source complète pour la Business Intelligence.
Sa force est qu'il repose sur un projet géré de manière indépendante:
Vous pouvez les utiliser dans leur ensemble (Pentaho BI Server) ou séparément.
Pourquoi devrais-je le recommander? La communauté est vraiment active et fournit des plugins sur une base hebdomadaire. Un groupe de membres de la communauté a fourni un cadre pour la création d'un tableau de bord interactif avec une interface utilisateur click & go.
Il est indépendant de la base de données. Si vous avez du temps libre, jetez-y un œil.
J'ai fait des recherches avant d'utiliser Pentaho, j'ai testé IceCube et Palo même JasperSoft mais Pentaho était bien meilleur selon mes besoins.
la source
Je pense que vous ne comprenez pas ce que l'on entend par datawarehouse . Ce n'est pas un outil. Ou une application. Ou une base de données. Cela ne signifie pas "grande base de données".
Tu as dit,
MSSQL était non seulement le stockage du DWH, il est le DWH.
Un datawarehouse est une base de données spécialement conçue et optimisée pour les rapports. Vous ne réservez pas de transactions contre elle.
Vous pouvez utiliser à peu près n'importe quel outil de BI contre ce DWH. Mais l'outil BI n'est pas le DWH.
N'importe quel SGBDR peut être utilisé. Certains feront un meilleur travail de gestion de la taille. Le partitionnement et les Star Joins sont des exemples de fonctionnalités dans un SGBDR qui améliorent les très grands entrepôts de données, mais ils ne sont pas nécessaires.
Les cubes sont généralement dérivés d'un datawarehouse et sont utilisés pour découper et découper rapidement différents niveaux d'agrégation selon différentes dimensions.
Utilisez le SGBDR de votre choix. Comprendre la modélisation dimensionnelle est la vraie discussion.
la source