Le Post Infeeny

Les articles des consultants et experts Infeeny

[SIS] Using SSIS 2012 For Data Warehouse ETL

Utilisation des nouveautés SSIS pour le chargement de nos entrepôts de données

Speaker : Thomas Leblanc – Niveau : 300

Il s’agit surtout d’une session montrant les nouveautés SSIS sur SQL Server 2012 et comment les utiliser dans l’alimentation d’un entrepôt de données.

La session présente les nouveautés SSIS suivantes :

  • Change Data Capture
  • Data Quality Services
  • SSIS Catalog

Change Data Capture

Il s’agit de nouveaux composants permettant de capturer les changements au niveau d’une table. Il faut démarrer le « SQL Server Agent » pour pouvoir le faire fonctionner.

Démonstration avec le chargement d’une dimension produit (avec SSIS qui plante en plein milieu ;-)). Le composant CDC va utiliser une table pour tracer tous les changements sur la table source des produits. C’est-à-dire, qu’à chaque modification de cette table, on va stocker une trace. Ensuite, à partir de cette table, on peut détecter directement les données qui ont été ajoutées, modifiées ou supprimées et les insérer dans la dimension de l’entrepôt de données. Pour plus d’information voir l’article « Understanding the CDC State value » de Bradley Schacht sur « SQLServerCentral ».

Data Quality Services

On revient sur ce nouveau composant permettant d’utiliser DQS afin de nettoyer les données que l’on insère dans l’entrepôt de données.

Nouvelle démonstration. Il s’agit du même principe que la session précédente. A savoir, la création d’une nouvelle base de connaissance dans laquelle on crée des domaines. On charge ensuite des valeurs afin d’enrichir notre base de connaissance. Une fois que la base de connaissance a été créée, on va pouvoir l’utiliser et l’enrichir dans SSIS avec le composant DQS.

SSIS Catalog

Il s’agit du point central où sont, dorénavant, stockés et gérés les packages SSIS déployés sous SQL Server 2012 (au travers de la nouvelle base SSISDB). Les packages peuvent être maintenant directement déployé dans le « SSIS Catalog » depuis Visual Studio.

Démonstration montrant la gestion des packages sous SSIS avec les « environnements » qui remplacent les « configurations » présentent sous SQL Server 2008.

Dernière petite démonstration montrant comment exécuter un package sous SQL Server 2012 en ligne de commande sans utiliser le « dtexec ».

En conclusion, une session très intéressante avec la présentation des composants CDC qui peuvent représenter un intérêt certain dans le chargement de nos entrepôts de données. A Tester

Julien

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :