La déduplication permet d’économiser l’espace de stockage mais aussi de soulager le réseau et d’accélérer les sauvegardes ou les restaurations. Ces multiples objectifs sont atteints via des produits et des technologies disparates.

La déduplication consiste, comme la compression, à identifier et factoriser les données redondantes. A ceci près qu'elle est réalisée, non plus au niveau d'un fichier ou d'une base de données, mais sur un ensemble de fichiers voire sur une baie de stockage entière. Sur ce principe très général, se cachent de multiples concepts et produits dont le succès est dopé par celui de la virtualisation. Les machines virtuelles générent en effet d'importantes redondances de données et posent de gros problèmes d'espace disque.

Une idée d'abord appliquée au niveau de la sauvegarde

La déduplication est née dans le monde de la sauvegarde, domaine dans lequel elle peut être réalisée au niveau de l'outil (on parle de sauvegarde à la source) ou de celui du support (à la cible). Dans le premier cas, les redondances entre fichiers sont identifiées au moment de la sauvegarde par les agents installés sur les serveurs, au niveau de blocs de données qui, dans l'idéal, sont de taille variable. Le gain peut alors atteindre un facteur 300, qui semble faramineux mais qu'il faut relativiser. « On obtient une telle efficacité lorsque l'on effectue de multiples sauvegardes d'un même ensemble de fichiers, car il est alors possible de faire apparaître des redondances très importantes entre les versions successives », explique Benoit Devijver, consultant stockage unifié chez EMC.

Le gain est certes fort sur le stockage, mais il réduit aussi d'autant la charge réseau. « Cela constitue souvent le seul moyen de centraliser la sauvegarde de sites distants », estime Pascal Contet, consultant stockage et sauvegarde chez l'intégrateur SCC. A noter que l'outil de sauvegarde doit être spécifique. Par exemple, chez EMC, il s'agit d'Avamar, issu d'un rachat. Depuis peu, l'outil maison (Networker) est toutefois capable de piloter des agents Avamar.

La suite sur le site http://www.zdnet.fr/actualites/it-management/0,3800005311,39389132,00.htm?xtor=RSS-1 très intéressante comme explication, cela permet de bien voir les avantages de la Dédup...