|
|||
|
|
Les solutions de stockage
Lorsque les disques durs des serveurs de l’entreprise commencent à saturer, il devient nécessaire d’envisager de nouvelles solutions de stockage. Or, à la vitesse où se cumulent aujourd’hui les informations, les emails et les contenus multimédia, l’espace disque des serveurs vient vite à manquer. Pour faire face à cette inflation des données, les PME se voient proposer de multiples solutions. Quelles sont-elles ? Quels sont leurs avantages et inconvénients relatifs ? Comment choisir la solution la mieux adaptée ? Voici comment vous y retrouver.
Adopter une infrastructure de stockage
Aujourd’hui les disques durs sont relativement bon marché. Une entreprise peut s’offrir plusieurs Téraoctets (1 To = 1000 Go) de stockage pour quelques centaines d’euros à peine. Cette réduction des coûts des disques est évidemment directement liée à l’explosion des besoins en la matière.
Cependant, ce serait une erreur que de réduire la problématique du stockage à une simple adjonction de disques. La multiplication des espaces et l’expansion sauvage de solutions de stockage incohérentes conduisent rapidement à une situation dramatique. On finit par ne plus savoir où sont stockées les données vitales de l’entreprise, quel est l’espace total disponible et si celui-ci est bien exploité. On finit même par perdre de vue quel est le coût de stockage des données de l’entreprise ou de la restauration d’un fichier ou d’un disque perdu. Réfléchir son architecture de stockage et opter pour des solutions cohérentes sont donc deux démarches indispensables pour éviter d’être rapidement noyés par les problématiques d’administration réseau et de sécurité. Une démarche qui conduit à termes à adopter une infrastructure de stockage qui permet : + d’éviter l’éparpillement des données cruciales de l’entreprise + diminuer l’impact des incidents sur le fonctionnement de l’entreprise + de mieux contrôler l’expansion des données et de mieux l’anticiper + de simplifier la protection et la sauvegarde des données de l’entreprise + de s’assurer que l’entreprise respecte bien les recommandations et règles légales d’archivage imposées par son activité + de maîtriser les coûts de stockage et d’archivage de son information. Le propre d’une infrastructure de stockage est de vous permettre de faire face à l'augmentation des volumes de données sans surcoûts matériels ou humains avec une bonne visibilité et prédictibilité. Les méthodes de stockage
On distingue trois grands types de solutions de stockage :
Les DAS (Direct Attached Storage) C’est la méthode la plus immédiate. Elle consiste simplement à rajouter des baies de disques directement reliées au serveur dont elle augmente la capacité. Les disques sont directement gérés par le système d’exploitation (et son système de fichiers) du serveur. Les disques de la baie peuvent être autonomes ou configurés en RAID. Le DAS reste la solution la plus rapide à mettre en œuvre et la plus efficace lorsque les besoins en termes de performances sont essentiels (cas des bases de données par exemple). Mais dès lors que les volumétries prennent de l’ampleur et que les données doivent être accessibles par plus d’un serveur, le concept du DAS n’est plus applicable. Il faut alors opter pour une solution dite de « stockage en réseau » qui peut être un NAS ou un SAN. Les NAS (Network Attached Storage) La NAS est une sorte de baie de disques que l’on connecte directement sur le réseau de l’entreprise (et non plus à un serveur). Le NAS est presque aussi simple, parfois même plus simple, à mettre en œuvre qu’un DAS. Contrairement à un DAS, il permet de consolider les fichiers provenant de serveurs différents et de systèmes d’exploitation différents (Windows, Linux, Unix, Novell, Mac OS, etc.). Le NAS peut être perçu comme un serveur de fichiers pas très intelligent. Les performances d’un NAS sont intrinsèquement liées aux performances du réseau de l’entreprise et sont très inférieures à celles d’un SAN ou d’un DAS. Le NAS convient donc mieux à la distribution de fichiers qu’au stockage des bases de données (un NAS travaille au niveau fichier, il est donc inadapté aux applications travaillant en mode blocs de données). Les SAN (Storage Area Network) Comme son nom l’indique, le SAN est un réseau dédié à la mutualisation de l’espace de stockage. Ce réseau dédié (totalement indépendant du réseau local classique de l’entreprise) permet d’interconnecter des serveurs et des baies de stockage avec d’excellentes performances. Les SAN peuvent s’appuyer sur un réseau de fibres optiques (on parle alors de Fibre Channel) ou sur un réseau de câbles cuivre classiques (on parle alors de iSCSI). Contrairement à un NAS qui fonctionne en mode fichiers, le SAN fonctionne en mode « blocs de données ». Dès lors il est applicable au stockage de tous types d’application y compris bases de données et serveurs de messagerie. Certes, leur mise en œuvre est relativement complexe. Mais leur souplesse en matière d’utilisation et d’expansion est inégalée. Les SAN modernes sont évidemment compatibles avec les différents environnements qui cohabitent dans votre entreprise (Windows, Linux, MacOS, Unix, Novell…). Autorisant des distances jusqu’à 10 Km, les SAN constituent également des solutions de stockage multi-sites très intéressantes. Les solutions NAS et SAN concrétisent une même idée : celle de centraliser le stockage en un lieu. En mutualisant les ressources, cette centralisation offre un meilleur contrôle des espaces de stockage et une plus grande souplesse dans leur répartition. Les technologies dont elles dépendent
La sélection d’une solution de stockage demande quelques connaissances de base des technologies et du jargon sous-jacents.Ce vocabulaire peut être regroupé autour de trois axes :
A/ Les technologies d’interfaces Pour connecter serveurs et baies de stockage, il faut des supports physiques, des interfaces de connexion et bien évidemment des protocoles. * Fibre Channel (ou FC) Cette technologie utilise la fibre optique pour interconnecter serveurs et baies. Elle offre des débits élevés pouvant aller jusqu’à 4 Gbps (ou même 8 Gbps sur les solutions les plus récentes). * iSCSI Cette technologie est une alternative économique au FC qui utilise des technologies réseau IP classiques pour véhiculer les instructions SCSI. La démocratisation de l’Ethernet Gigabit, l’arrivée de l’Ethernet 10 Gigabit et l’annonce de l’Ethernet 100 Gigabit ont redonné un coup de boost à cette technologie jusqu’ici moins en vogue que la fibre dans la construction des SAN. * AoE (ATA over Ethernet) C’est un protocole Open Source qui encapsule les ordres ATA (des disques PATA/SATA) au sein de paquets IP classique. Son objectif est de permettre l’élaboration de SAN à très bas coût. Cette technologie reste pour le moment très peu utilisée. * FCoE (FC over Ethernet) C’est une nouvelle technologie d’interconnexion qui permet de véhiculer du Fiber Channel sur de l’Ethernet parallèlement à de l’IP. Elle simplifie l’intégration des réseaux FC existants et permet une éventuelle consolidation des matériels réseaux. B/ Les technologies de redondance RAID Les disques au sein d’une baie peuvent être combinés pour offrir des performances supplémentaires ou une sécurité supplémentaire (par redondance) au travers des technologies RAID : RAID 0 : Technique qui consiste à distribuer les données sur plusieurs disques physiques (ne formant qu’un seul disque logique) afin d’en accélérer l’accès. RAID 1 : Technique consistant à dupliquer les données d’un disque sur un autre disque identique de sorte que si l’un des disques vient à tomber en panne les données restent accessibles. Pour chaque disque « utile » il faut donc un disque de sauvegarde. RAID 5 : Combine trois disques ou plus pour assurer la sécurité des données grâce à un mécanisme de parité (les informations ne sont pas dupliquées mais un calcul savant permet de reconstituer les données perdues à partir de celles toujours présentes). C’est une solution plus économique que le RAID 1. Un seul disque est nécessaire pour stocker les données de parité de tous les autres disques. Si votre baie comporte 4 disques en RAID 5, sa capacité réelle sera la somme de 3 disques (le quatrième étant dédié aux parités autrement dit à la restauration des informations perdues). Si l’un des 3 disques d’information venait à défaillir, il pourrait être reconstruit depuis les 2 disques encore fonctionnels et le disque de parité. RAID 6 : C’est une évolution du RAID 5 dans laquelle on utilise 2 disques pour le stockage des parités. Ceci sécurise davantage encore l’ensemble de l’espace disque. Si l’on considère une baie de 5 disques, une solution RAID 6 réservant donc 2 disques aux calculs, l’espace de stockage est donc la somme des capacités des trois disques restants. En RAID 6, deux disques de la baie peuvent défaillir sans pour autant que vous perdiez irrémédiablement leurs données. RAID 10 : technique qui combine RAID 0 et RAID 1. C/ Les technologies de disques Tous les disques du marché ne sont pas égaux. Les performances des baies dépendent également des vitesses d’accès et des débits des disques, éléments qui dépendent des technologies employées. SAS (Serial Attached SCSI) Successeur du SCSI, le SAS offre des débits allant jusqu’à 6 Gbps. Il se destine aux serveurs haut-de-gamme. SATA (Serial ATA ou Serial Advanced Technology Attachment) Evolution de l’ancienne norme ATA (désormais désignée PATA), le SATA existe en 3 déclinaisons : SATA 1 (ancienne norme à 1,5 Gbps), SATA 2 (norme actuelle avec des débits jusqu’à 3 Gbps) et SATA 3 (future norme à 6 Gbps). Notions de Tiers et d’archivage
Dans une entreprise, toutes les données n’ont pas la même valeur. La notion de « Tiers » est intimement liée à celle d’archivage. Il ne faut pas confondre sauvegarde et archivage. Le premier concept est déterminé par des besoins de protection et de reprise en cas de soucis. Le second est déterminé par le besoin de conserver de façon permanente des données afin d’y accéder sur le long terme.
Toutes les données de l’entreprise n’ont pas la même importance. Certaines sont accédées quotidiennement, d’autres plus rarement, d’autres enfin ne sont conservées que pour des raisons légales sans être jamais véritablement consultées. Pour réduire les coûts de stockage, certaines entreprises adoptent une infrastructure « multi-tiers » : - Le Tier 1 (niveau 1) s’appuie sur des disques ultra-rapides et des solutions de stockage ultra-performantes sur lesquelles sont stockées les bases de production et les données critiques. - Le Tier 2 utilise des supports plus conventionnels, des SANs ou des NAS pour stocker les données financières, les fichiers bureautiques, les emails, etc. - Le Tier 3 utilise des supports bon marchés mais peu performants pour tout ce qui est archivage d’informations. Quelques conseils pour bien choisir
Vous devez avoir une vision assez claire de votre stratégie de stockage à moyen terme avant de choisir votre solution de stockage. Ne multipliez pas les solutions sans vision globale.
• Sachez évaluer vos besoins présents et à venir. Surveillez vos espaces de stockage actuels afin d’anticiper leur évolution. Surveillez qui crée de la donnée, dans quel but, avec quelle volumétrie. • Prenez un moment pour réfléchir à l'importance du stockage des données pour votre entreprise. Toutes les données ne sont pas nées égales. Quelles sont celles qui ont une importance vitale ? Quelles sont celles qui ont une importance légale? Quelles sont celles qui réclament de la performance ? Quelles sont celles qui doivent être accessibles à long terme, etc. Vous construirez ainsi une hiérarchie et une base d’infrastructure logique qui guidera naturellement votre choix de solution. • Pensez TCO et retour sur investissement. Consolidez plusieurs serveurs de fichiers au sein d’un NAS est souvent une approche payante.
|
||
Comprendre les technologies
Annuaires des logiciels