Le disque dur prêt à durer : l'avenir de la stratégie de stockage repose sur l'hybridation des technologies
Les disques durs, qui stockent aujourd'hui de loin la majorité des exaoctets du monde entier, sont plus indispensables que jamais aux opérateurs de datacenters.
Le stockage des données flash est souvent considéré comme l'ultime solution en raison de sa rapidité, de sa fiabilité, ou encore de sa capacité à conserver les données en toute circonstance. Ceci a fait naitre il y a plus d’une décennie de nombreuses prédictions annonçant l’extinction des disques durs, formulées par quelques partisans optimistes de cette technologie. Mais ces augures ne se sont jamais confirmés et ne semblent pas prêts à se réaliser.
Nous vivons à une époque où l'omniprésence du cloud et l'émergence des cas d'utilisation de l'IA ont fait grimper la valeur des ensembles de données massives. Les disques durs, qui stockent aujourd'hui de loin la majorité des exaoctets du monde entier, sont plus indispensables que jamais aux opérateurs de datacenters. Les analystes du secteur s'attendent à ce que les disques durs soient les principaux bénéficiaires de la croissance continue du nombre d'exaoctets. D’après IDC, le stockage sur disque dur devrait augmenter de 6 996EB, tandis que l’augmentation du stockage sur les SSD devrait être de 1 363EB d’ici à 2027.
Il ne fait aucun doute que le stockage flash est essentiel pour de nombreuses applications, en particulier celles qui nécessitent des performances et une vitesse de calcul élevées. Cependant, il est important de remettre en perspective la notion selon laquelle l'utilisation exclusive de la technologie flash est la solution ultime pour garantir des performances élevées et durables. Toutes les charges de travail modernes nécessitent-elles réellement les avantages offerts par la mémoire flash en termes de performances ? Comment les entreprises peuvent-elles concilier contraintes budgétaires, croissance rapide des données et exigences en matière de performances pour trouver un équilibre optimal ? En outre, il convient d'examiner de plus près l'idée selon laquelle une architecture de stockage à un seul niveau représente la simplicité idéale. Cette approche répond-t-elle véritablement aux besoins complexes et évolutifs des entreprises d'aujourd'hui ?
L'équilibre subtil entre disques durs et solutions tout flash
La plupart des données mondiales résident dans le cloud et dans les grands datacenters. Dans ces environnements, les charges de travail suivent une règle de Pareto : seul un petit pourcentage de la charge de travail nécessite un pourcentage significatif des performances. C'est pourquoi, selon IDC, au cours des 5 dernières années, les disques durs ont représenté près de 90% de la base installée de stockage en ligne dans les datacenters hyperscale.
Dans certains cas, les systèmes tout flash ne sont pas du tout nécessaires dans le cadre des solutions les plus performantes. Il existe des systèmes de stockage hybrides qui fonctionnent aussi bien ou plus rapidement que le tout-flash. Au niveau de l'appareil, les différences de performances sont évidentes. Mais à grande échelle, dans les racks de datacenters, les performances des disques durs bénéficient d'un accès extrêmement parallèle, ce qui se traduit par un niveau de performance plus que suffisant pour la majorité des charges de travail, y compris l'IA et l'apprentissage automatique. Tout aussi important, les avantages significatifs en termes de performances supplémentaires offerts par la mémoire flash peuvent souvent être limités par d'autres décisions relatives à l'infrastructure, telles que la capacité ou la qualité du réseau.
Trouver l'équilibre idéal entre coûts, capacités et performances
Les considérations liées au coût total de possession sont cruciales pour la prise de décisions concernant l'infrastructure des datacenters. Il est essentiel de trouver un équilibre entre les coûts, la capacité et les performances. L'optimisation du coût total de possession se réalise en alignant le support le plus rentable (disque dur, flash ou bande) sur les exigences de la charge de travail. Les disques durs et les baies hybrides (combinant disques durs et SSD) conviennent généralement à la plupart des cas d'utilisation du stockage, mais aussi des applications d'entreprise et de cloud.
Il est possible d'opter pour des disques SSD ou les baies AFA (All Flash Array) pour les charges de travail les mieux adaptées aux disques durs, comme les services de fichiers, le stockage d'objets, les systèmes de gestion de documents ou l'hébergement Web. Cependant, en termes de coûts, il devient illogique d'opter pour une capacité plus élevée. Ce serait comme utiliser sa voiture garée dans son garage pour ranger ses vêtements : possible, mais clairement pas rentable.
Bien que le stockage flash soit performant dans les scénarii de lecture intensive, sa durabilité diminue avec une activité d'écriture accrue. Les fabricants pallient ce problème en corrigeant les erreurs et en surprovisionnant le stockage pour remplacer les cellules usées, ce qui engendre des coûts supplémentaires et nécessite une alimentation constante pour éviter toute perte de données. Cela pose des défis dans des environnements tels que les datacenters en périphérie, où un fonctionnement continu n'est de facto plus garanti.
Alors que des technologies comme la cellule à trois niveaux (TLC) et la cellule à quatre niveaux (QLC) permettent à la mémoire flash de gérer les charges de travail en lecture et écriture comme les disques durs, leur intérêt économique diminue pour des volumes de données importants ou une conservation à long terme. Dans ces cas, les disques durs offrent une solution plus rentable grâce à leur densité surfacique croissante. Dans les environnements hyperscale, l'utilisation simultanée de milliers de disques durs permet d'obtenir des performances complémentaires à la mémoire flash, soulignant ainsi leur rôle complémentaire crucial dans les datacenters modernes.
Dépasser les mythes : l'équilibre entre les AFA et les disques durs
Les défenseurs du flash soutiennent que les baies AFA (All Flash Array) surpassent les baies hybrides et les systèmes de stockage sur disque dur, en raison de la simplicité d'utilisation d'un seul type de stockage par rapport à une combinaison de types et de niveaux de stockage. Cependant, il convient de ne pas tirer de conclusions hâtives.
De nombreux systèmes de stockage hybrides intègrent une architecture software-defined éprouvée qui tire parti des différents types de supports de manière transparente. Dans les environnements de cloud privé ou public scale-out, les systèmes de fichiers ou le stockage défini par logiciel sont utilisés pour gérer les charges de travail entre les emplacements du datacenter, offrant une flexibilité permettant d'adapter le stockage en fonction de l'évolution constante des besoins. Les AFA et les SSD sont parfaitement adaptés aux charges de travail de lecture hautes performances. Cependant, extrapoler à partir de cas spécifiques vers des déploiements à grande échelle peut s'avérer coûteux. Les architectures cloud, hyperscale et d'entreprises privilégient des supports optimisant coûts, capacité et performances, avec les disques durs restant pertinents pour certaines charges de travail données.
Dans les datacenters, les disques durs et la mémoire flash sont voués à fonctionner en synergie, déployés pour soutenir différents services. Ils ont chacun leurs propres avantages et leur propre proposition de valeur. Cette symbiose est bien vivante, alors que les conjectures de ceux qui ont des intérêts dans l'obsolescence des disques durs manquent de crédibilité et ne s’accompliront pas. Pourquoi chercher à opposer ces technologies ? C’est bien cette approche hybride qui permet d’optimiser les coûts, la capacité et les performances pour répondre aux besoins spécifiques des différentes charges de travail. En explorant ces questions en détail, nous pouvons mieux comprendre les nuances et les défis liés au choix d'une architecture de stockage résiliente adaptée aux exigences actuelles et à venir.