Münchener Post - Le web mondial perturbé plus d'une demi-journée par une panne majeure du cloud d'Amazon

München - 12°C

DANS LES NOUVELLES

Le web mondial perturbé plus d'une demi-journée par une panne majeure du cloud d'Amazon
Le web mondial perturbé plus d'une demi-journée par une panne majeure du cloud d'Amazon / Photo: Pau BARRENA - AFP/Archives

Le web mondial perturbé plus d'une demi-journée par une panne majeure du cloud d'Amazon

La première plateforme de cloud au monde, Amazon Web Services (AWS), a annoncé avoir résolu la longue panne qui a perturbé nombre d'applications en ligne lundi, dévoilant une vulnérabilité de l'informatique mondiale, très dépendante des géants de la tech américains.

Taille du texte:

Des banques aux jeux en ligne (Fortnite, Roblox) en passant par les plateformes de streaming (Disney+, Prime Video) ou d'autres applications du quotidien (Airbnb, Zoom, Snapchat), c'est une part significative de services en ligne d'entreprises qui ont connu des perturbations voire des interruptions totales, après une défaillance localisée peu après 7H00 GMT dans des centres de données historiques d'AWS non loin de Washington.

Peu avant 22H00 GMT, soit au bout d'une quinzaine d'heures de gestion de crise, le propriétaire de cette épine dorsale de l'informatique en ligne a annoncé avoir complètement résolu la panne et s'attendre "à un rétablissement total (...) dans les deux prochaines heures", le temps de traiter la file d'attente.

Cette défaillance, synonyme de paiements bloqués, de livraisons interrompues et d'autres activités professionnels ou privées empêchées, a illustré la dépendance du monde aux infrastructures des géants de la tech américains.

Filiale d'Amazon, AWS est la plus importante plateforme mondiale d'informatique "en nuage" (cloud) qui fournit aux entreprises des centres de données mutualisés, des serveurs privés ou des outils d'intelligence artificielle (IA).

Elle pèse près d'un tiers du marché mondial de ce secteur en pleine expansion, sous l'essor rapide de l'IA, devant ses concurrents eux aussi américains, Microsoft Azure et Google Cloud, qui se partagent le deuxième tiers, selon le cabinet Synergy Research Group.

- "Dépendance" -

Cette panne "met en évidence les défis liés à la dépendance" aux fournisseurs de services basés à l'étranger comme Amazon, Microsoft et Alphabet (Google), et qui concentrent une partie importante des clients dans le monde, a estimé Junade Ali, expert en cybersécurité à l'IET (Institution of Engineering and Technology), au Royaume-Uni.

Elle soulève "de sérieuses questions" sur la pertinence pour les entreprises "d'externaliser tout ou partie de leur infrastructure essentielle à un petit groupe de fournisseurs tiers afin de réaliser des économies sur l'hébergement", a pointé l'analyste financier britannique Michael Hewson.

"Cette dépendance excessive à l'égard d'un seul fournisseur menace désormais plus que la simple disponibilité des services: elle met en péril la réputation de la marque et la confiance des clients", a souligné Gadjo Sevilla, analyste chez Emarketer, évoquant la nécessité pour les clients d'AWS de prévoir des stratégies de redondance, synonymes de coûts financiers et énergétiques supplémentaires.

Quelques heures après le début de l'incident, la "cause probable" de la panne était, selon AWS, un problème du DNS, le système de nom de domaines des sites internet, celui qui permet aux requêtes informatiques d'être guidées jusqu'à la bonne destination.

Mais les heures suivantes, après une accalmie, ont vu les difficultés reprendre, faisant de nouvelles victimes aux Etats-Unis autour de 15H00 GMT, comme le jeu Battlefield, la compagnie aérienne Delta ou le service de paiement en ligne Venmo, très populaire dans le pays.

AWS a alors annoncé avoir identifié l'origine, plus grave, de l'incident: "la cause profonde est un sous-système interne chargé de surveiller le bon fonctionnement des répartiteurs de charge réseau".

Autrement dit la défaillance, dont l'explication n'est pas encore connue, ne concerne pas seulement le système de navigation mais la tour de contrôle du système.

Pour éviter qu'une panne n'affecte tout le réseau, AWS a pourtant découpé le monde en une quarantaine de régions, disposant chacune de 3 structures distinctes et isolées, pouvant pallier la défaillance de l'une ou l'autre.

Mais l'incident lundi a démontré qu'un certain nombre de requêtes fondamentales continuent de passer par les centres de données de la région nommée US-East-1, centre le plus ancien (2006) et le plus important d'AWS, situé dans le nord de la Virginie.

En juillet 2024, une autre panne informatique, liée à la mise à jour d'un logiciel du groupe de cybersécurité CrowdStrike sur Windows, avait paralysé des aéroports, des hôpitaux et de nombreuses autres organisations, provoquant une gigantesque pagaille à travers le monde.

D'après Microsoft, cette panne d'un logiciel, et non d'une infrastructure, avait touché environ 8,5 millions d'appareils, les utilisateurs étant confrontés à des "écrans bleus de la mort" qui rendaient le redémarrage impossible.

E.Schmitt--MP