En vidtrekkende innvirkning på infrastrukturen til Amazon Web Services (AWS) har periodevis ført til at tusenvis av plattformer og applikasjoner i forskjellige land er uten tjeneste. Brukerrapporter steg kraftig tidlig på dagen på grunn av Tilkoblingsfeil, forsinkelse og mislykkede opplastinger, med spesiell konsentrasjon i USA og synlige effekter i Europa.
Ifølge selskapets statuspanel oppsto problemet i regionen US-EAST-1 (Nord-Virginia) og forårsaket en unormal økning i feilrater på tvers av flere API-er. Ved formiddag rapporterte AWS at de så klare tegn på gjenoppretting på tvers av en rekke tjenester, selv om teamene fortsatte å jobbe med å lukke hendelsen fullstendig og føre all drift tilbake til normalen.
Hendelsens kronologi
De første advarslene ble gitt rundt klokken 9:00 (spansk halvøytid), med en topp i hendelser kort tid etter og konstante varsler i overvåkingsverktøy som DownDetector. Fra klokken 11:00 rapporterte selskapet at de hadde identifisert en mulig årsak og begynte å bruke avbøtende tiltak som akselererte gjenopprettingen i forskjellige lag.
Ved middagstid rapporterte AWS at de fleste operasjonene viste normalisert oppførsel, selv om den advarte om spesifikke restriksjoner på visse applikasjoner og spesifikke tjenester i den berørte regionen. Tidlig på ettermiddagen, gjenværende påvirkninger mens stabiliseringsarbeidet fortsatte.

Hvor var det tekniske opphavet
Selskapet fokuserte på Amazon DynamoDB, dens administrerte nøkkelverdi-databasetjeneste, hvis endepunkt på US-EAST-1 opplevde feil som resulterte i kaskadefeil på tvers av flere avhengigheter. AWS pekte på en underliggende DNS-problem som en utløser, som gradvis ble dempet.
I praksis, når domenenavnsystemet ikke løses riktig, Applikasjonene finner ikke ressursene sine og tilkoblingsfeil, tidsavbrudd og datainnlastingsfeil oppstår. Som et beredskapstiltak anbefalte AWS at kunder med vedvarende problemer tøm hurtigbuffere av DNS for å gjenopprette oppløsningen til de riktige endepunktene.
Hvem har blitt berørt
Omfanget var tverrgående: Amazon registrerte selv hendelser i Alexa y Prime Video, mens det blant tredjeparter var problemer med populære tjenester som Lerret, Duolingo o SnapchatDet ble også observert feil på plattformer av Generativ AI og i samarbeidende applikasjoner som er avhengige av AWS-skyen.
Digital underholdning ble heller ikke utelatt. Titler og tjenester med høyt volum, som fortnite, Roblox o Clash Royale rapporterte feil av Logg Inn eller tilkobling, mens noen butikker og spillutviklere iverksatte tiltak for å redusere virkningen inntil trafikken stabiliserer seg.
Påvirkning i Spania
På nasjonalt nivå rapporterte flere brukere tilgangsproblemer til digitale tjenesteapplikasjoner og nettsteder, med særlig innvirkning rundt formiddagen. Plattformer ble også påvirket Billettsalg som Ticketmaster, som utsatte utgivelser annonsert til middag; blant dem billettutgivelser knyttet til svært ettertraktede konserter.
Finansinstitusjoner og store forbrukerplattformer kommuniserte spesifikke hendelser i deres nettbaserte systemer, selv om virkningen varierte etter region og tjeneste. Etter hvert som tiltak ble implementert i den berørte amerikanske regionen, ble det observert en gradvis gjenoppretting av tilgangen i Europa.
Nåværende situasjon og anbefalinger
Etter hvert som timene gikk, indikerte AWS at de så betydelige tegn på bedring på de fleste av tjenestene sine, samtidig som det opprettholdes begrensede restriksjoner på visse operasjoner innenfor US-EAST-1. Selskapet fortsetter å overvåke ytelsen og implementere justeringer for å løse problemet fullt ut.
Hvis du fortsatt opplever isolerte problemer, kan det være lurt å se gjennom den offisielle AWS-statusen og, der det er aktuelt, Tøm cache DNS eller omstart av klienter og tjenester som er avhengige av løsning til endepunkter i det berørte området. I kritiske distribusjoner anbefales det å bekrefte failovers, nettverksavhengigheter og retningslinjer for nye forsøk for å minimere virkningen av forsinkelser og forbigående feil.
Episoden viser i hvilken grad infrastrukturen til Cloud Computing har blitt strukturelt for den digitale økonomien: et lokalt sammenbrudd i et nøkkelknutepunkt kan føre til kjedeeffekter på global skala, fra strømming og spilling til finansielle og produktivitetsapplikasjoner.