Một đám mây khổng lồ Sự cố ngừng hoạt động xuất phát từ khu vực US-EAST-1 quan trọng của Amazon Web Services, trung tâm của nó gần thủ đô Hoa Kỳ ở phía bắc Virginia, đã gây ra sự gián đoạn trên diện rộng đối với các trang web và nền tảng trên toàn thế giới vào sáng thứ Hai. Nền tảng thương mại điện tử chính của Amazon và các tài sản khác bao gồm chuông cửa Ring và trợ lý thông minh Alexa đã bị gián đoạn và ngừng hoạt động suốt buổi sáng, cũng như nền tảng liên lạc của Meta WhatsApp, ChatGPT của OpenAI, nền tảng thanh toán Venmo của PayPal, nhiều dịch vụ web từ Epic Games, nhiều trang web của chính phủ Anh và nhiều trang khác.
Sự cố ngừng hoạt động bắt nguồn từ giao diện lập trình ứng dụng cơ sở dữ liệu “DynamoDB” của Amazon ở US-EAST-1 và AWS cho biết trong bản cập nhật trạng thái rằng sự cố liên quan cụ thể đến các vấn đề về độ phân giải DNS. “Hệ thống tên miền” là một dịch vụ internet nền tảng, về cơ bản hoạt động như một tra cứu danh bạ tự động để dịch các URL web như “www.newstime.com” thành địa chỉ IP máy chủ số để trình duyệt web hiển thị cho người dùng nội dung phù hợp. Sự cố về “độ phân giải” DNS xảy ra khi máy chủ DNS không kết nối chính xác các dấu chấm này và, giống như danh bạ điện thoại, đang cung cấp sai số cho một tên cụ thể hoặc ngược lại.
AWS viết trong bản cập nhật trạng thái hôm thứ Hai: “Dựa trên cuộc điều tra của chúng tôi, vấn đề dường như liên quan đến độ phân giải DNS của điểm cuối API DynamoDB ở US-EAST-1”. Ngay sau khi công ty bổ sung: “Nếu bạn vẫn gặp sự cố khi giải quyết điểm cuối dịch vụ DynamoDB trong US-EAST-1, chúng tôi khuyên bạn nên xóa bộ nhớ đệm DNS của mình”.
Người phát ngôn của AWS đã không trả lời ngay lập tức khi được hỏi chi tiết về bản chất của lỗi. Các vấn đề về độ phân giải DNS có thể nguy hiểm—được gọi là chiếm quyền điều khiển DNS—nhưng không có dấu hiệu nào cho thấy việc AWS ngừng hoạt động hôm thứ Hai là bất chính.
Davi Ottenheimer, giám đốc tuân thủ và hoạt động bảo mật lâu năm, đồng thời là phó chủ tịch của công ty cơ sở hạ tầng dữ liệu Inrupt, cho biết: “Khi hệ thống không thể giải quyết chính xác nên kết nối với máy chủ nào, các lỗi xếp tầng đã làm hỏng các dịch vụ trên internet”. “Sự cố ngừng hoạt động của AWS ngày nay là một vấn đề kinh điển về tính khả dụng và chúng ta cần bắt đầu coi đây là lỗi về tính toàn vẹn dữ liệu.”
Vấn đề bắt đầu vào khoảng 3 giờ sáng theo giờ ET. Đến 5:22 sáng theo giờ ET, AWS đã áp dụng “các biện pháp giảm nhẹ ban đầu” và bắt đầu có hiệu lực. Vào lúc 6:35 sáng theo giờ ET, Amazon cho biết họ đã giải quyết đầy đủ các vấn đề kỹ thuật cơ bản nhưng “một số dịch vụ sẽ còn tồn đọng công việc cần giải quyết, điều này có thể mất thêm thời gian để xử lý đầy đủ”.

