News Time

Sự cố ngừng hoạt động AWS của Amazon đã đánh bật các dịch vụ như Alexa, Snapchat, Fortnite, Venmo, v.v.

Có cảm giác như một nửa số Internet đang phải đối mặt với tình trạng nôn nao từ sáng ngày 19 tháng 10 đến đầu giờ ngày 20 tháng 10. Sự cố ngừng hoạt động nghiêm trọng của Dịch vụ web Amazon đã khiến rất nhiều trang web, ứng dụng, trò chơi và các dịch vụ khác dựa vào bộ phận đám mây của Amazon duy trì hoạt động. Điều đó bao gồm một danh sách dài các phần mềm phổ biến như Venmo, Snapchat, Canva và Pháo đài. Ngay cả trợ lý Alexa của Amazon cũng nói lắp, và nếu bạn đang thắc mắc tại sao Internet dường như chống lại bạn – bạn không hề tưởng tượng ra điều đó. Tin vui là Amazon đã thông báo vào lúc 6:53 chiều theo giờ miền Đông ngày 20 tháng 10 rằng họ đã giải quyết được “tỷ lệ lỗi và độ trễ gia tăng đối với Dịch vụ AWS”.

Công ty cho biết họ “đã xác định nguyên nhân gây ra sự kiện là do sự cố phân giải DNS đối với các điểm cuối dịch vụ DynamoDB trong khu vực.” Nó gặp nhiều vấn đề hơn khi cố gắng giải quyết tình trạng ngừng hoạt động, nhưng cuối cùng nó đã có thể khắc phục được mọi thứ. “Đến 3:01 chiều, tất cả các dịch vụ AWS đã trở lại hoạt động bình thường,” nó cho biết.

Vào khoảng 4:30 chiều ET ngày 20 tháng 10, mọi thứ dường như trở lại bình thường. Các ứng dụng như Venmo và Lyft trước đây phản hồi chậm hoặc hoàn toàn không phản hồi, dường như hoạt động trơn tru.

Kể từ 1:15 chiều ET ngày 20 tháng 10, nhiều dịch vụ không khả dụng, bao gồm cả việc hỏi Alexa về thời tiết hoặc tắt đèn trong nhà bạn. Ứng dụng Lyft cũng phản hồi chậm hơn bình thường và các giao dịch Venmo không hoàn tất.

Theo trang tình trạng dịch vụ AWS vào thời điểm đó, Amazon đang xem xét “tỷ lệ lỗi và độ trễ gia tăng đối với nhiều dịch vụ AWS” ở khu vực US-EAST-1 (tức là các trung tâm dữ liệu ở Bắc Virginia) kể từ 3:11 sáng thứ Hai theo giờ ET. Đến 5:01 sáng, AWS đã phát hiện ra rằng vấn đề về độ phân giải DNS với API DynamoDB là nguyên nhân gây ra tình trạng ngừng hoạt động. DynamoDB là cơ sở dữ liệu chứa thông tin cho máy khách AWS.

Vào khoảng 12:08 chiều theo giờ ET, công ty đã đăng một tuyên bố nhỏ nhắc lại những điều trên và nói thêm rằng “vấn đề DNS cơ bản đã được giảm thiểu hoàn toàn vào lúc 2:24 sáng theo giờ PDT”. Theo thông báo, một số khách hàng của Amazon “vẫn tiếp tục gặp phải tỷ lệ lỗi gia tăng với các dịch vụ AWS ở Khu vực N. Virginia (us-east-1) do các vấn đề khi khởi chạy phiên bản EC2 mới.” Amazon cũng cho biết Amazon.com và các công ty con của Amazon cũng như hoạt động hỗ trợ dịch vụ khách hàng của AWS đã bị ảnh hưởng.

Mike Chapple, giáo sư giảng dạy về CNTT, phân tích và vận hành tại Đại học Notre Dame, nói: “Amazon đã lưu trữ dữ liệu một cách an toàn nhưng không ai khác có thể tìm thấy nó trong vài giờ, khiến các ứng dụng tạm thời bị tách khỏi dữ liệu của họ”. CNN. “Có vẻ như phần lớn Internet bị mất trí nhớ tạm thời.”

Kể từ 6:35 sáng, AWS cho biết họ đã giảm thiểu hoàn toàn sự cố DNS và “hầu hết các hoạt động của Dịch vụ AWS hiện đang hoạt động bình thường”. Tuy nhiên, hiệu ứng dây chuyền đã gây ra sự cố với các dịch vụ AWS khác, bao gồm EC2, một dịch vụ máy ảo mà nhiều công ty sử dụng để xây dựng các ứng dụng trực tuyến.

Vào lúc 8:48 sáng, AWS cho biết họ đang “đạt được tiến bộ trong việc giải quyết vấn đề khi khởi chạy phiên bản EC2 mới ở Khu vực US-EAST-1”. Chúng tôi khuyến nghị khách hàng không nên ràng buộc các hoạt động triển khai mới với các Vùng sẵn sàng cụ thể (tức là một hoặc nhiều trung tâm dữ liệu trong một khu vực nhất định) “để EC2 có sự linh hoạt” trong việc chọn một vùng có thể là lựa chọn tốt hơn.

Vào lúc 9:42 sáng, Amazon lưu ý trên trang trạng thái rằng mặc dù họ đã áp dụng “nhiều biện pháp giảm nhẹ” trên một số Vùng sẵn sàng ở US-EAST-1 nhưng “vẫn gặp phải lỗi nghiêm trọng khi khởi chạy phiên bản EC2 mới”. Do đó, AWS đã “giới hạn tốc độ khởi chạy phiên bản mới để hỗ trợ quá trình phục hồi”. Công ty cho biết thêm vào lúc 10:14 sáng rằng họ đang gặp “các lỗi API nghiêm trọng và sự cố kết nối trên nhiều dịch vụ ở Khu vực US-EAST-1.” Ngay cả khi tất cả các vấn đề đã được giải quyết, AWS vẫn sẽ có một lượng yêu cầu tồn đọng đáng kể và các yếu tố khác cần xử lý, vì vậy sẽ mất một thời gian để mọi thứ phục hồi.

Rất nhiều, rất nhiều công ty sử dụng US-EAST-1 để triển khai AWS của họ, đó là lý do tại sao có cảm giác như một nửa số Internet đã bị ngắt kết nối ngoại tuyến vào sáng thứ Hai. Tính đến giữa buổi sáng, hàng tấn trang web và dịch vụ khác hoạt động chậm chạp hoặc đưa ra thông báo lỗi. Báo cáo ngừng hoạt động của một loạt dịch vụ tăng vọt trên Down Detector. Cùng với các dịch vụ của Amazon, người dùng đã báo cáo các vấn đề liên quan đến ngân hàng, hãng hàng không, Disney+, Snapchat, Reddit, Lyft, Apple Music, Pinterest, Fortnite, Roblox Thời báo New York – xin lỗi những ai có từ ngữ các vệt có thể gặp nguy hiểm.

Các trang web như Reddit đã đăng cập nhật trạng thái của riêng họ và mặc dù họ không đề cập rõ ràng đến AWS, nhưng có thể đường dẫn của các dịch vụ có thể giao nhau ở đâu đó trong quy trình.

AWS cung cấp nhiều tính năng hữu ích cho khách hàng, chẳng hạn như khả năng cho các trang web và ứng dụng tự động tăng giảm quy mô điện toán và công suất máy chủ khi cần thiết để xử lý các đợt tăng giảm lưu lượng truy cập. Nó cũng có các trung tâm dữ liệu trên khắp thế giới. Loại cơ sở hạ tầng đó rất hấp dẫn đối với các công ty phục vụ khán giả toàn cầu và cần trực tuyến suốt ngày đêm. Tính đến giữa năm 2025, ước tính thị phần của AWS trên thị trường cơ sở hạ tầng đám mây trên toàn thế giới là 30%. Nhưng những sự cố như thế này nhấn mạnh rằng việc chỉ dựa vào một vài nhà cung cấp để làm xương sống cho phần lớn Internet là một vấn đề.

Cập nhật ngày 20 tháng 10 năm 2025, 9:21 tối theo giờ ET: Câu chuyện này đã được cập nhật với bản cập nhật mới nhất của Amazon cho biết vấn đề đã được giải quyết.

Cập nhật, ngày 20 tháng 10 năm 2025, 10:57 sáng theo giờ ET: Câu chuyện này đã được cập nhật để bao gồm một danh sách ngắn các dịch vụ bị ảnh hưởng trong phần giới thiệu.

Cập nhật, ngày 20 tháng 10 năm 2025, 11:17 sáng theo giờ ET: Câu chuyện này đã được cập nhật để bao gồm một tham chiếu đến trang web cập nhật trạng thái của Reddit.

Cập nhật, ngày 20 tháng 10 năm 2025, 1:15 chiều theo giờ ET: Câu chuyện này đã được cập nhật để bao gồm một đoạn phản ánh trạng thái của các dịch vụ phổ biến như Lyft, Venmo và Alexa, dựa trên kinh nghiệm cá nhân của các biên tập viên của chúng tôi tính đến thời điểm này.

Cập nhật, ngày 20 tháng 10 năm 2025, 3:15 chiều theo giờ ET: Câu chuyện này đã được cập nhật để bao gồm một tuyên bố ngắn từ Amazon mô tả dòng thời gian của các sự kiện, thời điểm vấn đề cơ bản được giảm thiểu và những bộ phận nào của Amazon đã bị ảnh hưởng.

Cập nhật, ngày 20 tháng 10 năm 2025, 4:30 chiều theo giờ ET: Câu chuyện này đã được cập nhật để phản ánh trạng thái của các dịch vụ như Venmo và Lyft tính đến chiều thứ Hai.

Exit mobile version