Internet khởi đầu tuần mới theo cách mà nhiều người trong chúng ta thường cảm thấy thích làm: từ chối đi làm. Sự cố ngừng hoạt động tại Amazon Web Services khiến một phần lớn Internet không thể truy cập được vào sáng thứ Hai, với các trang web và dịch vụ bao gồm Snapchat, Fortnite, Venmo, PlayStation Network và có thể dự đoán là Amazon sẽ không khả dụng trong một khoảng thời gian ngắn.
Sự cố ngừng hoạt động bắt đầu ngay sau nửa đêm theo giờ PT và Amazon phải mất khoảng 3,5 giờ để giải quyết hoàn toàn. Mạng xã hội và dịch vụ phát trực tuyến nằm trong số hơn 1.000 công ty bị ảnh hưởng và các dịch vụ quan trọng như ngân hàng trực tuyến cũng bị gỡ xuống. Sáng nay, bạn có thể thấy hầu hết các trang web và dịch vụ đều hoạt động như bình thường nhưng có thể sẽ thấy một số hiệu ứng dây chuyền trong suốt cả ngày.
AWS, nhà cung cấp dịch vụ đám mây thuộc sở hữu của Amazon, hỗ trợ phần lớn Internet. Vì vậy, khi nó ngừng hoạt động, nó đã lấy đi nhiều dịch vụ mà chúng tôi biết và yêu thích. Như với nhanh chóng Và Cuộc tấn công của đám đông ngừng hoạt động trong vài năm qua, sự cố ngừng hoạt động của AWS cho thấy mức độ Internet phụ thuộc vào cùng một cơ sở hạ tầng — và quyền truy cập của chúng tôi vào các trang web và dịch vụ mà chúng tôi dựa vào có thể bị thu hồi nhanh đến mức nào khi có sự cố. Việc phụ thuộc vào một số ít các công ty lớn để củng cố trang web cũng giống như việc bỏ tất cả trứng vào một số ít giỏ nhỏ.
Khi nó hoạt động thì thật tuyệt, nhưng chỉ cần một sai sót nhỏ là Internet sẽ ngừng hoạt động chỉ sau vài phút.
Sự cố ngừng hoạt động của AWS lan rộng đến mức nào?
Ngay sau nửa đêm ngày 20 tháng 10, AWS lần đầu tiên đăng ký sự cố trên trang trạng thái dịch vụcho biết họ đang “điều tra tỷ lệ lỗi và độ trễ gia tăng đối với nhiều dịch vụ AWS ở Khu vực US-EAST-1.” Khoảng 2 giờ sáng theo giờ Thái Bình Dương, họ cho biết họ đã xác định được nguyên nhân gốc rễ tiềm ẩn của vấn đề và trong vòng nửa giờ, họ đã bắt đầu áp dụng các biện pháp giảm nhẹ để mang lại những dấu hiệu phục hồi đáng kể.
AWS cho biết lúc 3h35 sáng theo giờ Thái Bình Dương: “Vấn đề DNS cơ bản đã được giảm thiểu hoàn toàn và hầu hết các hoạt động của Dịch vụ AWS hiện đang hoạt động bình thường”. Công ty đã không trả lời yêu cầu bình luận thêm ngoài việc hướng chúng tôi quay lại bảng thông tin tình trạng AWS.
Vào khoảng thời gian AWS cho biết họ bắt đầu nhận thấy tỷ lệ lỗi lần đầu tiên, Down detector nhận thấy các báo cáo bắt đầu tăng đột biến trên nhiều dịch vụ trực tuyến, bao gồm ngân hàng, hãng hàng không và nhà cung cấp dịch vụ điện thoại. Khi AWS giải quyết vấn đề, một số báo cáo này đã giảm xuống, trong khi những báo cáo khác vẫn chưa trở lại bình thường. (Tiết lộ: Down detector thuộc sở hữu của cùng một công ty mẹ với CNET, Ziff Davis.)
Khoảng 4 giờ sáng theo giờ Thái Bình Dương, Reddit vẫn ngừng hoạt động, trong khi các dịch vụ bao gồm Ring, Verizon và YouTube vẫn gặp phải một số lượng đáng kể các sự cố được báo cáo. Reddit cuối cùng đã trực tuyến trở lại vào khoảng 4h30 sáng theo giờ Thái Bình Dương, theo trang trạng thái của nó, sau đó đã được chúng tôi xác minh.
Tổng cộng, Down detector đã nhận được hơn 6,5 triệu báo cáo, trong đó 1,4 triệu đến từ Mỹ, 800.000 đến từ Anh và phần còn lại phần lớn trải rộng khắp Australia, Nhật Bản, Hà Lan, Đức và Pháp. DownDetector cho biết thêm, tổng cộng hơn 1.000 công ty đã bị ảnh hưởng.
Daniel Ramirez, Giám đốc sản phẩm của Ookla, Down detector của Ookla, nói với CNET: “Loại ngừng hoạt động này, trong đó một dịch vụ internet nền tảng làm sập một lượng lớn các dịch vụ trực tuyến, chỉ xảy ra một số lần trong một năm”. “Chúng có lẽ đang trở nên thường xuyên hơn một chút vì các công ty được khuyến khích hoàn toàn dựa vào dịch vụ đám mây và kiến trúc dữ liệu của họ được thiết kế để tận dụng tối đa nền tảng đám mây cụ thể.”
Điều gì gây ra sự cố ngừng hoạt động của AWS?
AWS chưa chia sẻ đầy đủ chi tiết về nguyên nhân khiến Internet rơi xuống vực sáng nay. Có khả năng là hiện tại nó đã triển khai bản sửa lỗi, bước tiếp theo sẽ là điều tra xem điều gì đã xảy ra.
Cho đến nay, sự cố ngừng hoạt động được cho là do “sự cố DNS”. DNS là viết tắt của Hệ thống tên miền và đề cập đến dịch vụ chuyển các địa chỉ Internet mà con người có thể đọc được (ví dụ: CNET.com) thành địa chỉ IP có thể đọc được bằng máy, kết nối trình duyệt với các trang web.
Khi xảy ra lỗi DNS, quá trình dịch thuật không thể diễn ra, làm gián đoạn kết nối. Lỗi DNS thường gặp là những rào cản internet phổ biến, nhưng thường xảy ra ở quy mô nhỏ, ảnh hưởng đến các trang web hoặc dịch vụ riêng lẻ. Nhưng vì việc sử dụng AWS quá phổ biến nên lỗi DNS có thể gây ra hậu quả phổ biến không kém.
Theo Amazon, vấn đề này bắt nguồn từ mặt địa lý ở khu vực US-EAST-1, đề cập đến khu vực Bắc Virginia, nơi có nhiều trung tâm dữ liệu của Amazon. Đây là một vị trí quan trọng đối với Amazon cũng như nhiều công ty internet khác và nó hỗ trợ các dịch vụ trải rộng khắp Hoa Kỳ và Châu Âu.
Luke Kehoe, nhà phân tích ngành tại Ookla cho biết: “Bài học ở đây là khả năng phục hồi”. “Nhiều tổ chức vẫn tập trung khối lượng công việc quan trọng vào một vùng đám mây duy nhất. Việc phân phối các ứng dụng và dữ liệu quan trọng trên nhiều vùng và vùng khả dụng có thể giảm đáng kể bán kính bùng nổ của các sự cố trong tương lai.”
Sự cố ngừng hoạt động của AWS có phải do một cuộc tấn công mạng gây ra không?
Sự cố DNS có thể do tác nhân độc hại gây ra nhưng ở giai đoạn này không có bằng chứng nào cho thấy đây là trường hợp ngừng hoạt động của AWS.
Tuy nhiên, các lỗi kỹ thuật có thể mở đường cho tin tặc tìm kiếm và khai thác các lỗ hổng khi các công ty quay lưng và hệ thống phòng thủ bị suy giảm, theo Marijus Briedis, CTO tại NordVPN. Ông nói trong một tuyên bố: “Đây là một vấn đề an ninh mạng cũng như vấn đề kỹ thuật”. “Bảo mật trực tuyến thực sự không chỉ là ngăn chặn tin tặc mà còn là đảm bảo bạn có thể duy trì kết nối và được bảo vệ khi hệ thống gặp sự cố.”
Briedis nói thêm rằng trong những giờ tới, mọi người nên đề phòng những kẻ lừa đảo nhằm lợi dụng nhận thức của mọi người về việc ngừng hoạt động. Bạn nên hết sức cảnh giác với các cuộc tấn công lừa đảo và email yêu cầu bạn thay đổi mật khẩu để bảo vệ tài khoản của mình.

