News Time

Sự cố ngừng hoạt động của Microsoft Azure cho thấy thực tế khắc nghiệt về sự cố của đám mây

Đám mây Azure của Microsoft nền tảng, các dịch vụ 365, Xbox và Minecraft được sử dụng rộng rãi của nó bắt đầu ngừng hoạt động vào khoảng giữa trưa theo giờ miền Đông ngày thứ Tư, kết quả của những gì Microsoft cho biết là “một sự thay đổi cấu hình vô ý”. Sự cố—đánh dấu sự cố ngừng hoạt động của nhà cung cấp đám mây lớn thứ hai trong vòng chưa đầy hai tuần—làm nổi bật sự bất ổn của mạng Internet được xây dựng chủ yếu trên cơ sở hạ tầng do một số gã khổng lồ công nghệ điều hành.

Các vấn đề của Microsoft đặc biệt bắt nguồn từ mạng phân phối nội dung Front Door của Azure và xuất hiện chỉ vài giờ trước khi Microsoft công bố thu nhập theo lịch trình. Trang web của công ty, bao gồm cả trang quan hệ nhà đầu tư, vẫn không hoạt động vào chiều thứ Tư và trang trạng thái Azure nơi Microsoft cung cấp các bản cập nhật cũng gặp sự cố không liên tục.

Microsoft đã mô tả trong bản cập nhật trạng thái hôm thứ Tư rằng họ đã trải qua một quá trình tuần tự khôi phục các phiên bản gần đây của môi trường cho đến khi có thể xác định được cấu hình “tốt được biết đến lần cuối”. Vào lúc 3:01 chiều theo giờ ET, công ty cho biết họ đã xác định và thúc đẩy cấu hình ổn định này và “khách hàng có thể bắt đầu thấy những dấu hiệu phục hồi ban đầu. Chúng tôi hiện đang khôi phục các nút và định tuyến lưu lượng truy cập qua các nút khỏe mạnh.”

Người phát ngôn của Microsoft cho biết trong một tuyên bố: “Chúng tôi đang nỗ lực giải quyết một vấn đề ảnh hưởng đến Azure Front Door đang ảnh hưởng đến tính khả dụng của một số dịch vụ. Khách hàng nên tiếp tục kiểm tra Cảnh báo tình trạng dịch vụ của họ.” Công ty đã không trả lời ngay lập tức các câu hỏi từ WIRED về bản chất của việc thay đổi cấu hình gây ra tình trạng ngừng hoạt động.

Ngoài việc xảy ra vào ngày thu nhập của Microsoft, sự cố ngừng hoạt động còn diễn ra 9 ngày sau khi đối thủ Azure là Amazon Web Services gặp phải sự cố ngừng hoạt động lớn ảnh hưởng đến các trang web và dịch vụ trên toàn thế giới. Các nhà cung cấp đám mây lớn, thường được gọi là “nhà cung cấp siêu quy mô”, tiêu chuẩn hóa và thường cải thiện độ tin cậy cũng như bảo mật cơ bản cho khách hàng của họ, nhưng các vấn đề và sự cố ngừng hoạt động có thể khiến họ trở thành điểm thất bại duy nhất đối với một lượng lớn các dịch vụ kỹ thuật số quan trọng

Davi Ottenheimer, người quản lý hoạt động bảo mật và tuân thủ lâu năm đồng thời là phó chủ tịch của công ty cơ sở hạ tầng dữ liệu Inrupt, cho biết: “Ngay cả trang trạng thái ngừng hoạt động của Azure cũng không hoạt động”. “Một lỗi thay đổi cấu hình khác—chúng ta đang ở trong thời đại vi phạm tính toàn vẹn hơn bao giờ hết.”

Azure đã chặn khách hàng thực hiện các thay đổi cấu hình đối với phiên bản của họ trong khi giải pháp này đang giải quyết vấn đề. Công ty cho biết trong một bản cập nhật trạng thái lúc 3:22 chiều ET rằng họ dự kiến ​​sẽ “giảm thiểu hoàn toàn” tình hình trước 7:20 tối ET.

Munish Walther-Puri, giảng viên phụ trách tại IANS Research và cựu giám đốc rủi ro mạng của thành phố New York, cho biết: “Các tổ chức có thể nghĩ rằng họ được cách ly bởi sự lựa chọn nhà cung cấp đám mây, nhưng sự phụ thuộc ngày càng sâu sắc hơn”. “Khi các đối tác chính dựa vào các công cụ siêu quy mô khác, mức độ hiển thị sẽ tăng lên gấp bội. Khi AI trở thành lớp cơ sở hạ tầng quan trọng tiếp theo, những sự cố ngừng hoạt động này chứng tỏ sự mong manh của xương sống kỹ thuật số của chúng ta.”

Exit mobile version