Google Cloud gần đây đã phát hành Thanh tra lịch sử Kubernetes (KHI), một công cụ nguồn mở miễn phí, giúp các nhà phát triển và kỹ sư nền tảng hiểu được các hệ thống phân tán bằng cách sắp xếp các bản ghi và sự kiện trên các cụm thành thời gian trực quan thống nhất. href=”https://github.com/googlecloudplatform/khi”Target=”_ blank”> qua github . Các thành phần.

Theo Kho lưu trữ GitHub, Khi hiện hỗ trợ các sự kiện Kubernetes, nhật ký kiểm toán GKE và số liệu Prometheus, với tùy chọn ăn bản ghi tùy chỉnh thông qua các đường ống OpenTelemy. Tạo. Được xây dựng với React và D3.js, giao diện cho phép người dùng di chuyển qua các mục dòng thời gian lên siêu dữ liệu theo ngữ cảnh bề mặt, điều gì đã kích hoạt sự kiện này, thành phần nào bị ảnh hưởng và liệu nó có liên quan đến hoạt động hệ thống rộng hơn hay không. Nó giúp các kỹ sư nền tảng và chủ sở hữu dịch vụ tương quan và trực quan hóa những gì đã xảy ra trên cơ sở hạ tầng của họ. Postmortem nội bộ bằng cách cho thấy các sự kiện diễn ra như thế nào trong thời gian thực thay vì yêu cầu các kỹ sư phải thời gian tham chiếu chéo theo cách thủ công. Mặc dù nó không được thiết kế để phát hiện sự bất thường hoặc thay thế các bảng điều khiển số liệu, nhưng KHI vượt trội trong việc kết nối các dấu chấm giữa các bản ghi phân mảnh khác. Công cụ có thể được khởi chạy cục bộ bằng Docker hoặc được triển khai trực tiếp vào cụm bằng cách sử dụng Helm, với các hướng dẫn thiết lập có sẵn trong Nhật ký kiểm toán Kubernetes Engine (GKE). Bởi vì công cụ tổng hợp nhật ký từ nhiều nguồn và trực quan hóa chúng đồng thời, các cụm phát ra số lượng lớn sự kiện mỗi giây có thể trải nghiệm tắc nghẽn hiệu suất mà không cần cấu hình cẩn thận. Google đã không công bố điểm chuẩn hoặc kiểm tra căng thẳng để giải quyết mối quan tâm này.

Tuy nhiên, đối với nhiều người dùng, sự đánh đổi là xứng đáng. Bằng cách cho phép các kỹ sư nhanh chóng phóng to vào một cửa sổ thất bại nghiêm trọng và xem chuỗi các hành động trên các dịch vụ, KHI làm giảm chi phí tinh thần của các hệ thống phân tán gỡ lỗi, một nhiệm vụ thường yêu cầu nhật ký, số liệu và các báo cáo sự cố mơ hồ. Việc sử dụng sản xuất trước khi được phát hành cho cộng đồng rộng lớn hơn. Target=”_ Blank”> Gvisor , Kernel không gian người dùng cho hộp cát container. Các công cụ này phản ánh xu hướng rộng hơn: Google đang liên tục định vị không chỉ là nhà cung cấp cơ sở hạ tầng đám mây mà còn là người tạo ra các công cụ thiết yếu cho các kỹ sư nền tảng. Thay vào đó, nó lấp đầy một khoảng cách cụ thể, các kỹ sư giúp các kỹ sư hiểu được sự thất bại diễn ra như thế nào theo thời gian, thay vì những gì đã sai. Sự rõ ràng đó có thể tạo ra sự khác biệt trong kịch bản ứng phó sự cố áp suất cao, đặc biệt là khi có nhiều dịch vụ hoặc thay đổi. Trong các cụm có khối lượng nhật ký cực cao hoặc thực hành khai thác có cấu trúc kém, dòng thời gian có thể trở nên ồn ào hoặc quá sức. Khi giả định rằng các nhóm đã thiết lập một nền tảng quan sát được tổ chức hợp lý và các bản ghi đang được thu thập và định tuyến một cách hiệu quả thông qua các hệ thống như openTelemetry. Đối với các nhà phát triển và SRE đang tìm cách giảm thời gian giải quyết mà không cần lội qua hàng ngàn dòng nhật ký thô, KHI có thể là người bạn đồng hành thực tế, nhẹ với các công cụ hiện có và một bước để làm cho Kubernetes trở nên dễ đọc hơn một chút.

Categories: IT Info