사고 보고: 2월 20일 gcp 인프라 장애 (복구 완료)

2월 20일 05:17 KST (2월 19일 20:17 UTC)에 Google Cloud Platform(GCP) 이슈로 인해 일부 인프라 및 서비스에서 일시적인 중단이 발생했습니다.

이번 문제는 메인넷(Mainnet)과 카이로스(Kairos)의 일부 노드 및 엔드포인트, 그리고 Kaia Safe, Kaiascan, FeeDelegator 서비스의 일부 기능에 영향을 주었습니다.

중요한 점은, 이번 사건은 네트워크 장애가 아니었다는 것입니다. Kaia는 탈중앙화 네트워크로서, 사고 발생 동안에도 네트워크 자체는 정상적으로 운영되었습니다.

영향을 받은 모든 구성 요소는 2월 20일 09:12 KST (00:12 UTC)에 완전히 복구되었습니다.

자세한 내용은 아래 블로그 공지를 참고해 주세요:

1개의 좋아요

This incident highlights the importance of decoupling critical infrastructure from centralized cloud providers to improve resiliency. Implementing a more robust multi-cloud or hybrid deployment strategy would effectively mitigate these single points of failure for services like FeeDelegator and Kaiascan in the future.

The resilience of the network during this GCP outage confirms the effectiveness of the decentralized architecture, even if the surrounding tooling experienced temporary downtime. It might be worth exploring a multi-region or multi-cloud failover strategy for the RPC endpoints to mitigate these single-provider dependency risks in the future.

This incident highlights the inherent risks of relying on centralized cloud providers for RPC and explorer infrastructure. It’s a strong reminder that we need to prioritize more robust multi-cloud or hybrid node deployments to ensure these critical access points remain resilient even when a single provider hits an availability snag.