제공
Exchanges

코인베이스, 서비스 중단 사태에 “용납할 수 없다”… CEO, 속도와 안정성 간 균형 모색 중

AWS 데이터센터의 냉각 시스템 장애로 인해 여러 거래 서비스가 중단되고 일부 계정 접속이 차단되며 고객 잔액 표시가 지연된 가운데, 코인베이스는 거래소 인프라를 재검토하고 있다. 브라이언 암스트롱 CEO는 이번 장애를 “용납할 수 없는 일”이라고 규정하며, 코인베이스가 인프라 장애 발생 시 속도, 코로케이션, 신속한 복구 사이의 균형을 재검토할 것이라고 밝혔다.

작성자
공유
코인베이스, 서비스 중단 사태에 “용납할 수 없다”… CEO, 속도와 안정성 간 균형 모색 중

Key Takeaways

  • 코인베이스의 브라이언 암스트롱 CEO는 AWS와 관련된 이번 거래소 서비스 중단을 고객 입장에서 용납할 수 없는 일이라고 밝혔다.
  • 코인베이스 거래소의 여러 서비스에서 거래, 계정 접속 및 고객 계정 정보 확인에 차질이 발생했다.
  • 코인베이스는 향후 장애 지속 시간과 고객 영향력을 줄이기 위해 복원력 관련 타협점을 재검토할 계획이다.

암스트롱 CEO, 복원력 관련 타협점 재검토 약속

암호화폐 거래소 코인베이스(나스닥: COIN)는 AWS 데이터 센터 냉각 시스템 장애가 어떻게 서비스 중단을 유발해 플랫폼 전반의 거래, 거래소 접속 및 고객 계정 데이터에 차질을 빚었는지 설명했다. 코인베이스의 브라이언 암스트롱 CEO는 X(구 트위터)를 통해 이번 사태에 대해 언급했으며, 엔지니어링 총괄인 롭 위토프는 복구 과정과 고객 영향에 대해 상세히 설명했다.

“어젯밤 코인베이스에서 서비스 중단 사태가 발생했는데, 이는 결코 용납될 수 없는 일입니다.” 암스트롱은 5월 8일 이렇게 적었습니다. 그는 대부분의 코인베이스 시스템이 AWS 가용 영역(AZ) 하나에서 다운타임이 발생해도 견딜 수 있도록 설계되었으나, 이번 중단 사태 당시 중앙 집중식 거래소는 예상대로 작동하지 않았다고 덧붙였습니다. “거래소를 AZ 장애에 견디게 만드는 것은 가능하지만, 이는 고객들의 공동 위치(co-location)를 깨뜨릴 뿐만 아니라 바람직하지 않은 지연 시간을 초래할 수 있습니다.”라고 암스트롱은 말하며 다음과 같이 덧붙였습니다.

“이번 사고를 계기로, 고객 여러분께 최상의 거래 환경을 제공하기 위해 이러한 상충 관계를 재검토할 것입니다. 최소한 가용성 영역(AZ) 이동이 필요할 때 중단 기간은 상당히 단축될 수 있어야 합니다.”

암스트롱은 코인베이스가 인프라 장애 발생 시 거래 속도, 고객 코로케이션, 복구 시간 간의 균형을 어떻게 맞출지 검토할 것이라고 언급했다. 그의 발언은 향후 고객 접속 및 거래 활동에 영향을 미치는 장애의 영향과 지속 시간을 줄이는 데 중점을 두었다.

코인베이스의 거래 및 잔고 업데이트 복구 과정

코인베이스 엔지니어링 책임자 롭 위토프(Rob Witoff)는 X(구 트위터)를 통해 5월 7일 늦은 시간 내부 시스템에 장애가 발생하기 시작하면서 긴급 대응팀이 조사에 착수했다고 게시했습니다. 이번 서비스 중단은 현물 거래, 프라임(Prime), 국제 거래소 및 파생상품 거래소에 영향을 미쳤습니다. 또한 고객들은 거래소 서비스 접속, 주문 체결, 계좌 잔액 확인에 어려움을 겪었습니다.

위토프는 인프라 장애 기간 동안 거래소 시스템이 안전하게 운영될 수 없게 되자 거래가 중단되었다고 설명했다. 또한 내부 메시징 시스템의 속도가 느려져 복구 과정이 완료될 때까지 일부 계정 정보에 지연이 발생했다고 언급했다. 그는 다음과 같이 인정했다:

“비록 일시적이라 할지라도 고객님의 계정에 접속할 수 없게 된 것은 용납할 수 없는 일입니다.”

복구는 일괄적으로 진행되지 않고 단계적으로 이루어졌습니다. 코인베이스는 영향을 받은 워크로드를 문제 발생 지역에서 분리하고, 거래 처리에 필요한 시스템을 복구한 뒤, 지연되었던 고객 데이터가 정상화되도록 조치했습니다. 시장은 '취소 전용 모드'로 시작해 제품 점검, 경매 모드를 거쳐 코인베이스 거래소의 거래가 완전히 재개되는 순서로 신중하게 재개되었습니다.

코인베이스, 서비스 중단 원인으로 AWS 다중 지역 장애 지목

코인베이스, 서비스 중단 원인으로 AWS 다중 지역 장애 지목

코인베이스는 AWS 장애로 인해 오류가 여러 리전에 확산되면서 핵심 거래 서비스가 중단되었다고 밝혔다. 이 회사는 이번 서비스 중단의 원인을 AWS의 use1-az4 리전으로 추적했다. read more.

지금 읽기
이 기사의 태그