Pinapagana ng
Exchanges

Sinabi ng Coinbase na ang pagkaantala sa serbisyo ay ‘Hindi Katanggap-tanggap’ habang tinitimbang ng CEO ang mga kompromiso sa pagitan ng bilis at katatagan

Sinusuri ng Coinbase ang imprastraktura ng exchange nito matapos ang pagkabigo ng cooling system sa isang AWS data center na nagpatigil sa ilang serbisyo sa pangangalakal, humarang sa ilang pag-access sa account, at nagpaantala sa pagpapakita ng balanse ng customer. Tinawag ni CEO Brian Armstrong ang outage na “hindi katanggap-tanggap” at sinabi niyang muling titingnan ng Coinbase ang mga tradeoff tungkol sa bilis, co-location, at mas mabilis na pagbangon kapag may mga pagkabigo sa imprastraktura.

ISINULAT NI
IBAHAGI
Sinabi ng Coinbase na ang pagkaantala sa serbisyo ay ‘Hindi Katanggap-tanggap’ habang tinitimbang ng CEO ang mga kompromiso sa pagitan ng bilis at katatagan

Key Takeaways

  • Tinawag ni Coinbase CEO Brian Armstrong na hindi katanggap-tanggap para sa mga customer ang AWS-linked na outage ng exchange.
  • Naantala ang pangangalakal, pag-access sa account, at impormasyon ng customer account sa ilang serbisyo ng Coinbase exchange.
  • Plano ng Coinbase na muling suriin ang mga tradeoff sa resiliency upang mabawasan ang tagal ng mga susunod na outage at ang epekto nito sa customer.

Sabi ni Armstrong, Susuriin ang mga Tradeoff sa Resiliency

Ipinaliwanag ng crypto exchange na Coinbase (Nasdaq: COIN) kung paano nagdulot ang pagkabigo ng cooling system sa isang AWS data center ng service outage na gumambala sa pangangalakal, pag-access sa exchange, at data ng customer account sa buong platform. Tinalakay ni Coinbase CEO Brian Armstrong ang insidente sa X, habang inilahad naman ng engineering lead na si Rob Witoff ang proseso ng pagbawi at ang naging epekto sa customer.

“Nakaranas kami ng outage sa Coinbase kagabi, na hindi kailanman katanggap-tanggap,” isinulat ni Armstrong noong Mayo 8. Idinagdag niya na ang karamihan sa mga sistema ng Coinbase ay dinisenyo upang makayanan ang downtime sa isang AWS Availability Zone, ngunit hindi ganoon ang naging tugon ng centralized exchange sa panahon ng outage. “Posibleng gawing resistant ang mga exchange sa mga AZ failure, pero maaari itong magdala ng mga delay sa latency na hindi kanais-nais, kasama ang pagkasira ng customer co-location,” pahayag ni Armstrong, at idinagdag:

“Dahil sa insidenteng ito, muling titingnan namin ang mga tradeoff na ito upang matiyak na ibinibigay namin sa inyo ang pinakamahusay na posibleng venue para mag-trade. Sa pinakamababa, ang tagal ng isang outage ay dapat na mabawasan nang malaki kapag kinakailangan ang isang AZ move.”

Binanggit ni Armstrong na rerepasuhin ng Coinbase kung paano nito binabalanse ang bilis ng exchange, customer co-location, at oras ng pagbawi matapos ang mga pagkabigo sa imprastraktura. Nakatuon ang kanyang mga komento sa pagbawas ng epekto at tagal ng mga susunod na outage na nakakaapekto sa pag-access ng customer at aktibidad sa pangangalakal.

Paano Ipinanumbalik ng Coinbase ang Trading at mga Update sa Balanse

Ibinahagi ng engineering lead ng Coinbase na si Rob Witoff sa X na nagsimula ang pagkaabala bandang huli ng Mayo 7, nang magsimulang mag-fail ang mga internal system at nagsimulang magsiyasat ang mga emergency team. Naapektuhan ng outage ang spot trading, Prime, International, at derivatives exchanges. Nakaranas din ang mga customer ng mga problema sa pag-access sa mga serbisyo ng exchange, paglalagay ng trades, at pagtingin ng mga balanse sa account.

Ipinaliwanag ni Witoff na itinigil ang pangangalakal matapos hindi na makapagpatuloy na ligtas ang mga exchange system habang may pagkaabala sa imprastraktura. Binanggit din niya na bumagal ang mga internal messaging system, na naging sanhi upang mahuli ang ilang impormasyon sa account hanggang sa makahabol ang proseso ng pagbawi. Kinilala niya:

“Ang mawalan ng access sa inyong account, kahit pansamantala, ay hindi katanggap-tanggap.”

Isinagawa ang pagbawi nang pa-yugto sa halip na sabay-sabay. Inilipat ng Coinbase ang mga apektadong workload palayo sa problemadong lugar, ibinalik ang mga sistemang kailangan upang magproseso ng trades, at hinayaang makahabol ang naantalang data ng customer. Maingat na muling binuksan ang mga merkado, nagsimula sa cancel-only mode, sinundan ng mga product check, auction mode, at saka naibalik ang pangangalakal sa Coinbase Exchange.

Itinuturo ng Coinbase ang mga pagkabigo ng AWS sa maraming sona bilang sanhi ng outage

Itinuturo ng Coinbase ang mga pagkabigo ng AWS sa maraming sona bilang sanhi ng outage

Sinabi ng Coinbase na ang mga pagkabigo ng AWS ay nakagambala sa mga pangunahing serbisyo ng pangangalakal matapos kumalat ang mga error sa maraming zone. Natunton ng kumpanya ang outage sa use1-az4 sa AWS’s read more.

Basahin ngayon
Mga tag sa kwentong ito