Odaily星球日报讯 zkSync团队公布了宕机原因。由于区块队列数据库发生故障,导致出块停止。尽管如此,服务器API未受到影响。交易继续被添加到内存池,查询服务正常。尽管所有组件都有全面的监控、日志记录和警报,但由于API正常运行,所以没有触发警报。
事故发生时,整个团队都不在线。修复在5分钟内实现。为解决类似问题,zkSync赋予数据库监控代理一个特殊角色,使它们能够连接到数据库并持续收集指标。与此同时,团队引入了警报机制,当数据库监控代理发生故障或无法与数据库建立连接时将发出警报。此外,如果事态严重升级,随时待命的团队会通过多个渠道立刻获得通知。但唯一的长期解决方案是去中心化。