您的工程师应该负责建造,而不是照看孩子
工程团队因随叫随到的监督、分类循环、重复回归以及代理可以在几秒钟内准备的工作而浪费了太多的产品时间。
阅读文章
关于生产调试、事件修复、可观察性、人工智能辅助修复以及自我修复软件背后的工程工作流程的实用写作。
为领导者和工程师构建更平静、更快速的生产修复循环提供现场笔记。
将这些作为工程领导者、SRE 和评估自动修复的团队的持久参考。
工程团队因随叫随到的监督、分类循环、重复回归以及代理可以在几秒钟内准备的工作而浪费了太多的产品时间。
阅读文章对于人工智能辅助修复,最有用的操作指标可能是生产信号多快成为有证据支持的拉取请求,可供审查。
阅读文章当工作流程考虑可逆性、爆炸半径并在合并补丁之前审查证据时,人工智能生成的生产修复变得更加安全。
阅读文章
随着上下文衰退、支持负载复合、版本冻结,并且修复变得更难以审查,生产错误变得更加昂贵。
阅读文章
值班工作应该从准备好的事件简介开始,而不是由疲惫的工程师手动将日志、跟踪、部署和代码所有权拼接在一起。
阅读文章一种实用模型,用于使用人工智能起草生产修复程序,同时将证据、审查、测试和所有权掌握在工程师手中。
阅读文章实用的工作流程,用于从嘈杂的生产警报转移到工程师可以审查、合并和信任的代码级修复。
阅读文章可观察性告诉团队失败的原因;代码上下文解释了在哪里修复它。以下是如何连接日志、跟踪、所有权和拉取请求。
阅读文章