挑战
美国保险监管官员协会(NAIC)是美国标准制定和监管支持机构,正在寻找一种方法来更快地交付新服务,为会员和员工提供更多价值。它还需要更高的敏捷性来提高内部生产力。
解决方案
从 2016 年开始,他们开始使用云原生计算基金会(CNCF)的工具,例如 Prometheus。NAIC 从 2018 年初开始在 Kubernetes 上托管内部系统和开发系统,作为向公有云的广泛转变的一部分。“我们的文化和技术转型是我们的最高领导者所采用的战略,”首席企业架构师丹·巴克说。“它已经证明了它的成功,使我们能够将价值管道加速两倍以上,同时将成本降低一半以上。随着我们在这些新技术中添加越来越多的应用程序,我们还看到客户满意度不断提高。”
影响
利用 Kubernetes,“我们的开发团队可以创建比以往快得多的快速原型,”巴克说。运行在 Kubernetes 上的应用程序比运行在其他环境中的应用程序更具弹性。开源解决方案的部署有助于影响公司文化,因为 NAIC 正在成为一个更开放和透明的组织。
“我们在两天内完成了一个小型原型,而以前至少要花一个月的时间,”巴克说。弹性目前衡量的是系统有多少停机时间。“它们基本上没有停机时间,偶尔出现的问题会在几分钟内解决,”他说。
NAIC 由 50 个州、哥伦比亚特区和 5 个美国领地的首席保险监管机构创建和监督,提供了一种手段,通过该手段,州保险监管机构可以制定标准和最佳实践、进行同行评审以及协调他们的监管监督。他们的工作人员支持这些工作,并代表美国和国际监管机构的集体意见。NAIC 成员以及该组织的中央资源共同构成了美国基于州的保险监管的国家体系。
该组织多年来一直在使用云,并希望找到更多方法来快速交付为会员和员工提供更多价值的新服务。他们寻求 Kubernetes 来寻找解决方案。在 NAIC 内部,有几个小组正在利用 Kubernetes,其中之一是平台工程团队。“构建这些工具的团队不仅在部署和运行 Kubernetes,而且还在使用它们,”巴克说。“事实上,我们正在使用 GitLab 通过使用 kops 的管道部署 Kubernetes。这个团队是由来自公司各部门的开发人员、运营人员和质量工程师组成的,因此他们的工作发生了很大变化。”
此外,NAIC 正在将团队加入新平台,这些团队已经看到了他们在工作方式和工作内容方面的巨大变化。“他们现在拥有更多权力来创建自己的基础设施并部署自己的应用程序,”巴克说。他们还使用管道来促进他们当前的手动流程。NAIC 拥有大量使用 GitLab 的用户,他们开始使用 Kubernetes 部署帮助他们内部流程的简单应用程序。
“我们需要更高的敏捷性来提高我们自己的内部生产力,”他说。“我们认为,将所有内容迁移到公有云(亚马逊网络服务)是正确的选择,这将有助于该流程,并使我们能够访问许多原生工具,这些工具使我们能够通过不需要构建所有内容来更快地移动。”NAIC 还希望成为云无关的,“而 Kubernetes 帮助我们解决了计算层的这一问题,”巴克说。“计算在云之间是相当标准的,现在我们可以利用任何云,同时获得 Kubernetes 提供的所有其他功能。”
NAIC 目前在 Kubernetes 上托管内部系统和开发系统,并且已经看到了它的影响力。“我们的开发团队可以在几分钟内而不是几周内创建快速原型,”巴克说。“最近发生在内部工具中,该工具在基础设施上没有可衡量的等待时间。它完全受开发限制。现在有一个中心共享资源位于 AWS 中,这意味着它可以根据需要增长。”
NAIC 中对 Kubernetes 的原生集成使得编写代码并使其在几分钟而不是几周内运行变得容易。运行在 Kubernetes 上的应用程序也被证明比运行在其他环境中的应用程序更具弹性。“我们甚至有团队使用它来创建更多内部工具,以帮助进行沟通或自动化他们当前的一些任务,”巴克说。
“我们知道 Kubernetes 已成为容器编排的事实标准,”他说。“选择它的两个主要因素是三大云供应商都托管了自己的版本,并且它作为完全开源的软件托管在中立方。”
至于其他 CNCF 项目,NAIC 正在小规模使用 Prometheus,并希望继续使用它,因为它与 Kubernetes 无缝集成。该协会还在考虑将 gRPC 作为其内部通信标准,将 Envoy 与 Istio 结合使用来进行服务网格,将 OpenTracing 和 Jaeger 用于跟踪聚合,以及将 Fluentd 与其 Elasticsearch 集群结合使用。
巴克说,CNCF 中的开放治理和广泛的行业参与提供了对该技术的舒适度。“我们还认为它有助于影响我们自己的公司文化,”他说。“我们正在努力成为一个更开放和透明的公司,我们鼓励我们的员工参与不同的工作组和代码库。我们最近成为 CNCF 会员,以帮助进一步推进我们对社区贡献和透明度的承诺。”
供应商中立和跨行业投资等因素在选择中起着重要作用。“根据我们的经验,供应商锁定和高度特定的工具会导致更不稳定的技术,导致解决问题和发展社区的人员减少,”巴克说。
巴克说,NAIC 主要是一个 Oracle 商店,并且一直在 JBoss 上运行大部分 Java。“但是,我们在其他应用程序方面拥有多年的历史,”他说。“其中一些是通过完全重写应用程序来迁移的,而另一些只是稍微修改以适应这种新的范式。”
在 AWS 云上运行,该协会没有专门采用微服务方法。“我们在实际情况下正在转向微服务,但我们还没有发现它在 Kubernetes 中运行的必要性,”巴克说。
他们目前所有数据库都运行在公有云服务中,但他们已经探索过最终在 Kubernetes 中运行这些数据库,因为这样做是有意义的。“我们这样做是为了从通用组件中获得更多重用,并将我们的故障域限制在更易于管理和观察的范围内,”巴克说。
NAIC 已经看到了其努力带来的显著业务影响。“我们能够以比过去更低的成本更快地移动,”巴克说。“我们能够在一年的时间内完成一个项目,而以前的版本花了超过两年的时间。而且新项目的成本为 50 万美元,而原始项目需要 300 万美元,并且缺陷更少。我们还能够更快地推出新功能。”
他说,该组织正在转向持续部署,“因为商业案例是有意义的。研究越来越难反驳。我们希望减少批次大小,并优化为客户提供价值,而不是功能数量。这需要更大的文化转变,而不仅仅是技术转变。”
NAIC 正在“变得更加开放和透明,以及对故障更具弹性,”巴克说。“甚至我们的客户也越来越多地想要这一点,并试图弄清楚如何与我们合作,更快地实现我们的共同目标。保险行业的成员已经伸出援手,以便我们能够更好地一起学习并作为行业发展。”