现代信息系统通常呈现出规模巨大、结构复杂、分布式架构等特点,这使得传统的系统监控方法难以满足全面观测和管理的需求,也为故障排查、性能优化和数据分析等任务带来了巨大的困难。可观测性技术因其在满足上述需求和解决相关困难方面的宝贵价值,备受各界关注。
可观测性技术有助于企业提升对系统内部的深度洞察能力,使其能够迅速发现问题、准确定位故障,并及时采取措施进行故障修复和性能优化。自2019年起,中国信息通信研究院(简称“中国信通院”)云计算与大数据研究所便致力于可观测性技术研究与应用推广,开展可观测性平台能力、可观测性能力建设成熟度评估,征集可观测性优秀案例。借助前期工作积累,充分考虑需求侧和供给侧的现状,中国信通院与业界多家头部机构合作,共同编制并于2023年12月27日发布了《可观测性技术发展研究报告(2023年)》。
报告探讨和解释了可观测性技术的概念、关键技术、落地路径和发展趋势,并深入分析了可观测性技术在故障排查、成本优化、数据分析等方面的应用和实践价值,旨在为读者提供有价值的指导和深入的理解。
报告主要内容
1. 可观测性概念及内核。可观测性在信息系统和云计算领域中被定义为通过系统的外部输出来度量系统内部运行状态的能力。其应用场景广泛,包括确保系统稳定性、提高用户体验、增强安全性、提高服务水平以及优化资源利用率等多个方面。日志、指标和链路追踪被认为是可观测性的基础,形成了其核心概念。此外,性能剖析、核心转储、事件数据,以及从广义的日志、指标和链路追踪中独立抽象出的更多可观测性数据,构成了更为丰富的可观测性内核。
2. 可观测平台能力构建。一是统一构建方式,采用一致的方法和工具来实现可观测性;二是统一数据模型,统一的数据模型是数据统一处理、相互建联与转化的基础;三是统一信息处理,包括信息的采集、整理、储存等;四是统一查询分析,可集中查询所有观测数据,并支持数据间跳转和链路上下文查询;五是统一内容消费,整合多源、多格式观测数据,以共享标准方式访问和分析;六是环境适配能力,平台需要具备易用性、适用性和稳定性;七是行业标准参考,可参考《云上软件系统稳定性 可观测性平台技术要求》等标准构建平台能力。
3. 可观测性应用场景及落地效果。可观测性可以应用于系统实验与测试场景、站点可靠性工程(SRE)场景、数据可观测场景、故障根因分析场景、云成本观测场景及安全可观测场景。通过多样的应用场景,提升基础设施的全面控制能力、实时洞察应用性能优化需求、理解用户需求和优化用户体验、精准控制变更并优化发布效果、洞悉业务状况并提升决策能力。
4. 可观测性发展趋势。在技术方面,可观测性将整合更为强大的人工智能与机器学习能力,实现对应用端到端的全面监控和管理,注重实时性和动态性,同时强调在安全性和隐私保护方面的应用。在生态方面,可观测性领域的人才需求迅速增长,技能要求更加综合。研究机构、行业用户和解决方案提供商之间的协作与合作将更为紧密,而不断涌现的可观测性领域开源项目和工具为行业提供了多样选择和技术支持。这一系列发展趋势将推动可观测性在各个领域发挥更为关键的作用。
报告目录
一、可观测性概述
(一) 可观测性定义
(二) 可观测性不是监控,是监控演进的下一阶段
(三) 可观测性应用场景广泛,多样价值获得认可
二、可观测性起源
(一) 可观测性起源
(二) IT技术持续发展为系统稳定运行带来巨大挑战
(三) 云时代到来,加速可观测性需求涌现
三、可观测性价值总体视图
四、可观测性的内核剖析
(一) 可观测性“三大支柱”
(二) 更多样的观测数据,持续丰富可观测性内核
五、可观测平台能力构建
(一) 统一构建方式
(二) 统一数据模型
(三) 统一信息处理
(四) 统一查询分析
(五) 统一内容消费
(六) 环境适配能力
(七) 行业标准参考
六、可观测性应用场景
(一) 系统实验与测试
(二) 站点可靠性工程(SRE)
(三) 数据可观测
(四) 故障根因分析
(五) 云成本可观测
(六) 安全可观测
七、可观测性落地效果
(一) 提升基础设施全面控制能力
(二) 实时洞察应用性能优化需求
(三) 理解用户需求和优化体验
(四) 精准控制变更并优化发布效果
(五) 洞悉业务状况并提升决策能力
八、可观测性发展趋势
(一) 可观测技术发展趋势
(二) 可观测产业生态趋势
主要专家简介
中国信通院云计算与大数据研究所工程师
刘坤
主要从事可观测性及系统稳定性保障领域技术研究工作,牵头完成《可观测性能力建设成熟度》等标准编制。
中国信通院云计算与大数据研究所工程师
王海清
主要从事系统稳定性保障领域技术及行业研究工作。曾牵头撰写多项稳定性保障领域行业标准及《可观测性技术发展研究报告》《分布式系统稳定性建设指南》;参与云服务运行安全领域政策、法规制定工作。
中国信通院云计算与大数据研究所云计算部副主任,工程师
郑立
从事云计算领域技术与行业研究工作,研究方向为系统稳定性、软件工程、云原生AI。牵头立项与编写包括《云上软件工程 可观测性平台能力要求》在内的近十项中国信息通信行业标准及多项国际标准;参与多项云计算领域、云服务运行安全领域政策、法规制定工作。
版权声明:本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,编者将追究其相关法律责任。
撰写团队联系方式:
中国信通院
云计算与大数据研究所
刘坤
18091965739
liukun1@caict.ac.cn
下载报告:http://www.caict.ac.cn/kxyj/qwfb/ztbg/202312/P020231229323602819435.pdf
声明:本文来自中国信通院CAICT,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。