golang性能分析及监控

pprof、线上内存泄露分析、prometheus、pyroscope、grafana

一、系统自带工具：pprof

go中提供了pprof包来做代码的性能监控，在两个地方有包：

net/http/pprof
runtime/pprof

其实net/http/pprof中只是使用runtime/pprof包来进行封装了一下，并在http端口上暴露出来。

使用 net/http/pprof 做WEB服务器的性能监控

import _ “net/http/pprof”

然后就可以在浏览器中使用http://localhost:port/debug/pprof/ 直接看到当前web服务的状态，包括CPU占用情况和内存使用情况等。

1、堆栈信息

2、火焰图

火焰图横轴的长度代表执行的时间，横轴越长执行时间越长，

纵轴代表代码的调用栈

3、goroutine信息

4、线上内存泄露分析

使用go tool pprof 进入交互命令行

二、第三方加强工具

1、开发压测利器：pyroscope + ab

进行后端业务接口开发时，在保证业务逻辑正确的同时，也应关注代码的性能，我们当然可以使用benchmark测试及生成火焰图来进行测试，但是在开发时，这种方式不够便捷，pyroscope 可以生成实时CPU火焰图，用于观察接口CPU的使用情况，结合linux ab压测工具，能快速便捷的找到低性能代码，同时结合benchmark，用于做优化前后的详细性能对比

下图为模拟高CPU操作的函数测试图：

安装及使用

pyroscope文档

github地址：https://github.com/pyroscope-io/pyroscope
快速开始：https://pyroscope.io/docs/

ab压测工具：https://blog.csdn.net/u011415782/article/details/78501799

根据https://pyroscope.io/docs/ 我们可以轻易在系统中集成pyroscope，本文使用docker方式进行安装：

在go代码中集成pyroscope：

2、企业化监控解决方案：prometheus + grafana

参考资料：

https://www.cnblogs.com/chenqionghe/p/10494868.html
https://www.cnblogs.com/fatyao/p/11007357.html
http://studyiris.com/example/exper/prometheus.html

(1) Prometheus的特点

多维度数据模型。
灵活的查询语言。
不依赖分布式存储，单个服务器节点是自主的。
通过基于HTTP的pull方式采集时序数据。
可以通过中间网关进行时序列数据推送。
通过服务发现或者静态配置来发现目标服务对象。
支持多种多样的图表和界面展示，比如Grafana等。

官网地址：https://prometheus.io/

(2) 架构图

(3) 基本原理

Prometheus的基本原理是通过HTTP协议周期性抓取被监控组件的状态，任意组件只要提供对应的HTTP接口就可以接入监控。不需要任何SDK或者其他的集成过程。这样做非常适合做虚拟化环境监控系统，比如VM、Docker、Kubernetes等。输出被监控组件信息的HTTP接口被叫做exporter 。目前互联网公司常用的组件大部分都有exporter可以直接使用，比如Varnish、Haproxy、Nginx、MySQL、Linux系统信息(包括磁盘、内存、CPU、网络等等)。

(4) 服务过程

Prometheus Daemon负责定时去目标上抓取metrics(指标)数据，每个抓取目标需要暴露一个http服务的接口给它定时抓取。Prometheus支持通过配置文件、文本文件、Zookeeper、Consul、DNS SRV Lookup等方式指定抓取目标。Prometheus采用PULL的方式进行监控，即服务器可以直接通过目标PULL数据或者间接地通过中间网关来Push数据。
Prometheus在本地存储抓取的所有数据，并通过一定规则进行清理和整理数据，并把得到的结果存储到新的时间序列中。
Prometheus通过PromQL和其他API可视化地展示收集的数据。Prometheus支持很多方式的图表可视化，例如Grafana、自带的Promdash以及自身提供的模版引擎等等。Prometheus还提供HTTP API的查询方式，自定义所需要的输出。
PushGateway支持Client主动推送metrics到PushGateway，而Prometheus只是定时去Gateway上抓取数据。
Alertmanager是独立于Prometheus的一个组件，可以支持Prometheus的查询语句，提供十分灵活的报警方式。