VictoriaMetrics 尝鲜

嗅叽 · 1 小时前

前言

前段时间逛别人的博客看到有对 VictoriaMetrics 的推荐，看了下其特性，感觉还挺有意思，遂自己搭建一个玩玩。
目前我使用过的监控方案有：

Zabbix。很多年前简单上手过，当时版本貌似还是 4，印象中性能比较差，接盘一周后就换成了 Prometheus。
Prometheus。作为 CNCF 的毕业项目，社区非常成熟，其本身性能也不错，除非有成千上万个节点，否则单点 Prometheus 就够用了。问题是 Prometheus 官方只支持单点，扩展起来不方便。以前个人做过的一个方案就是在 kubernetes 里再部署一个 ceph 来保证数据高可用。还有个问题是不少环境有很严格的防火墙规则，即便内网也只开放必要端口，这样就需要使用 push-gateway。
Telegraf + Kafka + InfluxDB。Telegraf 采集数据 push 到 kafka，然后再有个服务去消费 kafka 消息并写到 influxdb。这种架构只解决了上面说的网络问题。我们当时用的是开源版的 InfluxDB，不支持集群部署，而单点 InfluxDB 的性能有点捉急，经常被查崩。
Telegraf + Mimir。Telegraf 直接 push 到 Mimir。因为 Mimir 由另一个团队维护，我也不太清楚 mimir 在生产环境的资源消耗情况。我自己在虚拟机上搭建一个 mimir，没什么数据，但感觉还是复杂了点。对于 Grafana 家的东西，除了 Grafana 这个产品，我对 Loki 和 mimir 都没什么好印象。

基于 Prometheus 的架构一般是 pull 模式，需要被监控目标提供一个接口来暴露自身 metrics，市面上的成熟产品大多都有相应的 exporter。而 Telegraf 的架构一般就是 push 模式，不需要对外暴露接口，而且 telegraf 本身就支持很多 input 和 output 的 plugin，常见需求基本都能满足。两种模式各有各的好处，可以根据实际需求来决定。
作为尝鲜，本文将采用 Telegraf + VictoriaMetrics (cluster) + Grafana 的架构，暂时不考虑告警功能。其中 VictoriaMetrics 采用集群部署，也就是分别部署读节点、写节点、存储节点和 auth 节点。（只是分开部署，实际还是 docker-compose 在本地部署）
Versions:

Telegraf: 1.35
VictoriaMetrics: v1.132.0, cluster 版
Grafana: 12.2.0
Docker: 29.1.3
Docker-compose: v5.0.0

配置 docker-compose

下面的 docker-compose 文件中编排了 6 个服务：

vmstorage: 存储节点
vminsert: 写节点
vmselect: 读节点
vmauth: 提供用户认证和读写分离的负载均衡功能
telegraf: 数据采集器
grafana: 数据可视化

创建好 docker-compose.yaml 文件后，别急着启动，先执行下一步创建一些配置文件。

services:
vmstorage-1:
image: victoriametrics/vmstorage:v1.132.0-cluster
container_name: vmstorage-1
networks:
- monitoring
volumes:
- ./monitoring/victoriametrics/vmstorage/ins1/storage:/storage
- /etc/localtime:/etc/localtime:ro
command:
- "--storageDataPath=/storage"
vminsert-1:
image: victoriametrics/vminsert:v1.132.0-cluster
container_name: vminsert-1
networks:
- monitoring
depends_on:
- "vmstorage-1"
volumes:
- /etc/localtime:/etc/localtime:ro
command:
- "--storageNode=vmstorage-1:8400"
vmselect-1:
image: victoriametrics/vmselect:v1.132.0-cluster
container_name: vmselect-1
networks:
- monitoring
depends_on:
- "vmstorage-1"
command:
- "--storageNode=vmstorage-1:8401"
# - "--vmalert.proxyURL=http://vmalert:8880"
restart: always
vmauth:
image: victoriametrics/vmauth:v1.132.0
container_name: vmauth
networks:
- monitoring
ports:
- 8427:8427
depends_on:
- "vmselect-1"
volumes:
- ./monitoring/victoriametrics/vmauth/config.yml:/etc/vmauth/config.yml:ro
- /etc/localtime:/etc/localtime:ro
command:
- '--auth.config=/etc/vmauth/config.yml'
telegraf:
image: telegraf:1.35
container_name: telegraf
hostname: "debian-41" # 注意替换, 否则 telegraf 采集的是容器里面的 hostname
volumes:
- ./monitoring/telegraf/telegraf.conf:/etc/telegraf/telegraf.conf:ro
- /:/hostfs:ro
- /var/run/docker.sock:/var/run/docker.sock
- /etc/localtime:/etc/localtime:ro
environment:
- HOST_PROC=/hostfs/proc
- HOST_ETC=/hostfs/etc
- HOST_SYS=/hostfs/sys
- HOST_VAR=/hostfs/var
- HOST_RUN=/hostfs/run
- HOST_MOUNT_PREFIX=/hostfs
- 'VM_URL=http://vmauth:8427'
- 'VM_USERNAME=telegraf_username'
- 'VM_PASSWORD=telegraf_password'
- 'VM_DATABASE=victoriametrics'
networks:
- monitoring
depends_on:
- vmauth
grafana:
image: grafana/grafana:12.2.0
container_name: grafana
user: "1000" # id -u
ports:
- "3000:3000"
networks:
- monitoring
volumes:
- ./monitoring/grafana/data:/var/lib/grafana
- /etc/localtime:/etc/localtime:ro
depends_on:
- vmauth
networks:
monitoring:
name: monitoring

复制代码

创建配置文件

# vmstorage 的数据目录
mkdir -p ./monitoring/victoriametrics/vmstorage/ins1/storage
# vmauth 的目录和配置文件
mkdir -p ./monitoring/victoriametrics/vmauth
touch ./monitoring/victoriametrics/vmauth/config.yml
# telegraf 的目录和配置文件
mkdir -p ./monitoring/telegraf
touch ./monitoring/telegraf/telegraf.conf
# grafana 的数据目录
mkdir -p ./monitoring/grafana/data
## 修改权限，否则 Grafana 启动会报错提示权限不足
chmod -R 777 ./monitoring/grafana/data

复制代码

编辑 vmauth 的配置文件 ./monitoring/victoriametrics/vmauth/config.yml。分别配置给 grafana 和 telegraf 的账户及其读写分离的路由规则。

users:
- username: "grafana_username"
password: "grafana_password"
url_map:
- src_paths:
- "/api/v1/query"
- "/api/v1/query_range"
- "/api/v1/label/[^/]+/values"
- "/api/v1/series"
url_prefix: "http://vmselect-1:8481/select/0/prometheus/"
- username: "telegraf_username"
password: "telegraf_password"
url_map:
- src_paths:
- "/insert/0/prometheus/api/v1/write"
url_prefix: "http://vminsert-1:8480/"

复制代码

编辑 telegraf 的配置文件 ./monitoring/telegraf/telegraf.conf。完整配置可使用命令来导出 docker run --rm telegraf:1.35 telegraf config > /monitoring/telegraf/telegraf.conf.sample

[global_tags]
machinetype = "vmware"
[agent]
interval = "10s"
round_interval = true
metric_batch_size = 1000
metric_buffer_limit = 10000
collection_jitter = "0s"
flush_interval = "10s"
flush_jitter = "0s"
precision = "0s"
quiet = true
logformat = "structured"
[[outputs.http]]
url = "http://vmauth:8427/insert/0/prometheus/api/v1/write"
method = "POST"
data_format = "prometheusremotewrite"
username = "telegraf_username"
password = "telegraf_password"
[outputs.http.headers]
Content-Encoding = "snappy"
[[inputs.cpu]]
percpu = true
totalcpu = true
collect_cpu_time = false
report_active = false
core_tags = false
[[inputs.disk]]
ignore_fs = ["tmpfs", "devtmpfs", "devfs", "iso9660", "overlay", "aufs", "squashfs"]
[[inputs.diskio]]
[[inputs.kernel]]
[[inputs.mem]]
[[inputs.processes]]
[[inputs.swap]]
[[inputs.system]]
[[inputs.interrupts]]
[[inputs.kernel_vmstat]]
[[inputs.linux_sysctl_fs]]
[[inputs.net]]
[[inputs.netstat]]

复制代码

启动

docker-compose up -d

复制代码

没什么问题的话，使用 docker-compose ps 可以看到这 6 个服务都启动了，如果有的没启动，可以用 docker logs --tail 50 来查看日志。
服务启动后，浏览器访问 grafana，配置 victoriametrics 的 datasource。这个 datasource 需要单独安装 plugin，如果在线下载失败，可以手动下载压缩包，解压到 ./monitoring/grafana/data/plugins 目录下。添加 datasource 时，url 填写为 http://vmauth:8427/，然后填写用户名和密码。
补充

victoriametrics 官方文档乍一看还挺专业的，但有问题的时候才发现大部分是废话，跟 mimir 有的一拼。
docker 运行的 telegraf 不支持很多 plugin，最好还是在 server 上直接运行 telegraf。

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			立即注册

VictoriaMetrics 尝鲜

相关帖子

签约作者

VictoriaMetrics 尝鲜

相关帖子

相关推荐

谷歌操作系统（Chrome OS ）尝鲜

监控指标太多，VictoriaMetrics 如何自保？

技术赋能新维度，灵码进化新突破：通义灵码2.5新功能尝鲜及深度评测

Prometheus +VictoriaMetrics+Granafa安装部署

Prometheus +VictoriaMetrics+Consul+Granafa安装部署

VictoriaMetrics单节点部署

VictoriaMetrics 部署历史群集的另外两种方式

签约作者