node_exporter默认暴露了本地的哪些数据可在此网址查看:
github.com/prometheus/node_exporter
node_exporter默认并没有收集所有的指标,默认哪些启用哪些没启用可以到github.com/prometheus/node_exporter获取
默认启用的在:Enabled by default #如果这些不想启用,就得--no-collector.禁用
默认禁用的在:Disabled by default #如果这些想启用,就得--collector.启用
启用某一个collector:使用--collector.
禁用某一个collector:使用--no-collector.
下载安装node_export服务器托管网er
[root@ubuntu2004 ~]#curl -LO https://github.com/prometheus/node_exporter/releases/download/v1.4.0/node_exporter-1.4.0.linux-amd64.tar.gz
[root@ubuntu2004 ~]#tar xf node_exporter-1.4.0.linux-amd64.tar.gz -C /usr/local/
[root@ubuntu2004 ~]#cd /usr服务器托管网/local/
[root@ubuntu2004 local]#ln -s node_exporter-1.4.0.linux-amd64/ node_exporter
[root@ubuntu2004 local]#cd node_exporter
[root@ubuntu2004 node_exporter]#ls
LICENSE node_exporter NOTICE
启动node_exporter,除了默认暴露的指标,额外增加暴露指标,使用--collertor.暴露。
[root@ubuntu2004 node_exporter]#./node_exporter --collector.ntp --collector.tcpstat --no-collector.zfs
ts=2022-11-22T02:29:14.368Z caller=node_exporter.go:182 level=info msg="Starting node_exporter" version="(version=1.4.0, branch=HEAD, revision=7da1321761b3b8dfc9e496e1a60e6a476fec6018)"
ts=2022-11-22T02:29:14.368Z caller=node_exporter.go:183 level=info msg="Build context" build_context="(go.....
.....
开机自启
[root@ubuntu2004 prometheus]#chown -R prometheus. /usr/local/node_exporter
指定node_exporter要暴露的指标(除了默认之外的,用'--collector.'增加)
[root@ubuntu2004 local]#vim /usr/lib/systemd/system/node_exporter.service
[Unit]
Description=node_exporter
Documentation=https://prometheus.io/docs/introduction/overview/
After=network.target
[Service]
Type=simple
User=prometheus
ExecStart=/usr/local/node_exporter/node_exporter
--collector.ntp
--collector.mountstats
--collector.systemd
--collector.ethtool
--collector.tcpstat
ExecReload=/bin/kill -HUP $MAINPID
TimeoutStopSec=20s
Restart=always
[Install]
WantedBy=multi-user.target
[root@ubuntu2004 local]#systemctl daemon-reload
[root@ubuntu2004 local]#systemctl enable --now node_exporter.service
[root@ubuntu2004 local]#systemctl status node_exporter.service
#验证监听的端口,并测试访问其暴露的指标
[root@ubuntu2004 local]#ss -ntlp
State Recv-Q Send-Q Local Address:Port Peer Address:Port Process
LISTEN 0 4096 127.0.0.53%lo:53 0.0.0.0:* users:(("systemd-resolve",pid=736,fd=13))
LISTEN 0 128 0.0.0.0:22 0.0.0.0:* users:(("sshd",pid=769,fd=3))
LISTEN 0 4096 *:9100 *:* users:(("node_exporter",pid=41237,fd=7))
LISTEN 0 128 [::]:22 [::]:* users:(("sshd",pid=769,fd=4))
LISTEN 0 4096 *:9090 *:* users:(("prometheus",pid=1311,fd=7))
查看本机暴露的指标
http://prometheus.fanchao.com:9100/metrics 可查看peomQL帮助
node_exporter暴露了指标,在prometheus上进行收集
基于静态服务发现监控node_exporter(可用基于文件的服务发现代替)
[root@ubuntu2004 prometheus]#vim prometheus.yml
......
- job_name: "node_exporter" #在scrape_configs字段中添加job
metrics_path: '/metrics' #获取指标的路径如果不是标准的'/metrics'路径,就指定
scheme: 'http' #协议
static_configs: #使用静态服务发现的方式纳入到监控中来
- targets: #指定被监控的端点
- "10.0.0.106:9100"
- "10.0.0.100:9100" #如果100主机没有node_exporter,监控不到(需要安装node_exporter)
重载配置文件
(需要启用--web.enable-lifecycle接口才可以远程reload,在prometheus.service中已启用,./prometheus --help可查看启用信息)
[root@ubuntu2004 prometheus]#curl -XPOST http://localhost:9090/-/reload
prometheus server窗口出现信息
name=./prometheus.yml totalDuration=804.526s db_storage=1.632s remote_storage=1.744s web_handler=460ns query_engine=1.461s scrape=211.709s scrape_sd=98.318s notify=36.485s notify_sd=18.073s rules=2.664s tracing=8.863s
此时,打开http://prometheus.fanchao.com:9090/(因为10.0.0.100没有安装node_exporter,抓不到指标,此时它的up值就为0,显示DOWN状态)
点击graph,输入up == 0,点击Execute可查看到有一个node_exportor处于down状态,满足条件,就应该告警了。因此每一个实例上都有一个指标叫up,用来标识当前实例是否处于正常工作状态。
查看prometheus server所在主机暴露的指标
http://prometheus.fanchao.com:9100/metrics
根据以上暴露信息,可以在prometheus的web ui上使用指标名+过滤条件进行过滤
如下:
查看磁盘的读取数据(默认15秒收集一次)
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
机房租用,北京机房租用,IDC机房托管, http://www.fwqtg.net
相关推荐: 财务管理系统|基于Springboot开发实现公司财务管理系统
作者主页:编程指南针 作者简介:Java领域优质创作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容:Java项目、毕业设计、简历模板、学习资料、面试题库、技术互助 收藏点赞不迷路 关注作者有好处 文末获取源码 项目编号:BS-XX-169 2022年疫…