添加 prometheus 失败

Question

添加 prometheus 失败

runzhenghengbin opened this issue a year ago · 2 comments

[root@node-1 ~]# bash kainstall-centos.sh add --monitor prometheus
[2023-03-03T10:09:52.018600276+0800]: INFO:    [start] bash kainstall-centos.sh add --monitor prometheus
[2023-03-03T10:09:52.023690883+0800]: INFO:    [check] ssh command exists.
[2023-03-03T10:09:52.025838288+0800]: INFO:    [check] sshpass command exists.
[2023-03-03T10:09:52.028290945+0800]: INFO:    [check] wget command exists.
[2023-03-03T10:09:52.197935107+0800]: INFO:    [check] ssh 10.0.1.201 connection succeeded.
[2023-03-03T10:09:52.357239163+0800]: INFO:    [check] ssh 10.0.1.202 connection succeeded.
[2023-03-03T10:09:52.518530772+0800]: INFO:    [check] ssh 10.0.1.203 connection succeeded.
[2023-03-03T10:09:52.520397483+0800]: INFO:    [check] os support: centos7 centos8
[2023-03-03T10:09:52.681127164+0800]: INFO:    [check] 10.0.1.201 os support succeeded.
[2023-03-03T10:09:52.854603538+0800]: INFO:    [check] 10.0.1.202 os support succeeded.
[2023-03-03T10:09:53.033822227+0800]: INFO:    [check] 10.0.1.203 os support succeeded.
[2023-03-03T10:09:53.119607019+0800]: INFO:    [check] conn apiserver succeeded.
[2023-03-03T10:09:53.121602751+0800]: INFO:    [monitor] add prometheus
[2023-03-03T10:09:53.127663719+0800]: INFO:    [download] prometheus.zip
[2023-03-03T10:09:56.455474934+0800]: INFO:    [download] prometheus.zip succeeded.
[2023-03-03T10:09:56.457851180+0800]: INFO:    [monitor] apply prometheus manifests
[2023-03-03T10:10:34.536135617+0800]: ERROR:   [apply] add prometheus failed.
[2023-03-03T10:10:37.541904371+0800]: INFO:    [waiting] waiting prometheus
[2023-03-03T10:11:08.915090034+0800]: ERROR:   [waiting] prometheus pods --all ready failed.
[2023-03-03T10:11:08.919343622+0800]: INFO:    [apply] controller-manager and scheduler prometheus discovery service
[2023-03-03T10:11:09.137725749+0800]: INFO:    [apply] add controller-manager and scheduler prometheus discovery service succeeded.
[2023-03-03T10:11:09.139441258+0800]: INFO:    [monitor] add prometheus ingress
[2023-03-03T10:11:09.141863365+0800]: INFO:    [apply] prometheus ingress
[2023-03-03T10:11:09.347701733+0800]: INFO:    [apply] add prometheus ingress succeeded.
[2023-03-03T10:11:09.431774898+0800]: INFO:    [command] get node_ip value succeeded.
[2023-03-03T10:11:09.526868024+0800]: INFO:    [command] get node_port value succeeded.
[2023-03-03T10:11:09.540782557+0800]: INFO:    [ingress] curl -H 'Host:grafana.monitoring.cluster.local' http://10.0.1.203:49180; auth: admin/admin
[2023-03-03T10:11:09.546959366+0800]: INFO:    [ingress] curl -H 'Host:prometheus.monitoring.cluster.local' http://10.0.1.203:49180
[2023-03-03T10:11:09.549969520+0800]: INFO:    [ingress] curl -H 'Host:alertmanager.monitoring.cluster.local' http://10.0.1.203:49180
[2023-03-03T10:11:09.639805208+0800]: INFO:    [command] get MGMT_NODE value succeeded.
[2023-03-03T10:11:09.873670581+0800]: INFO:    [command] get node_hosts value succeeded.
[2023-03-03T10:11:09.875918854+0800]: ERROR:   [init] The host 10.0.1.201 is already in the cluster!

ERROR Summary: 
  [2023-03-03T10:10:34.536135617+0800]: ERROR:   [apply] add prometheus failed.
  [2023-03-03T10:11:08.915090034+0800]: ERROR:   [waiting] prometheus pods --all ready failed.
  [2023-03-03T10:11:09.875918854+0800]: ERROR:   [init] The host 10.0.1.201 is already in the cluster!
  

ACCESS Summary: 
  [ingress] curl -H 'Host:grafana.monitoring.cluster.local' http://10.0.1.203:49180; auth: admin/admin
  [ingress] curl -H 'Host:prometheus.monitoring.cluster.local' http://10.0.1.203:49180
  [ingress] curl -H 'Host:alertmanager.monitoring.cluster.local' http://10.0.1.203:49180
  


  See detailed log >>> /tmp/kainstall.qgxy6Q1ykj/kainstall.log

Answer 1 · 2023-03-03T03:31:40.000Z

kubectl -n monitoring get pods 查看pod状态

在查看pods的错误输出

Answer 2 · 2023-03-07T06:00:11.000Z

[root@k8s-master-node1 ~]# kubectl -n monitoring get pods
No resources found in monitoring namespace.