处理k8s中java应用OOM时的dump文件(非preStop)
判断是否存在jvm dump文件"/dumps/oom",如果存在就把/dumps/oom文件上传至oss,并发送钉钉告警,如果不存在则忽略。 oss文件分片,断点续传,根据podid、env自动判断上传到对应项目组的bucket 钉钉告警,附带oss链接地址,根据podid自动判断发送到对应项目组的告警群
GOOS=linux go build -ldflags="-w -s"
1、添加jvm参数,当应用发生OOM时会自动执行工具"-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/dumps/oom -XX:+ExitOnOutOfMemoryError -XX:OnOutOfMemoryError=./dump-handler -k \$HOSTNAME -e \$ENV"
2、部署应用到k8s时在deployment配置挂载emptyDir的volume目录"/dumps"
- PODID
- k8s pod的id,可以通过$HOSTNAME获取
- podid命名规范,示例 "ops-demo",以"-"为分隔符,取一个"ops"值为项目组,后面的"demo"为app名
- ENV
- 部署环境,可以通过$ENV获取(提前通过deployment配置环境变量ENV到容器中)
- OOM Dump文件路径
- /dumps/oom