当ETCD没有备份故障时候恢复

在 k8s运行过程中， etcd集群异常的情况当时我们没有备份。我们该如何恢复ETCD呢。

端口	作用
2379	提供 HTTP API 服务，供客户端交互
2380	和集群中其他节点通信

前提

# 该工具可从容器中拷贝出来
etcdctl 
# snapshot.db 文件来源，
cp /var/lib/etcd/member/snap/db /root/backup/snapshot.db

ansible 执行

配置

config.yaml

all:
  children:
    # etcd 节点
    etcd:
      hosts:
        IP1:
          ansible_ssh_user: "root"
          ansible_ssh_pass: "xxxxxx"
          ansible_ssh_port: 22
          hostname: "HOSTNAME1"  # ETCD名称
          ip: "<ETCD-IP1>"
        IP2:
          ansible_ssh_user: "root"
          ansible_ssh_pass: "xxxxxx"
          ansible_ssh_port: 22
          hostname: "HOSTNAME2"  # ETCD名称
          ip: "<ETCD-IP2>"
        IP3:
          ansible_ssh_user: "root"
          ansible_ssh_pass: "xxxxxx"
          ansible_ssh_port: 22
          hostname: "HOSTNAME3"  # ETCD名称
          ip: "<ETCD-IP3>"

playbook

# 修改一下
etcd-restore.yaml

- hosts: etcd
  remote_user: root
  tasks:
  - name: stop cluster
    shell: mv /etc/kubernetes/manifests/{etcd.yaml,kube-apiserver.yaml} /tmp/

  - name: remove data
    shell:  rm -rf /var/lib/etcd/

  - name: restone etcd
  
    # 没有备份时候恢复方法
    shell: sleep 2&& ETCDCTL_API=3 etcdctl snapshot restore /root/backup/snapshot.db --skip-hash-check --name {{hostname}} --initial-cluster HOSTNAME1=https://ETCD-IP1:2380,HOSTNAME2=https://ETCD-IP2:2380,HOSTNAME3=https://ETCD-IP3:2380  --initial-cluster-token etcd --initial-advertise-peer-urls https://{{ip}}:2380 --data-dir=/var/lib/etcd
    
    # 有备份时候恢复方法
    #shell: sleep 2&& ETCDCTL_API=3 etcdctl snapshot restore /root/backup/etcd-snapshot-20220517.db --name {{hostname}} --initial-cluster HOSTNAME1=https://ETCD-IP1:2380,HOSTNAME2=https://ETCD-IP2:2380,HOSTNAME3=https://ETCD-IP3:2380  --initial-cluster-token etcd --initial-advertise-peer-urls https://{{ip}}:2380 --data-dir=/var/lib/etcd

  - name: start cluster
    shell: mv /tmp/{etcd.yaml,kube-apiserver.yaml} /etc/kubernetes/manifests/

执行恢复

ansible -i config.yaml etcd-restore.yaml

James Liu

https://www.buleye.com/2022/05/20/etcd/etcd-gu-zhang-hui-fu/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 James Liu !

kubernetes etcd kubeadm

docker-compose多个容器共用一个IP地址

2022-05-20 docker-compose

docker-compose ip

kubernetes基础操作命令

2022-02-11 kubernetes

kubernetes

居于kubeadm部署的etcd备份恢复

当ETCD没有备份故障时候恢复

前提

ansible 执行

配置

playbook

执行恢复

你的赏识是我前进的动力