blob: 2568441f2c726dd31cb58d1110c30d00ec1b7374 (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
Checklist for maintenance OVN upgrade- [ ] Make
- [x] xping all public router ips
- [x] Open Grafana dashboard for OVN leaders
- [x] Open Grafana dashboard for network metrics
- [x] xping one vm on every compute node
- [x] check ovn cluster status
- [x] make sure ansible inventory covers all compute nodes
- [x] make sure ansible inventory covers all network nodes
- [x] make sure ansible inventory covers all ovn cluster database nodes
- [x] Make sure network nodes are reboot proof
- [x] Check ansible netconf for reboot proofness as well
- [x] Check puppet status on all network nodes
Xping: window 3
Ansible playbook: window 4
OVN db cluster nodes: window 4
Neutron server tail: window 5
Note
- Moet ff iets slimmers om te xpingen. Freenet veelste veel pub router ips; liefst gwn 1 of ip per netwerk en compute node.
- Query OVN?
- Ff proberen vast te leggen hoe we OVN databases automatisch kunnen checken op compleet up zijn, ipv arbitrair wachten en zelf kijken.
- OVN upgrade 1: ongeveer om 2 uur begonnen, dingen recoveren volledig vanaf mijn POV: 2:09
- OVN db upgrade stap wacht: check -> lijkt allemaal goed, cluster status OK
- eerste ovn-controller upgrade (n01) -> shit blijft down hoe lang ik ook lijk te wachten: br-int connection timeout
- Besloten om toch gewoon proberen door te duwen
- Zodra ik continue met de volgende lijkt eigenlijk meteen br-int te connecten (toeval?) en gaan dingen recoveren
|