diff options
Diffstat (limited to '.trash/2 areas/work/groupvps/operational')
4 files changed, 54 insertions, 0 deletions
diff --git a/.trash/2 areas/work/groupvps/operational/blkio-errors.md b/.trash/2 areas/work/groupvps/operational/blkio-errors.md new file mode 100644 index 0000000..2b666a3 --- /dev/null +++ b/.trash/2 areas/work/groupvps/operational/blkio-errors.md @@ -0,0 +1,14 @@ +Dmesg is spewing blkio errors + +Find out which device: e.g dm-4, then: +``` +sudo virsh list --all --name | while read dom; do sudo virsh dumpxml $dom | grep dm-4 && echo $dom; done +``` +To find which domain +After which: +``` +sudo virsh dumpxml $domain +``` +to find the hostname + +reboot it hard.
\ No newline at end of file diff --git a/.trash/2 areas/work/groupvps/operational/fix-tc-issues.md b/.trash/2 areas/work/groupvps/operational/fix-tc-issues.md new file mode 100644 index 0000000..4ad3bf8 --- /dev/null +++ b/.trash/2 areas/work/groupvps/operational/fix-tc-issues.md @@ -0,0 +1,25 @@ +Probleem: referenties in ovs naar devices die niet meer bestaan. Hij probeert vervolgens een nieuw device aan te maken met een qdisc op zo'n niet bestaande device. + +``` +sudo grep -r 'could not open network device' /var/log/openvswitch/ | grep -oi 'tap[a-z0-9\-]*' | uniq > ports_no_device +``` +``` +sudo ip l l | grep ports_no_device | grep -oi 'tap[a-z0-9\-]*' > ports_with_device +``` +``` +for P in $(cat ports_no_device | grep -v -f ports_with_device); do sudo ovs-vsctl del-port $P; done +``` +``` +sudo systemctl restart ovn-controller +``` + + +Rutger versie: +``` +sudo grep 'could not open network device' /var/log/openvswitch/ovs-vswitchd.log | grep -oi 'tap[a-z0-9\-]*' | sort | uniq | while read dev; do ip l l $dev || sudo ovs-vsctl del-port $dev; done; sudo systemctl restart ovn-controller +``` + + +Dus: ovs-vsctl del-port is nice. + +Niet vergeten ovn-controller te herstarten. diff --git a/.trash/2 areas/work/groupvps/operational/maintenance-log.md b/.trash/2 areas/work/groupvps/operational/maintenance-log.md new file mode 100644 index 0000000..79c8a7a --- /dev/null +++ b/.trash/2 areas/work/groupvps/operational/maintenance-log.md @@ -0,0 +1,3 @@ +### 2024-12-10 +- manually updated instance record host/node for instance `10924c62-7f0f-4df1-9dd8-9108e3cb0764` +- suspended guest: virsh dompmwakeup and try again diff --git a/.trash/2 areas/work/groupvps/operational/storage-load-2024-12-05.md b/.trash/2 areas/work/groupvps/operational/storage-load-2024-12-05.md new file mode 100644 index 0000000..6931d2d --- /dev/null +++ b/.trash/2 areas/work/groupvps/operational/storage-load-2024-12-05.md @@ -0,0 +1,12 @@ +Vraag uitgezet bij Allan voor meer informatie. +Allan: het komt al 1.5 maand voor; https://group-onecom.slack.com/archives/C02FT9KEFNH/p1729863978525299 + +Uit dat bericht blijkt dat Jerry zou kijken of het Acronis is. + +Jeroen gecontacteerd om ff te vragen of ze dat al gedaan hebben; jeroen denkt dat het niet door Acronis komt omdat dat vooral read ops zijn en verspreid over de nacht. + +Allan stuurt graph met kantteking: "seems to involve alot of LUNs": `https://prometheus2.env.vps1-cph8.one.com/graph?g0.expr=count(lun_write_ops%20%3E%20(lun_write_ops%20offset%2020m%20%2B%20100))&g0.tab=0&g0.display_mode=lines&g0.show_exemplars=0&g0.range_input=30m&g0.end_input=2024-12-05%2005%3A47%3A35&g0.moment_input=2024-12-05%2005%3A47%3A35` + +Jeroen dacht mogelijk mysql dumps van shared, maar zou ook verspreid moeten zijn: ging kijken wanneer die gdraaid hadden, niks meer over gehoord. + +O.b.v LUN graph heb ik wat LUNs gepakt en bleek allemaal managed vps te zijn; Jeroen op onderzoek naar wat daar binnen rond die tijd gebeurd. Verdenkt PSA crons.
\ No newline at end of file |