Короче, в процессе планового обслуживания и миграции всех ВМ и одного контейнера, который у нас есть на одном из кластеров, контейнер не удалось нормально остановить, и чтобы закончить обслуживание, сервер просто перезагрузили. Теперь, что бы я ни делал, не могу запустить этот контейнер (он единственный у нас). Мы как раз занимались настройкой сети - у нас был микс публичных и приватных адресов, и мы переводили моники/менеджеры на работу исключительно в приватных сетях (добавляя приватную сеть как первую в ceph.conf и пересоздавая моники и менеджеры). Затем последовал апгрейд до 8.41 на всех хостах, после чего была перезагрузка. Только этот контейнер не запускается.
Сразу при старте:
```
Code: # pct start 105 --debug
run_buffer: 571 Script exited with status 110
lxc_init: 845 Failed to run lxc.hook.pre-start for container "105"
__lxc_start: 2034 Failed to initialize container "105"
0 hostid 100000 range 65536
INFO lsm - ../src/lxc/lsm/lsm.c:lsm_init_static:38 - Initialized LSM security driver AppArmor
INFO utils - ../src/lxc/utils.c:run_script_argv:587 - Executing script "/usr/share/lxc/hooks/lxc-pve-prestart-hook" for container "105", config section "lxc"
DEBUG utils - ../src/lxc/utils.c:run_buffer:560 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 105 lxc pre-start produced output: In some cases useful info is found in syslog - try "dmesg | tail".
DEBUG utils - ../src/lxc/utils.c:run_buffer:560 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 105 lxc pre-start produced output: rbd: sysfs write failed
DEBUG utils - ../src/lxc/utils.c:run_buffer:560 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 105 lxc pre-start produced output: can't map rbd volume vm-105-disk-0: rbd: sysfs write failed
ERROR utils - ../src/lxc/utils.c:run_buffer:571 - Script exited with status 110
ERROR start - ../src/lxc/start.c:lxc_init:845 - Failed to run lxc.hook.pre-start for container "105"
ERROR start - ../src/lxc/start.c:__lxc_start:2034 - Failed to initialize container "105"
INFO utils - ../src/lxc/utils.c:run_script_argv:587 - Executing script "/usr/share/lxcfs/lxc.reboot.hook" for container "105", config section "lxc"
```
И информация о rbd:
```
Code: # rbd info ewr-pool/vm-105-disk-0
rbd image 'vm-105-disk-0':
size 20 GiB in 5120 objects
order 22 (4 MiB objects)
snapshot_count: 0
id: 4cbfb3bc45c7ae
block_name_prefix: rbd_data.4cbfb3bc45c7ae
format: 2
features: layering, exclusive-lock, object-map, fast-diff, deep-flatten
op_features:
flags:
create_timestamp: Wed Apr 24 01:48:04 2024
access_timestamp: Wed Apr 24 01:48:04 2024
modify_timestamp: Wed Apr 24 01:48:04 2024
```
И конфигурация контейнера:
```
Code: # cat /etc/pve/lxc/105.conf
arch: amd64
cores: 2
features: nesting=1
hostname: shipyard-couch
memory: 1024
net0: name=eth0,bridge=vmbr0,firewall=1,gw=10.10.8.1,hwaddr=BC:24:11:22:37:80,ip=10.10.8.100/24,tag=108,type=veth
ostype: centos
rootfs: ewr-pool:vm-105-disk-0,size=20G,mountoptions=discard
swap: 512
unprivileged: 1
```
Также в dmesg при попытке запуска появляется эта ошибка:
```
Code: [ 2990.348616] libceph: another match of type 1 in addrvec
[ 2990.348621] libceph: problem decoding monmap, -22
```
Подскажите, где еще можно покопаться?
Сразу при старте:
```
Code: # pct start 105 --debug
run_buffer: 571 Script exited with status 110
lxc_init: 845 Failed to run lxc.hook.pre-start for container "105"
__lxc_start: 2034 Failed to initialize container "105"
0 hostid 100000 range 65536
INFO lsm - ../src/lxc/lsm/lsm.c:lsm_init_static:38 - Initialized LSM security driver AppArmor
INFO utils - ../src/lxc/utils.c:run_script_argv:587 - Executing script "/usr/share/lxc/hooks/lxc-pve-prestart-hook" for container "105", config section "lxc"
DEBUG utils - ../src/lxc/utils.c:run_buffer:560 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 105 lxc pre-start produced output: In some cases useful info is found in syslog - try "dmesg | tail".
DEBUG utils - ../src/lxc/utils.c:run_buffer:560 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 105 lxc pre-start produced output: rbd: sysfs write failed
DEBUG utils - ../src/lxc/utils.c:run_buffer:560 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 105 lxc pre-start produced output: can't map rbd volume vm-105-disk-0: rbd: sysfs write failed
ERROR utils - ../src/lxc/utils.c:run_buffer:571 - Script exited with status 110
ERROR start - ../src/lxc/start.c:lxc_init:845 - Failed to run lxc.hook.pre-start for container "105"
ERROR start - ../src/lxc/start.c:__lxc_start:2034 - Failed to initialize container "105"
INFO utils - ../src/lxc/utils.c:run_script_argv:587 - Executing script "/usr/share/lxcfs/lxc.reboot.hook" for container "105", config section "lxc"
```
И информация о rbd:
```
Code: # rbd info ewr-pool/vm-105-disk-0
rbd image 'vm-105-disk-0':
size 20 GiB in 5120 objects
order 22 (4 MiB objects)
snapshot_count: 0
id: 4cbfb3bc45c7ae
block_name_prefix: rbd_data.4cbfb3bc45c7ae
format: 2
features: layering, exclusive-lock, object-map, fast-diff, deep-flatten
op_features:
flags:
create_timestamp: Wed Apr 24 01:48:04 2024
access_timestamp: Wed Apr 24 01:48:04 2024
modify_timestamp: Wed Apr 24 01:48:04 2024
```
И конфигурация контейнера:
```
Code: # cat /etc/pve/lxc/105.conf
arch: amd64
cores: 2
features: nesting=1
hostname: shipyard-couch
memory: 1024
net0: name=eth0,bridge=vmbr0,firewall=1,gw=10.10.8.1,hwaddr=BC:24:11:22:37:80,ip=10.10.8.100/24,tag=108,type=veth
ostype: centos
rootfs: ewr-pool:vm-105-disk-0,size=20G,mountoptions=discard
swap: 512
unprivileged: 1
```
Также в dmesg при попытке запуска появляется эта ошибка:
```
Code: [ 2990.348616] libceph: another match of type 1 in addrvec
[ 2990.348621] libceph: problem decoding monmap, -22
```
Подскажите, где еще можно покопаться?
