Привет всем! У меня дома работает кластер Proxmox из 3 узлов с Ceph для хранения виртуальных машин. На каждом узле по два Intel enterprise SSD объёмом 800 ГБ для OSD данных, и один потребительский NVMe на 512 ГБ, который используется для DB/WAL для обоих OSD на этом узле. Я тестирую кластер и вижу низкие IOPS и высокую задержку, особенно при 4K случайных нагрузках. Я подозреваю, что потребительский NVMe — узкое место, и хотел бы заменить его на enterprise NVMe (вероятно, что-то с более высокой устойчивой скоростью записи и DWPD). Прежде чем я приступлю, хочу:
Получить обратную связь от сообщества о том, улучшит ли это значительно производительность.
Удостовериться в лучшем способе замены DB/WAL NVMe, не сломав кластер.
Мой план:
По одному узлу: останавливаю OSD, использующие DB/WAL устройство, затираю их, выключаю узел, заменяю NVMe, пересоздаю OSD с новым целевым устройством DB/WAL.
Отслеживаю перебалансировку между каждым шагом.
У кого-нибудь здесь был подобный опыт или есть лучшие предложения, как избежать простоя или проблем с данными? Какие подводные камни стоит учитывать?
Заранее спасибо!
Получить обратную связь от сообщества о том, улучшит ли это значительно производительность.
Удостовериться в лучшем способе замены DB/WAL NVMe, не сломав кластер.
Мой план:
По одному узлу: останавливаю OSD, использующие DB/WAL устройство, затираю их, выключаю узел, заменяю NVMe, пересоздаю OSD с новым целевым устройством DB/WAL.
Отслеживаю перебалансировку между каждым шагом.
У кого-нибудь здесь был подобный опыт или есть лучшие предложения, как избежать простоя или проблем с данными? Какие подводные камни стоит учитывать?
Заранее спасибо!
