мир открытий чудных

Apr 03, 2018 15:56

новый прекрасный подземный стук в продакшне: как выяснилось, после gradual ребута кластера у одного из серверов стало на 64 гб оперативки меньше.

мониторить ЭТО нам в голову не приходило, да... точнее, мониторинг был, а вот алерта не было.

This entry was originally posted at https://wizzard.dreamwidth.org/490770.html. It has
Read more... )

Leave a comment

Comments 2

amarao_san April 3 2018, 15:56:42 UTC
Если сервер брендовый, 99%, что про это есть запись в SEL'е. Вы же мониторите SEL, правда?

Reply

wizzard0 April 3 2018, 16:37:00 UTC
есть, есть, там даже написано что сдох контроллер а не планки. но алерты были на предмет стораджа, сетевух и как ни странно процов. а тут сторадж есть, процы есть, сеть есть, а памяти есть часть :)

Reply


Leave a comment

Up