Буквально 4 дня назад взял в аренду сервер в http://ru.hetzner.com/.
А сегодня с утра обнаружил, что мой сервер, где расположен этот сайт не работает. Попробовал его перезапустить из панели управления сервером — безрезультатно.
Загрузился через их rescue-систему. Получил доступ к серверу, проверил содержимое дисков. Все лежало на своих местах. Перезагрузил сервер из Rescue-системы. Эффекта ноль.
Написал в поддержку hetzner. Видимо, по ночам они работают, т.к. не ответили до сих пор. У нас разница во времени 5 часов.
С неработающим сервером оказался и я безработным. Поэтому полез в сеть гуглить в чем может быть проблема. Наткнулся на описание этой же проблемы у парня из Индии (блог русскоязычный 🙂 ). Он все-таки дождался через 9 часов ответ поддержки. Там хоть и была сложнее проблема, но то, что он выложил на своей странице, и мне помогло.
Нужно было проверить диски на наличие ошибок.
Первым делом определил список доступных дисков. Это делается командой
# ls /dev/[hsv]d[a-z]*[0-9]*
ответ моего сервера
/dev/sda1 /dev/sda2 /dev/sda3
осталось только запустить их проверку. Проверка запускается для каждого диска. Команды идентичны. Только нужно менять их название
# fsck -C0 /dev/sda1
При проверке на третьем диске утилита сообщила, что диск поврежден и предложила устранить замечания. Задавала кучу вопросов — надо ли делать то и это. Везде отвечал yes. После отработки алгоритма устранения проблем и завершения ее работы, я еще раз контрольно запустил проверку. На этот раз тестирование прошло без замечаний.
Осталось только перезагрузить сервер.
После того, как сервер загрузился в штатном режиме, решил проверить когда он перестал работать. Как оказалось, последние логи писались в 19:08, по времени сервера. Т.е. в полночь по моему времени сервер остановился и молчал до утра, пока я его самостоятельно не восстановил.
Теперь надо думать о системе оповещения при остановках. Какое-то грустное начало с ним получилось.
Здесь же работают еще 2 сервера с меньшей конфигурацией. Стабильно уже 2 и 2,5 года. Мелкие замечания были изначально, но давно устранены и уже не помню, когда в последний раз их рестартил. Посмотрим как поведет себя эта машинка в дальнейшем.
Чтобы fsck не задавала кучу вопросов, а «молча» фиксила всё что может, у неё есть ключик -y (—yes). Иначе в особых случаях можно очень долго сидеть подтверждать, порой количество ошибок при проверки может достигать тысяч, а иногда десятков и сотен тысяч 🙂
Ну и после нескольких месяцев использования что скажете, полёт нормальный?) Я тоже держу у них на самом дешёвом тарифе ВПС — около полугода, вообще без нареканий.
Спасибо, за совет! На тот момент вопросов было немного. Что-то около 30-40 :). Да и небыло времени искать как лучше запускать :). Нужен был рабочий сервер.
С тех пор все работает стабильно и ровно. Уже что только не ставил на нем для экспериментов…