ПИТик
Зарегистрирован: 21 май 2006, 16:33 Сообщения: 383
|
 [Объявление] о том, почему не работал сайт (сообщение от компании NETBYTE)
Добрый день.
О технической проблеме на выходных.
Проблема из двух частей, но абсолютно взаимонезависимых:
1) Согласно техническому регламенту, датацентр производил в пятницу расширение собственной пропускной способности, в связи с чем временно сменил нам IP адреса, о чем заблаговременно уведомил. Мы выбрали для этих работ именно выходные (10-11 июня), причем с запасом (т.е. работы стартовали во второй половине пятницы). И еще один запас у нас был - понедельник, тоже нерабочий, на случай если "что-то" пойдет не так.
Реально, работы начались через сутки, т.е. после обеда в субботу и завершились в первой половине дня в воскресенье. Широковещательное извещение (синхронизация) DNS по новым IP прошла в пятницу, согласно RFC за сутки все нормальные DNS-сервера должны были свои зоны откорректировать. Таким
образом, конечным пользователям такая смена была бы ообще не заметна и сервера работали бы без прерываний (кстати, для пользователей из двугих сетей, с каналом на ТрансТелеКом, а также для пользователей за пределами домашней сети ЮТК так и произошло).
Но DNS Ставропольского ЮТК очередной раз показал крайне высокую инертность к такого рода действиям. Единственно, чем мы зависим от ЮТК - это сервисом DNS, который отдает пользователям информацию об IP-адресах серверов по имени.
Несмотря на то, для обновления зон было выделено даже несколько большее время, чем регламентировано RFC, его оказалось недостаточно. Обновление произошло таки, но поздно ночью в воскресенье, как раз тогда, когда работы
были уже завершены, и произошел обратный возврат наших рабочих IP.
Но теперь DNS-сервер ЮТК отдавал уже те самые "технические" IP, которые были у серверов еще сутки назад. Поэтому и в воскресенье и всю ночь на понедельник и первую половину дня в понедельник DNS отдавал все те же "технические" IP (которые, кстати, в связи с тем, что не успел авторизовать, даже не отдавал).
В обед в понедельник прошла долгожданная синхронизация зон. После обеда прошла авторизация и теперь пользователи ЮТК снова видят наши сервера.
2) Воспользовавшись затяжными выходными мы решили обновить часть своего серверного системного программного обеспечения. В рабочие дни нагрузка на сервера значительная, а выполнить эти работы за ночь сложно. Выходные подходящий вариант, но без запаса. А вот три дня показались нам наиболее удачным вариантом. Поэтому в пятницу после обеда мы стали готовить сервера к
обновлению. В течение примерно часа не работал сервис CPanel, пока производилась настройка новой конфигурации, однако это по идее никак не должно было отразиться на работе веб-серверов, баз данных и почты. Когда мы
уже заканчивали свои работы, пользователи стали сообщать по телефону об отсутствии работы серверов. Нашему удивлению не было предела - полностью рабочие сервера, но при этом полное отсутствие к ним доступа со стороны клиентов. Решено было вернуть старую конфигурацию из backup, на что ушло еще полтора часа. [ Отредактировано ][/color]
|