10 советов IT-службам в жаркую погоду от специалистов ЗАО "Сети" 27.07.10.
В аномально жаркую погоду вычислительная техника проходит тест на выжывание
и есть большой риск администраторам ИТ-систем получить проблему в виде наглухо
зависшего сервера или, чего еще хуже, вышедшего по причине перегрева его важного
компонента.
В связи с этим хотим дать несколько простых советов, как обезопасить или свести
к минимуму возможность такого события в жаркую погоду. Для тех, у кого в
выделенной серверной комнате стоит пара прецезионных кондиционеров с
резервированием этот материал не так актуален (хотя к ПК на раб.местах все
нижесказанное тоже применимо). А для остальных вот несколько простых советов:
1. Мониторте непрерывно температуру процессоров и внутри корпусов оборудования.
Безглючная температура процессоров составляет до 55 гр., жестких дисков
- до 50 гр., а температура внутри корпусов должна не превышать 40 гр. При ее
превышении вероятность отказа резко возрастает. Для наблюдения в интернете
можно найти множество разных утилит, которые должны грузится при старте и
непрерывно выводить на экран значения температуры.
2. Проверте состояние вентиляторов в корпусах серверов и в шкафах.
Некоторые из них могут крутиться еле-еле и абсолютно не выполнять уже своего назначения.
Поставте дополнительные вентиляторы на штатные места, во многих корпусах
установка 2 и 3-го вентиляторов, вентиляторов для охлаждения дисков и памяти -
опциональна, и многие локальные сборщики банально на этом экономят.
3. Особое внимание памяти типа FBD с большим тепловыделением
Для любителей 1-2 года назад набивать серверы памятью типа FBD под завязку
( т.е. занять все 8 доступных слотов) обязательно надо обеспечить
принудительное охлаждение памяти. В брэндовых серверах это обеспечивается
специальными пластиковыми воздуховодами, кот. правильно направляют холодный
воздух фронтальных вентиляторов. В самосборных же серверах этого, как правило,
нет. При установке модулей через один радиаторы памяти справляяются с отводом
тепла самостоятельно, а при полной набивке этого уже не достаточно. Выход -
по возможности чередуйте пустые и занятые слоты под память или применяйте спец.
вентиляторы для памяти.
4. Замените термопасту на процессоре
При подозрении на перегрев процессоров (см.п.1) переустановите кулер процессора,
и обновите термопасту, со временем ее термосопротивление растет. Не помешает и
общая профилактика (чистка) корпуса и его вентиляционных отверстий.
5. Снимите на время стенки 19"-х шкафов
Для обладателей 19" напольных и настенных шкафов тм нет принудительного охлаждения
и забора снизу холодного воздуха на время жары лучше снять все боковые и задние
стенки и обеспечить максимальный выход нагретого оборудованием воздуха. Те, кто
при покупке настенного шкафа сделал выбор в пользу более дорогой модели со съемными
боковыми стенками.
6. Особое внимание дискам с данными
Самый ценный элемент в сервере, да в ПК тоже, это дисковая подсистема, где хранятся
данные. Поэтому важно обеспечить охлаждение жежтких дисков. В корзинах "с горячей
заменой" это делает встроенный вентилятор. В других случаях это должен делать фронтальный
вентилятор. Если у вас диски стоят на уровне отсеков 5,25" с внешним доступом очень
полезно применить фронтальные вентиляторные панели 5,25". Цена вопроса 250-300 руб.
7. Не оставляйте технику на выходные без присмотра
Несмотря на то что принято серверы не выключать, мы бы посоветовали компаниям с 5-дневным
режимом работы в жаркое время серверы выключать в пятницу и включать в понедельник.
Из-за охранных сигнализаций помещения в выходные дни не проветриваются, оборудование
персоналом не контролируется, и поэтому, разумней остановить все системы.
8. Уделяйте внимание телеком-оборудованию
Кроме серверов и ПК есть еще и другое оборудование в шкафах и серверных комнатах -
коммутаторы, маршрутизаторы, мониторы и КВМ-свичи. Все они так же имеют рабочий диапазон
от 0 до 40 градусов и, как правило, тесные 1-юнитовые корпуса. Как показывает практика,
первое, что у них выходит из строя - 40мм вентиляторы охлаждения, что в большинстве случаев
является причиной дальнейшей поломки. Проверьте их состояние и работоспособность.
9. Не забывайте о организационных мероприятиях
Совет начальникам - переведите оперативный ИТ-персонал в состояние повышенной боевой готовности
Увеличте им время на мониторинг оборудования и совершенствование системы оповещения при
аномальном поведении техники. Ранее запланированный отпуск на июль-август такого персонала, видимо,
не самое удачное управленческое решение.
10. Не забывайте про ЗИП и своевременную замену техники
Жаркое время - самое правильное время позаботиться о покупке запасных дисков, модулей памяти и
вентиляторов или просто обновить парк машин. Начальство в это время обычно
не скупится. ЗИП всегда должен быть под рукой. А еще правильней подумать о замене серверов,
купленных более 5-ти лет назад. Ресурс их не бесконечен и риск поломки все более вероятен.
Часто бывает нужен лишь последний толчек - например, аномальная жара. Серверы и коммутаторы
последнего поколения меньше требуют энергии и умеют гибко управлять энергопотреблением, а значит,
и собственным тепловыделением. Покупайте проверенные временем мировые брэнды, у которых даже
самые экономичные и доступные модели разработаны с учетом самых жестких условий эксплуатации,
например, в жарких южных странах.
Покупайте там, где знают,что продают!