Вопросы
Войти

Что твой перечень, когда все взрывается?

Jon Galloway

Пользователи не могут получить их по электронной почте, генеральный директор не может попасть на домашней странице компании, и ваш пейджер просто ушла с "Код 911". Что вы делаете, когда все взрывается?

disaster-recovery
20 Ответов
Wedge

Сохраняйте Спокойствие

Не психуй. Дышать! (Из диафрагмы, это помогает.) Если вы изучали медитации, что тоже может помочь.

При столкновении с экстремальными стресс ваше тело пойдет в рейс-или-или воевать, потому что ваше тело думает, что это в жизни-или-смерти. В это время ваше тело будет на самом деле прокачивать меньше крови к некоторым частям вашего мозга, снижение функции, как рассуждение. Это эффективно понижает ваш IQ как инстинкт, а не рациональность, начинает доминировать в вашей функции мозга. Если вы когда-либо был или стал свидетелем жаркого спора вы можете распознать эти симптомы, как эмоции народов блики и рациональность берет отпуск. Позже, когда у людей есть шанс остыть, они будут более склонны принять то, что ошибся или был неправ, и более способны видеть другую сторону, но в пылу момента, но в меньшей степени.

Поддержание вашей самообладание и держать свой ум о вас будут держать ваш мозг функционирует на полную мощность и убедитесь, что вы принимать рациональные решения, основанные на доказательствах и разумом, а не эмоциями и страхом.

Триаж

Эффективность применения ограниченных ресурсов для достижения наибольшей выгоды при минимальных затратах является крайне важным здесь. Принимать решения как можно раньше, какие вещи должны быть отремонтированы прямо сейчас, что может подождать некоторое время (часов, дней), и который может ждать бесконечно. Также научиться понимать, когда что-то безнадежны и не стоит экономить (например, половина маршрутизатор растаяло, даже если это твой единственный, ты не можешь спасти его, купить новый и получить его на территории пост-поспешность или найти то, что может заполнить этот пробел временно).

Сохранить Ситуационной Осведомленности

Не позволяйте своему вниманию задерживаться на некоторые интересные проблемы или то, что вы не совсем еще понимаю. Сосредоточиться на общей картине и на получение самых важных вещей работающих.

Использовать научный метод

Сформировать гипотезу. Определите, как вы бы проверить эту гипотезу. Сбор данных для проверки гипотезы. Ищите Дис-подтверждающие сведения, а также. Уточните ваши гипотезы и повторите цикл столько раз, сколько потребуется, пока у вас есть достаточно уверенности в своих гипотезу принять меры.

Быть Прагматичным

Сейчас не время для догмы. Это нормально, чтобы взять несколько ярлыков здесь и там, когда пострадавшим от стихийных бедствий. Это, по сути, начисление технический долг. Во многих компаниях, катастрофический провал означает катастрофической потери доходов. Это лучше, чтобы получить вещи работает, даже если на шаткой основе, чем мешкать и риск существования вашей компании. Как всегда, решение в высшей степени важно. Иногда имеет смысл поддержать фанат ящика в серверную стойку, иногда нет.

Береги Себя

Как долго вы работали над этой ситуацией? Когда вы в последний раз пили воду? Когда в последний раз ты ела? Как давно ты не спишь? Не обожгись, только потому, что это срочно, занять время, чтобы держать увлажненной, кормили и отдыхали (в случае длительного, многодневного слог).

Привлекайте К Помощи

Там почти наверняка много талантливых людей в вашей компании, которые мотивированы и способны помочь кредитование. Будьте осторожны, чтобы слишком много людей бегают и хоть и досаждает друг друга. Также опасайтесь раздражающих людей, поставив их через "firedrill". Найти людей, которые уже хотят помочь, заставить их работать на целевых задач, и убедитесь, что люди общаются друг с другом.

Общаться

Общение очень важно. Ничто так не пугает как неизвестность. Когда люди ничего не знают, кроме того, что что-то сломалось, пустое заявление о том, что он вернется в Х ЧАСОВ лишь слегка обнадеживает (еще менее утешительными после х часов прошло, а все еще работает). Давление в игре могут направить вас в сторону, давая слишком оптимистичные сроки-смета трепать, но это неправильный курс. Не просто сказать, что ты работаешь на него, не просто сказать, все будет исправлено на Х времени. Быть открытым, показать свой процесс, деталь ваши успехи и ваши неудачи. Позволяют глубже понять проблемы, процесс отслеживания его вниз, и ваш план для исправления ошибок (хотя и не топить людей в мелочах). Показать, что проблема не является неразрешимой, показывают, что все будет сделано правильно, в конце концов, показать, что есть грамотные люди по этой проблеме, эти вещи являются более обнадеживающими, чем необоснованные сроки обещаний.

Sam Cogan

Первый ответ-это сохранять спокойствие! Я узнал, что трудный путь, что часто паникуют просто делает вещи хуже. Как только это достигнуто следующее-Это на самом деле выяснить, в чем проблема. Жалобы от пользователей и менеджеров будут приходить на вас со всех сторон, говорю вам, что они не могут делать, но не в чем проблема.

Как только вы знаете проблемы, вы можете начать план, чтобы исправить это и начать раздавать ваши гневные пользователи в сроки!

Jauder Ho

Не паникуйте.

Dave Cheney

Шаг 0. Проверить, что это не ваша система мониторинга, которая по вине

Phil Nash

войдите в serverfault

Glenn Slaven

Сразу же забронируйте билет на рейс в страну, не выдающую преступников

Glenn Slaven

Проверьте сначала азы, это кажется глупым, но такие вещи, как

  1. Это питание на серверное оборудование? (если вы размещаете офф-сайта)
  2. Ваш хостинг-провайдер вниз?

Я знаю, что много времени может быть потрачено впустую ищет решение, когда проблема апстрима

Dylan Beattie

Я проверяю вещи. Что происходит после этого сильно варьируется в зависимости от результатов пинга.

Rene Saarsoo
Guy

Виноваты сети.

(это шутка!)

Dillie-O

RTFLF - прочитать файл журнала, твою мать

(Я не могу взять кредит для этого, все идет к Скотт Хансельман)

Stewart

Не пытайтесь исправить что-нибудь еще.

Убедитесь, что вы точно знаете, что реальные, лежащие в основе, проблема. Теперь, начиная ремонт. Если есть несколько вещей, чтобы исправить, необходимо тщательно продумать, какие дела может быть отложено (надеюсь до следующего рабочего дня, по крайней мере!) и которые обязательно должны быть исправлены.

Но самое главное: после того, как все это работает, спросите, почему "все взорвать"? Что вы собираетесь сделать, чтобы снова предотвратить это происходит? Существуют ли какие-либо шаги, что бы принять решение легче, если он делает повторится?

Adriano Varoli Piazza

Проверить проводку! Я потерял часы проверять другие вещи, когда простой интерфейс eth0 кабель замены проблема была бы решена...

Brian Rasmussen

Пусть люди знают, что ты на нем и, если возможно, дать им оценку, когда все вернется к нормальной жизни.

Как для фактического устранения неполадок, которые, очевидно, зависит от того, что это неправильно. Я обычно держу коллекцию "проверить статус" скрипты для различных услуг.

Guy

Вы должны иметь планы действий в чрезвычайных ситуациях.

Необходимые системы должны быть разработаны с автоматическим переходом на другой ресурс или документально и тестирование плана восстановления.

Более важная система, чем больше устойчивости нужно построить и более автоматическим и должно быть.

Если вы не имеете один, тогда это было не важно, был он!

BIBD

Убедитесь, что резервную копию вашего резюме является безопасным :) потом,

Найти общие черты. Что общего для всех систем, которые влияют.

Найти, что изменилось. Вы должны иметь некоторые формальные управление изменениями происходит в вашей организации.

Где новый парень... где твой босс...? Один из них срезать? (это просто быстрая перезагрузка сервера, что это может навредить)

Artur Carvalho
l0c0b0x

Это сложно с заявлением предоставить определенный набор действий. Ваш первый шаг будет основываться на:

  • Где вы находитесь
  • Сколько информации вы в состоянии выжать из человека, который связался с вами
  • Какие инструменты у вас есть под рукой для устранения неполадок (или информационного поиска)
  • Ваши знания о физических и логических путей сети
  • Сколько вы будете (часть команды? или одинокий ниндзя?)

Очевидно, что нужно сохранять спокойствие и предупредить о проблеме. Ваш опыт поиска и устранения неисправностей сети будет преподавать вам, что это вполне может быть что-то простое, как:

  • Отключенный кабель
  • Неожиданный ремонт (другая технология 'ремонт' вещи)
  • Ваш генеральный директор переигрываешь о компании будучи полностью обречен после его беспроводного подключения ноутбука потерян из-за его/ее в микроволновой печи пиццу с сыром.

Сказав это, он также может быть что-то серьезное в категориях:

  • Физического транспорта (связи)
  • Оборудование (\маршрутизатор переключатель\сервер)
  • Хранения (непроходимые\взломан\удалено)
  • Программного обеспечения (услуги по неправильно\атакован\оффлайн)

Ключевым компонентом является, как много вы знаете о проблеме. Какова ваша точка отсчета? (от того, что перспектива 'систему'?).

Cawflands

Проверьте DNS.

Robert

Начните с простого и работать в направлении абсурда.

Власть?

Сети Ethernet?

Программа работает?

...

Инопланетяне?