Выбор внешнего ЦОД — основные критерии

Sungard Availability Services выпустил рекомендации по выбору ЦОДа для тех, кто планирует использовать для размещения своих серверов услуги внешних ЦОД.

Документ системно написанный, и может быть полезен при составлении чек-листа, разработке RFP и т.п.

В рекомендациях выделяется несколько областей для оценки возможных вариантов ЦОД. Ниже можно найти основные  рекомендации, за более подробной информацией рекомендую обратиться к исходному документу. Продолжить чтение «Выбор внешнего ЦОД — основные критерии»

Наводнение в Австралии. Кризисная коммуникация 2.0

Мир реально меняется на глазах. Посмотрите на страничку Queensland Police Service на Facebook (Queensland — штат на северо-востоке Австралии, на который в эти дни обрушилось наводнение) . Четко и эффективно. Как для массового информирования, так и для получения обратной связи.

Достойный пример для подражания.

Забастовки в лондонском метро, или встречаем снежные заносы

Вчера вечером  четвертый раз с августа текущего года лондонское метро закрылось на сутки на забастовку. Закрылось, правда, не полностью (утверждается, что 80% станций открыто, и 45% поездов вышли на маршрут), но достаточно, чтобы создать в городе качественный транспортный коллапс (красные точки на картинке обозначают закрытые станции метро). Для понимания масштаба бедствия — в городах масштаба Москвы или Лондона метро в сутки перевозит порядка 4 миллионов человек (как правило, туда и обратно 🙂  ).

Посмотрим на происходящее с точки зрения управления непрерывностью бизнеса.  Сотрудники не могут добраться до работы. Ситуация в Лондоне еще относительно хороша тем, что о забастовке было известно заблаговременно. Гораздо чаще проблемы с транспортной доступностью возникают неожиданно, как результат серьезных аварий, терактов, или природных явлений (встречаем грядущий снегопад 🙂 ).  Итак, что делать организациям?

Во-первых, оценить масштаб бедствия. В этом заметно помогает  наличие актуальной структурированной информации о том, где проживают сотрудники и как добираются до офиса. В сочетание с прогнозами восстановления транспортного сообщения можно принять решение о необходимости активации тех или иных планов обеспечения непрерывности бизнеса.

Во-вторых, оповестить сотрудников о том, что им необходимо делать. Своевременное указание сотрудникам, без которых можно обойтись в офисе, остаться дома или вернуться с полпути домой поможет как избежать потерь человеческого времени, так и снизить нагрузку на транспортную систему города.

В третьих, проводить периодические учения. Не надо ждать полного коллапса — воспользуйтесь ближайшим серьезным снегопадом и отработайте возможность работы из дома.

Очевидно, все это должна сопровождать серьезная технологическая подготовка. Ключевым моментом является обеспечение  возможности удаленной работы. По мере расширения использования технологий виртуализации рабочих станций данная задача становится технологически все более простой, но важно не забывать обеспечить возможность одновременной удаленной работы значительного числа сотрудников. Не стоит забывать и про организацию самого процесса принятия решений и информирования персонала. В зависимости от масштаба организации, задачи сбора необходимой информации о сотрудниках и массового оповещения могут быть выполнена как с использованием специализированных решений, так и вручную, но главное — процесс должен быть спланирован и отработан.

От паранойи еще никто не умирал…

Недавно мне попалась на глаза  книга человека, посвятившего свою жизнь вопросам выживания после чрезвычайных ситуаций, James Wesley, Rawles — How to Survive the End of the World as We Know It: Tactics, Techniques, and Technologies for Uncertain Times. Книга достаточно занятна хотя бы тем, что позволяет приоткрыть окно в мир людей, которые реально тратят серьезные деньги и время, существенно меняют образ жизни для того, чтобы создать себе убежище, которое возможно поможет им выжить после «конца света». Чтобы составить себе общее впечатление о масштабе бедствия, загляните на сайт автора, Survival Blog, и вы найдете там массу интересных вещей, о которых вы, возможно, даже не задумывались.  Индустрия поставщиков ресурсов для выживания в Штатах развита изрядно — вы можете купить себе все — от зерна в бочках в наборе с ручной мукомолкой до б/у подземного бункера с запасами воды и продовольствия.  По сравнению с этим, российские 3-4 бункера в год выглядят просто детским лепетом.

При этом, несмотря на явно зашкаливающий уровень паранойи,  среди всех этих советов можно найти и немало полезного, что пригодится вам и в наших «мирных» реалиях. Такие вещи как, например, отсутствие электричества на несколько часов, с нарастающей недоступностью многих привычных нам благ цивилизации — ситуация реальная, и будет лучше, если вы окажетесь к ней готовы.

Чемпионат мира по футболу и непрерывность бизнеса

В этом году прошел ЧМ по футболу в ЮАР. Он запомнился нам тем, что туда не попала наша команда, новым для нашего лексикона словом (и звуком) «вувузела», рядом краж в отелях, задевших гостей ЧМ разного уровня. Тем не менее, серьезных проблем, результатом которых могли бы стать человеческие жертвы, разрушения, и т.п. —  не было. Благодаря чему — тщательной подготовке или удачному стечению обстоятельств? На эту тему наши южноафриканские коллеги опубликовали целый отчет, посвященный  организации непрерывности бизнеса на ЧМ по футболу 2010.

Когда я начал читать отчет, мне  вспомнился проект по внедрению продукта Incident Manager в одной нефтяной компании. Тогда я первый раз вживую увидел, как устроен центр управления инцидентами, как в реальной жизни отрабатываются происшествия. Для себя я тогда вынес три ключевых слагаемых успеха подобных проектов:

  1. Информация. Крайне важно наличие механизмов сбора, верификации, распространения информации с минимальными искажениями. Для последующего разбора полетов важно также качественное протоколирование происходящего.
  2. Простота. Когда горит нефтяная вышка или происходит ЧП в местах массового скопления народа, сложные решения не работают. Все процессы и инструменты должны быть настолько просты (и надежны), насколько это возможно.
  3. Подготовка. В момент ЧП люди плохо делают даже то, к чему они привыкли. То, чего они никогда не делали (не репетировали, не отрабатывали хотя бы в режиме учений) — они сделать не смогут.

Похожий подход я встретил и у коллег из ЮАР. Возможно, южноафриканский опыт покажется полезным и организаторам нашей Олимпиады-2014.

PD 25666:2010 — проводим учения правильно

В дополнение к уже существующим стандартам и спецификациям BS 25999, BS 25777, ISO/PAS 22399 и BS ISO/IEC 27001, BSI выпустил документ PD 25666 ‘Guidance on exercising and testing for continuity and contingency programmes’, содержащий рекомендации по проведению учений, тестированию отдельных  элементов системы обеспечения непрерывности бизнеса и т.п. Доступен на сайте BSI за 95 фунтов.

Эйяфьятлайокудль — учимся правильно произносить и добавлять нужные слова после

Похоже, что знаменитый исландский вулкан никак не успокоится, и еще будет некоторое время доставлять нам неудобства. Постараемся извлечь из этого неприятного факта хоть какую-то пользу, и посмотрим на конкретных примерах, как нужно правильно взаимодействовать с потребителями в случае, если вы не можете предоставлять им свой сервис.

Итак, немного истории. То извержение вулкана, после которого начались серьезные перебои с авиасообщением, случилось 14 апреля.  Утром 15 апреля начали закрываться европейские аэропорты (историю развития событий можно освежить в памяти здесь). Через какое-то время люди начали понимать, что помимо неожиданно исчезнувшего  способа перемещаться в пространстве, они начали  сталкиваться с такими проблемами, как задержки грузов, и т.п.

Любопытства ради я решил посмотреть, как компании, занимающиеся экспресс-доставкой, планируют выполнять свои обязательства. Заглянув 17 апреля на сайты основных игроков рынка, только у UPS я обнаружил какую-либо  информацию на данную тему. К сожалению, я не знаю, было ли это прописано в планах обеспечения непрерывности бизнеса UPS, или было просто продиктовано здравым смыслом (если этот пост читают коллеги из UPS — буду признателен за комментарий), но представители компании сделали сразу несколько правильных вещей: Продолжить чтение «Эйяфьятлайокудль — учимся правильно произносить и добавлять нужные слова после»

Шифрование резервных копий и резервирование средств шифрования

Все знают, что регулярное резервное копирование это хорошо и правильно. Этот тезис даже не обсуждается, а поговорим мы о том, как данный процесс, обеспечивая доступность данных, влияет на их защищенность. Кроме того, отдельно мы посмотрим на то, как осуществлять резервное копирование собственно средств шифрования. Данный пост не содержит рекомендаций по выбору или настройке решений по резервному копированию, а посвящен исключительно вопросам проектирования архитектуры.

Часть 1. Резервные копии

Что происходит с резервными копиями после того, как вы их сделали? Существует несколько вариантов — носитель лежит под замком в том же офисе,  носитель регулярно выносится за пределы помещения, либо отчуждаемого носителя как такового нет, потому что резервное копирование делается на СХД внешнего провайдера, либо на СХД на другой площадке организации, т.н. cross-site backup. В большинстве случае, надо исходить из того,  что уровень защиты этих данных на «периметре» практически нулевой.  Чтобы не быть голословным — несколько заметных примеров хищения лент с резервными копиями.

Итак, правило №1 — обязательное шифрование резервных копий, предназначенных для хранения на отчуждаемых носителях. Продолжить чтение «Шифрование резервных копий и резервирование средств шифрования»

Webinar по автоматизации процессов управления непрерывностью бизнеса

29 апреля в 15:00 я постараюсь в течение одного часа дать обзор текущей продуктовой линейки SunGard Continuity Management Solution, и как с помощью этих продуктов автоматизировать жизненный цикл управления непрерывностью бизнеса.

С декабря прошлого года линейка SunGard CMS заметно расширилась, и про все решения  в комплексе мы  еще ни разу не рассказывали.

Из новых решений речь пройдет про три  продукта, дополнивших BIA Professional:

Кроме того, будет рассказано и про функциональность, появившуюся в новых версиях продуктов LDRPS и BIA Professional.

Как всегда, Вебинар проходит на русском языке и абсолютно бесплатен 🙂

Update 1: Запись Вебинара доступна здесь.

Восстановление рабочих мест, или как не ходить на работу

На этой неделе посетил конференцию Citrix. Встретил массу добрых знакомых, послушал про последние достижения науки и техники, и даже (хотя и после некоторых шаманских ритуалов) смог убедиться в том, что мой телефон на Андроиде вполне способен выступать в качестве клиентского устройства для Citrix XenApp.  Но кроме всего этого основной лейтмотив конференции побудил меня написать про тему, которую давно уже собирался осветить — восстановление рабочих мест.

Не претендуя на то, чтобы в одном посте дать комплексный набор рекомендаций, постараюсь обозначить основные области, заслуживающие внимание. Продолжить чтение «Восстановление рабочих мест, или как не ходить на работу»