Управление непрерывностью бизнеса — новинки рынка

Как водится, к концу года вендоры стараются отметиться чем-то интересным. Не остался в стороне и SunGard, выпустивший новую версию Continuity Management Solution 10.7, расширив ее возможностями, которых реально не хватало в проектах.

Во-первых, это Recovery Workflow.

Кстати, объявляется конкурс на лучший перевод термина workflow. Победителю — всеобщее признание и моя личная благодарность 🙂.

Если раньше план непрерывности или аварийного восстановления мог содержать в себе только «плоские» списки задач, то начиная с 10.7 в LDRPS появилась возможность определять деревья принятия решений, зависимости, и альтернативные сценарии.

Теперь для построения workflow, кроме традиционных задач (tasks), можно использовать такие элементы, как точки принятия решений с последующим ветвлением, семафоры ожидания (для синхронизации различных потоков и т.п.), триггеры для запуска внешних workflow, и т.п.

Выглядит это все примерно вот так.

Проектируя Workflow, для любой задачи можно оценить, сколько времени (минимум и максимум) пройдет с момента активации плана до начала ее выполнения, а также сколько времени остается до завершения данного фрагмента плана (на рисунке в правом нижем углу). Эта возможность может оказаться очень полезной при проверке достижимости  RTO для процессов или крупных систем.

Вторая полезная функция — это возможность использования внутри полей Rich Text Formatting.  Благодаря этому результирующий план может приобрести гораздо более аккуратный и современный вид.

Остальные нововведения относятся к интеграции между собой компонентов CMS. Добавился интегрированный вход в систему оповещения NotiFind, раcширились возможности по обмену данными между LDRPS и Incident Manager.

Продукт доступен для заказа — можно успеть до конца года 🙂

Чемпионат мира по футболу и непрерывность бизнеса

В этом году прошел ЧМ по футболу в ЮАР. Он запомнился нам тем, что туда не попала наша команда, новым для нашего лексикона словом (и звуком) «вувузела», рядом краж в отелях, задевших гостей ЧМ разного уровня. Тем не менее, серьезных проблем, результатом которых могли бы стать человеческие жертвы, разрушения, и т.п. —  не было. Благодаря чему — тщательной подготовке или удачному стечению обстоятельств? На эту тему наши южноафриканские коллеги опубликовали целый отчет, посвященный  организации непрерывности бизнеса на ЧМ по футболу 2010.

Когда я начал читать отчет, мне  вспомнился проект по внедрению продукта Incident Manager в одной нефтяной компании. Тогда я первый раз вживую увидел, как устроен центр управления инцидентами, как в реальной жизни отрабатываются происшествия. Для себя я тогда вынес три ключевых слагаемых успеха подобных проектов:

  1. Информация. Крайне важно наличие механизмов сбора, верификации, распространения информации с минимальными искажениями. Для последующего разбора полетов важно также качественное протоколирование происходящего.
  2. Простота. Когда горит нефтяная вышка или происходит ЧП в местах массового скопления народа, сложные решения не работают. Все процессы и инструменты должны быть настолько просты (и надежны), насколько это возможно.
  3. Подготовка. В момент ЧП люди плохо делают даже то, к чему они привыкли. То, чего они никогда не делали (не репетировали, не отрабатывали хотя бы в режиме учений) — они сделать не смогут.

Похожий подход я встретил и у коллег из ЮАР. Возможно, южноафриканский опыт покажется полезным и организаторам нашей Олимпиады-2014.

Business Continuity Russia — приглашение к участию

На Business Continuity Russia (проходящей в рамках выставки Инфобезопасность-2010 5-7 октября) я веду круглый стол «Чрезвычайные ситуации – реальный опыт выживания». Предварительное время — 6 октября, 13:45.

На круглом столе будут выступления компаний, которым пришлось в условиях реальной масштабной чрезвычайной ситуации использовать свои наработки в области непрерывности бизнеса.

Если вам есть, что рассказать — пишите, еще есть пара свободных слотов.

Хороший пример грамотной кризисной коммуникации, или как Москва борется с ураганами

На этой неделе Москва начала сталкиваться с ранее невиданными природными явлениями, такими, как ураганы и ливни, накрывающие весьма ограниченную территорию. Но зато уж от души.

Одним из таких ураганов накрыло датацентр DataLine на Боровой.  При этом были серьезны повреждены три внешних чиллера, что привело к временному выходу из строя системы кондиционирования ЦОД. Происшествие для ЦОДа более чем серьезное. Анализируя происходящее, хочется отметить три вещи:

  1. Коллеги довольно четко отработали ситуацию со своими клиентами, объяснив суть проблем и вместе приняв решение об управляемом выключении части оборудования.
  2. На сайте появилась весьма подробная информация о произошедшем, что позволило избежать ненужных слухов.
  3. Наконец, сами последствия аварии были ликвидированы вполне оперативно и профессионально.

Коллегам — респект, тем, кого пока не затронуло — хороший кейс.

Эйяфьятлайокудль — учимся правильно произносить и добавлять нужные слова после

Похоже, что знаменитый исландский вулкан никак не успокоится, и еще будет некоторое время доставлять нам неудобства. Постараемся извлечь из этого неприятного факта хоть какую-то пользу, и посмотрим на конкретных примерах, как нужно правильно взаимодействовать с потребителями в случае, если вы не можете предоставлять им свой сервис.

Итак, немного истории. То извержение вулкана, после которого начались серьезные перебои с авиасообщением, случилось 14 апреля.  Утром 15 апреля начали закрываться европейские аэропорты (историю развития событий можно освежить в памяти здесь). Через какое-то время люди начали понимать, что помимо неожиданно исчезнувшего  способа перемещаться в пространстве, они начали  сталкиваться с такими проблемами, как задержки грузов, и т.п.

Любопытства ради я решил посмотреть, как компании, занимающиеся экспресс-доставкой, планируют выполнять свои обязательства. Заглянув 17 апреля на сайты основных игроков рынка, только у UPS я обнаружил какую-либо  информацию на данную тему. К сожалению, я не знаю, было ли это прописано в планах обеспечения непрерывности бизнеса UPS, или было просто продиктовано здравым смыслом (если этот пост читают коллеги из UPS — буду признателен за комментарий), но представители компании сделали сразу несколько правильных вещей: Продолжить чтение «Эйяфьятлайокудль — учимся правильно произносить и добавлять нужные слова после»

Webinar по автоматизации процессов управления непрерывностью бизнеса

29 апреля в 15:00 я постараюсь в течение одного часа дать обзор текущей продуктовой линейки SunGard Continuity Management Solution, и как с помощью этих продуктов автоматизировать жизненный цикл управления непрерывностью бизнеса.

С декабря прошлого года линейка SunGard CMS заметно расширилась, и про все решения  в комплексе мы  еще ни разу не рассказывали.

Из новых решений речь пройдет про три  продукта, дополнивших BIA Professional:

Кроме того, будет рассказано и про функциональность, появившуюся в новых версиях продуктов LDRPS и BIA Professional.

Как всегда, Вебинар проходит на русском языке и абсолютно бесплатен 🙂

Update 1: Запись Вебинара доступна здесь.

Twitter и коммуникации в управлении инцидентами

Неплохая идея на тему использования Twitter для внешних коммуникаций промелькнула в статье Steve Dance. И действительно, если Твиттером пользуются даже террористы, почему бы не использовать этот инструмент в мирных целях для внешних коммуникаций?

Важной  задачей в коммуникациях после ЧС является обеспечение достаточного уровня открытости, чтобы ваши клиенты, пресса, и прочие заинтересованные лица обладали достоверной информацией о том, как проходят восстановительные работы. В противном случае слухи и домыслы с большой вероятностью будут гораздо хуже, чем реальное положение дел (если вы, конечно, занимаетесь процессом восстановления).  И здесь Твиттер может оказаться весьма неплохим подспорьем. Очевидно, что как у любого решения, у него есть плюсы и минусы.

Плюсы:

  1. Получать твиты легко, для этого может использоваться масса устройств, в том числе мобильных.
  2. Завести учетную запись в Твиттере, даже если у ваших клиентов ее нет — дело 5 минут.
  3. Это абсолютно бесплатно и не зависит от вашей инфраструктуры.
  4. Вы можете использовать Твиттер также и как инструмент обратной связи. По крайней мере для части ваших клиентов (например VIP, пресса).
  5. Сохраняется история коммуникаций, что важно как для пользователей, которые начали отслеживать происходящее не с начала событий, так и для последующего «разбора полетов».

Минусы:

  1. Практически полное отсутствие конфиденциальности информации (впрочем, иногда это может являться и плюсом).
  2. Относительно невысокий (пока) уровень использования Твиттер массами.
  3. Негарантированная доставка сообщений (пока пользователь его сам не прочтет).

Глядя на эти плюсы и минусы, можно отвести для Твиттера достаточно четкую нишу — один из каналов информирования широкой общественности о ходе восстановительных работ. При этом вы не выходите за рамки вашей целевой аудитории (сообщения читают только те, кто подписался), и можете избирательно устанавливать двухсторонние коммуникации.

Для внутренней же коммуникации (команды восстановления, сотрудники) лучше все-таки использовать классические способы, позволяющие убедиться в том, что сообщение доставлено — телефон (с использованием иерархических списков обзвона), либо специализированные решения, которые будут пытаться  использовать все доступные каналы (телефоны,  почта, SMS и пр.) для того, чтобы найти человека и получить подтверждение о том, что сообщение получено.

2012 — конец света, или повод купить новый календарь?

Итак, 21 декабря 2012 года у нас кончается календарь. Достойный, проверенный тысячелетиями, один из трех календарей индейцев Майя. Поскольку некоторая часть земного шара считает это событие весьма тревожным (действительно, жить без календаря крайне неудобно), я планирую посвятить некоторое количество постов, объединенных темой 2012, «проблеме 2012 года».

Оговорюсь сразу — я не планирую разводить у себя в блоге дискуссию о том, случится что-нибудь в 2012 году, или нет, основываясь на предсказаниях индейцев Майя, Нострадамуса, пересказа статей из желтой прессы и проч.  Более того, такого рода флейм будет безжалостно вычищаться. Тем не менее, есть два направления, которым я буду уделять внимание. Это:

  1. Достоверная статистика, касающаяся чрезвычайных происшествий природного характера — землетрясения, наводнения, сели, ураганы  и прочая нечисть.  Такая информация позволяет оценивать ситуацию максимально объективно, и взвешенно определять стратегию собственного поведения.
  2. Методология того, как противостоять масштабным чрезвычайным происшествиям природного характера. К сожалению, вне зависимости от близости к «концу света», такие происшествия случаются, и лучше, если вы (как отдельный человек, семья, или организация в целом) окажетесь к ним готовы. Если предчувствие «конца света» поможет вам, например,  убедить руководство компании уделять больше внимания вопросам непрерывности бизнеса  — ну что же,  будет хоть какая-то польза от этого ажиотажа.

Как спасали Гаити, или технологии управления инцидентами

Думаю, что почти все из вас  хоть раз, да видели Центр управления инцидентами (ЦУИ). Большая часть — в кино или в новостях, а некоторые и в жизни. Вне зависимости от используемых технологий, специфики отрасли, места нахождения и т.п. функции у такого центра примерно одинаковые:

  • Сбор информации о происходящем из всех доступных источников
  • Консолидация, верификация и анализ информации
  • Управление командами восстановления
  • Информирование всех вовлеченных сторон — прессы, официальных органов, родственников потерпевших и т.п.

Теперь немного о технологиях. В течение долгого времени неизменными атрибутами такого центра были:

  • Телефоны (много)
  • Доски (whiteboards), на которых записывалась вся информация
  • Карты, в которые втыкались разнообразные флажки.

В принципе, как и любая проверенная десятилетиями, если не веками, технология, она работает. Надежно? Да. Эффективно? Не очень. Давайте посмотрим, какие основные проблемы возникают.

Продолжить чтение «Как спасали Гаити, или технологии управления инцидентами»