Проблемы с доступностью Amazon Web Services

Три дня заняло у Amazon разрешение проблем с доступностью сервисов EC2 и RDS в одной из зон, North Carolyna.

Amazon Web Services StatusК размышлению о том, как резервировать облачные сервисы — в разных зонах, у разных провайдеров, в частных облаках….

Готовы ли вы к чрезвычайной ситуации?

Похоже, что нет. По-крайней мере, готовы хуже, чем были три года назад…

Forrester Research опубликовал отчет «Wake-Up Call: You Aren’t Ready For A Disaster», посвященный оценке уровня подготовленности организаций к наступлению чрезвычайной ситуации. Не то, чтобы все было совсем плохо, но цифры четко свидетельствуют — кризис и сопутствующее сокращение затрат не прошли даром. Основные проблемные области, в которых зафиксировано ухудшение  — актуальность планов и их регулярное тестирование. Если в 2007 тестировали свои планы чаще, чем раз в год, 58% организаций, то в 2010 это число снизилось до 42%. В результате, например, по факту случившихся чрезвычайных ситуаций процент организаций с нулевым фактическим временем восстановления  снизился с 30% до 13%.

Надежда на технологии, как показывает опыт, себя не оправдывает — одних технологий явно недостаточно. Если внимательно проанализировать все цифры, ситуация не драматичная, но в сочетании с ростом угроз природных ЧС — есть повод обратить больше внимания на возможные проблемные зоны.

 

IPO LinkedIn и Disaster Recovery

Как многие из вас наверное слышали, в этом году LinkedIn выходит на IPO. В соответствии с требованиями законодательства, LinkedIn направил в Комиссию по ценным бумагам (US Securities and Exchange ComissionStatement of registration for an Initial Public Offering — документ, который достаточно любопытен сам по себе для тех, кто желает поближе познакомиться с бизнесом компании.

Но в контексте нашего блога интерес представляет заявление LinkedIn, касающееся рисков, связанных с непрерывностью бизнеса. Продолжить чтение «IPO LinkedIn и Disaster Recovery»

Message Continuity от Google

Расширяя свои облачные сервисы на базе Postini, Google предложила рынку решение по защите (в смысле обеспечения непрерывности) почтовых сервисов, построенных на базе Microsoft Exchange. Обеспечивая постоянную репликацию содержимого Exchange Server на свои сервера, Google позволяет сотрудникам организации в случае сбоя Exchange переключиться на Google Mail, в котором уже будет находиться вся корпоративная почта, контакты и календарь. Да, интерфейс Google Mail будет отличаться от привычного интерфейса Exchange, но, на мой взгляд, с этим можно смириться в условиях ЧС. В качестве дополнительного бонуса организация получает все функции Google Message Security. IMHO, можно рассматривать как опцию при построении стратегии обеспечения непрерывности ИТ-сервисов.

Сколько тратить на непрерывность бизнеса?

Forrester опубликовал любопытный отчет на тему места непрерывности бизнеса в заботах и бюджетах ИТ-подразделений. Согласно отчету, в среднем по миру в 2011 году компании планируют тратить 6-7% от ИТ-бюджета на задачи, связанные с BC/DR. При этом проекты по непрерывности бизнеса в списке приоритетов находятся на 1-2 местах в зависимости от масштаба организаций. Выглядит достаточно правдоподобно, и, что важно,  дает дополнительные аргументы при защите бюджета

Отчет целиком можно загрузить с сайта SunGard.

Управление непрерывностью бизнеса — новинки рынка

Как водится, к концу года вендоры стараются отметиться чем-то интересным. Не остался в стороне и SunGard, выпустивший новую версию Continuity Management Solution 10.7, расширив ее возможностями, которых реально не хватало в проектах.

Во-первых, это Recovery Workflow.

Кстати, объявляется конкурс на лучший перевод термина workflow. Победителю — всеобщее признание и моя личная благодарность 🙂.

Если раньше план непрерывности или аварийного восстановления мог содержать в себе только «плоские» списки задач, то начиная с 10.7 в LDRPS появилась возможность определять деревья принятия решений, зависимости, и альтернативные сценарии.

Теперь для построения workflow, кроме традиционных задач (tasks), можно использовать такие элементы, как точки принятия решений с последующим ветвлением, семафоры ожидания (для синхронизации различных потоков и т.п.), триггеры для запуска внешних workflow, и т.п.

Выглядит это все примерно вот так.

Проектируя Workflow, для любой задачи можно оценить, сколько времени (минимум и максимум) пройдет с момента активации плана до начала ее выполнения, а также сколько времени остается до завершения данного фрагмента плана (на рисунке в правом нижем углу). Эта возможность может оказаться очень полезной при проверке достижимости  RTO для процессов или крупных систем.

Вторая полезная функция — это возможность использования внутри полей Rich Text Formatting.  Благодаря этому результирующий план может приобрести гораздо более аккуратный и современный вид.

Остальные нововведения относятся к интеграции между собой компонентов CMS. Добавился интегрированный вход в систему оповещения NotiFind, раcширились возможности по обмену данными между LDRPS и Incident Manager.

Продукт доступен для заказа — можно успеть до конца года 🙂

Виртуализация и резервное копирование

VEEAM опубликовал результаты опроса 500 крупных компаний по миру, касающегося защиты данных в виртуальных средах. Можно посмотреть на общемировые тренды, на практику использования специализированных/стандартных решений по резервному копированию и т.п. В общем, учитывая бесплатность отчета — проще пробежать своими глазами 🙂

Шифрование резервных копий и резервирование средств шифрования

Все знают, что регулярное резервное копирование это хорошо и правильно. Этот тезис даже не обсуждается, а поговорим мы о том, как данный процесс, обеспечивая доступность данных, влияет на их защищенность. Кроме того, отдельно мы посмотрим на то, как осуществлять резервное копирование собственно средств шифрования. Данный пост не содержит рекомендаций по выбору или настройке решений по резервному копированию, а посвящен исключительно вопросам проектирования архитектуры.

Часть 1. Резервные копии

Что происходит с резервными копиями после того, как вы их сделали? Существует несколько вариантов — носитель лежит под замком в том же офисе,  носитель регулярно выносится за пределы помещения, либо отчуждаемого носителя как такового нет, потому что резервное копирование делается на СХД внешнего провайдера, либо на СХД на другой площадке организации, т.н. cross-site backup. В большинстве случае, надо исходить из того,  что уровень защиты этих данных на «периметре» практически нулевой.  Чтобы не быть голословным — несколько заметных примеров хищения лент с резервными копиями.

Итак, правило №1 — обязательное шифрование резервных копий, предназначенных для хранения на отчуждаемых носителях. Продолжить чтение «Шифрование резервных копий и резервирование средств шифрования»

Webinar на тему «Почему отказывают решения обеспечения высокой доступности?»

22 апреля в 15:00 состоится Вебинар, посвященный типичным ошибкам и проблемам, возникающим в решениях обеспечения высокой доступности и аварийного восстановления (HA/DR), как с ними бороться, и как в этом может помочь RecoverGuard от Continuity Software.

Вебинар на русском, бесплатно, докладчик — я 🙂

Регистрация на Вебинар здесь.

NFPA 1600:2010

NFPA честно с интервалом в три года выпускает очередную версию своего стандарта
NFPA 1600: Standard on Disaster/Emergency Management and Business Continuity Programs.
Как всегда, доступно для бесплатной загрузки  с сайта NFPA.