Тестировать, или не тестировать — как найти разумный компромисс

10.08.2009

Задача тестирования HA/DR решений всегда являлась для ИТ-персонала определенной головной болью.

Все сознают, что тестировать надо (не встречал еще ни одного человека, который сказал бы, что тестирование — это зло). Но, когда дело доходит до конкретных действий, креативу на тему «почему мы не можем делать это сейчас» зачастую можно только позавидовать. Среди аргументов присутствует как абсолютно разумное опасение «положить» рабочую систему, так и заявления в духе «все и так будет работать».

Как показывает опыт — само по себе с первого раза практически никогда не заработает, а вот рабочую систему положить можно запросто 🙂 Особенно если взять, и сразу попробовать протестировать комплексное восстановление.

К чему я все это рассказываю? Несколько месяцев назад нам на глаза попалась компания Continuity Software, и на днях мы подписали с ними партнерское соглашение. Продукт у них всего один — RecoverGuard, зато интересный. Задача, которую помогает решить RecoverGuard — убедиться в  том, что ваши HA/DR решения работают. Простая, но нужная. Безусловно, использование RecoverGuard — не замена «боевому» тестированию — но возможность существенно снизить риски сбоев в момент тестирования, а также поддерживать систему в работоспособном состоянии в промежутке между тестированиями.

Давайте посмотрим, что стоит за этими словами.

1. Некорректные конфигурации. RecoverGuard содержит постоянно обновляемую (как инженерами Continuity Software, так и пользователями системы) базу знаний о существующих уязвимостях в архитектуре HA/DR решений от различных производителей. Соответственно, наличие (а точнее, отсутствие) подобных уязвимостей RecoverGuard проверяет в первую очередь. Примерно аналогично проверяется соответствие лучшим практикам, рекомендованным производителями.

2. Расхождение конфигураций. Очень распространенная проблема, когда при внесении изменений (от применения обновлений до апгрейда железа) в продуктивную систему, в резервную систему изменения не вносятся, или вносятся, но не такие. Такого рода расхождения (т.н. configuration drift) RecoverGuard также достаточно легко обнаруживает.

Это две основные функции, которые позволяют предотвратить массу серьезных проблем.

Кроме того, в продукте реализована еще масса приятных возможностей:

  • Оценка выполнимости SLA на основе анализа конфигурации решений
  • Документирование инфраструктуры
  • Механизм alert’ов
  • И т.п.

Для того, чтобы убедиться в полезности продукта, Continuity Software (а в России и СНГ — вместе с Алмитек) предлагает сделать короткий пилот. Устанавливается система, выдаются права на доступ к элементам инфраструктуры (агентов ставить никуда не надо, достаточно только прав на чтение), в течение суток проводится анализ, на основании чего делается отчет. Пилот платный, но и результат полезный в любом случае — текущий срез уязвимостей заказчик получает вне зависимости от того, будет ли решение использоваться в дальнейшем. По утверждению производителя — проблемы обнаруживаются всегда.

Реклама

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

%d такие блоггеры, как: