22 апреля в 15:00 состоится Вебинар, посвященный типичным ошибкам и проблемам, возникающим в решениях обеспечения высокой доступности и аварийного восстановления (HA/DR), как с ними бороться, и как в этом может помочь RecoverGuard от Continuity Software.

Вебинар на русском, бесплатно, докладчик — я 🙂

Регистрация на Вебинар здесь.

Реклама

4 марта CTO компании Continuity Software, Doron Pinhas, предлагает вашему вниманию Вебинар «Downtime Avoidance — Datacenter Management Series«.

В программе Вебинара:

  • Почему простои случаются даже при использовании наиболее передового ПО обеспечения высокой доступности;
  • Какие уязвимости конфигураций встречаются наиболее часто, и как они могут влиять на нормальный ход деятельности;
  • Как переход от периодического тестирования HA-решений к постоянной, автоматизированной верификации конфигураций может повысить показатели восстановления и снизить затраты.

Вебинар пройдет в абсолютно комфортное время — 22:00 по Москве, когда никакие рабочие дела не помешают вам насладиться общением с Дороном 🙂

Ссылка для регистрации тут.

На российском рынке появился еще один интересный производитель решений в области обеспечения непрерывности ИТ-сервисов — компания Neverfail.
В двух словах — решение предназначено для резервирования критически важных приложений (именно приложений, а не серверов) на базе серверных технологий Microsoft. В качестве примера — VMware OEM’ит технологию Neverfail для защиты своего vCenter — так называемый VMware vCenter Server Heartbeat, о чем я уже писал некоторое время назад. Акцент на слове «приложения» я сделал сознательно, т.к. NeverFail «понимает» определенное количество приложений, и что им нужно для нормального функционирования. Это может быть как один сервер, так и несколько — например, решение по резервированию почтового сервера BlackBerry Enterprise Server включает в себя резервирование Exchange, Sharepoint, Antivirus, SQL Server. Как они увязаны между собой, в какой последовательности поднимать какие сервера — об этом всем заботится сам Neverfail.
Резервировать приложения можно в четырех режимах:
  • HA — локально (для защиты от сбоев оборудования)
  • DR — географически распределенный кластер  (для защиты от ЧС)
  • Cluster Protector — локальное резервирование делается средствами MS Cluster, а удаленное — средствами Neverfail
  • Tetriary — объединение HA и DR.
При работе через WAN используется проприетарный механизм дедупликации, за счет чего заметно сокращается требование к ширине канала.
Еще из приятных вещей — возможность строить любые комбинации из виртуальных и физических серверов — можно делать резервированиеP-P (physical-to-physical), P-V (physical-to-virtual), V-V (virtual-to-virtual). В режиме Tetriary комбинаций еще больше 🙂 Появляется возможность, например,  cэкономить на оборудовании для резервной площадки, при ее совместном использовании несколькими компаниями (в варианте physical-to-virtual).
На мой взгляд решение может быть интересно тем, кто:
  1. Имеет ИТ-инфраструктуру, построенную на серверных технологиях Microsoft (или хочет отдельно зарезервировать часть инфраструктуры, построенную на решениях Microsoft)
  2. Только начал строить HA/DR инфраструктуру, или существенно ее расширяет (например, оборудует удаленную площадку).
Например, банки среднего размера, озаботившиеся обеспечением соответствия требованиям положения 242-П. Если ядро банковской системы построено на технологиях Microsoft, то решение от Neverfail — быстрый и достаточно простой вариант.

Начало 2010 ознаменовалось для компании Continuity Software сразу двумя важными событиями.

Во-первых, продукт RecoverGuard версии 4.0 получил серебро от TechTarget’s Storage magazine’s and SearchStorage.com в номинации Backup and Disaster Recovery Software and Services.
Практически одновременно с этим на рынок была выпущена новая версия — RecoverGuard 5.0, о возможностях которой я расскажу поподробнее.
Read the rest of this entry »

2010 год начался неожиданно бурно, что, впрочем, стало приятной неожиданностью. Похоже, есть шанс, что в этом году наша страна не будет находиться в состоянии затянувшихся каникул до 8 марта, а начнет наверстывать упущенное за прошлый, «кризисный» год.

Мы тоже решили не отставать, и в первом квартале запустили акцию, направленную на то, чтобы те из вас, кто отвечает за непрерывность ИТ-сервисов, начали год с внешнего [инструментального] аудита своих HA/DR решений, чтобы получить дополнительную информацию о том, что необходимо сделать в текущем году, где есть проблемы, о которых вы, возможно, не подозреваете, а где есть возможности для повышения эффектвности, или даже снижения затрат. В качестве инструмента для проведения аудита было выбрано решение RecoverGuard нашего партнера Continuity Software.

А в качестве бонуса тем, кто начнет свой год с повышения отказоустойчивости своей инфраструктуры достанется поездка в Израиль — короткий курс по принципам работы системы в учебном центре Continuity Software в Тель-Авиве, reference visit в одну из компаний-пользователей RecoverGuard, ну и возможность немного отдохнуть и поплавать под ласковым израильским солнцем — март-апрель самое подходящее время для визита в эту страну.

Более подробную информацию о нашей акции можно посмотреть здесь.

Сегодня на российском блоге VMware проскочил вполне доходчивый пост о том, как обеспечить непрерывность работы VMware Virtual Center. Речь идет про продукт VMware vCenter Server Heartbeat, в девичестве — продукт компании NeverFail, о решениях которой я напишу существенно более подробно в течение ближайшей недели-двух. VMware Russia — прошу любить и жаловать 🙂

В начале октября  компания VMware выпустила новую версию своего продукта для обеспечения послеаварийного восстановления — Site Recovery Manager 4.0. 

В честь этого события я решил сделать небольшой обзор HA/DR решений от VMware с целью более корректного позиционирования решений и понимания существующих ограничений. Этот текст предназначен не для продвинутых инженеров VMware, которые вряд ли найдут здесь что-то новое для себя, но для специалистов, определяющих архитектуру HA/DR решений, и желающих понять возможности, предоставляемые продуктами VMware.

VMware High Availability (HA)

VMware High AvailabilityVMware HA позволяет в случае выхода из строя одного из серверов кластера ESX перезапустить все гостевые машины на оставшихся серверах. Решение является аналогом Active-Passive кластера из мира «железных» серверов, за исключением того, что не возникает проблем расхождения конфигураций, которая серьезно осложняет жизнь администраторов, обслуживающих большой парк серверов. Незначительным недостатком данного решения является определенное, хотя и небольшое, время восстановления (RTO), необходимое на перезапуск вирутальной машины.
VMware HA не требует дополнительного лицензирования, доступен для vSphere, начиная с версии Essential Plus.

 VMware Fault Tolerance (FT)

VMware Fault ToleranceVMware FT отчасти напоминает Active-Active кластер, но при ближайшем рассмотрении фунционирует принципиально по другому. Целью использования FT является обеспечение практически нулевого RTO в случае выхода из строя сервера ESX. Достигается это параллельным выполнением виртуальных машин на двух соседних серверах на уровне параллельного выполнения команд процессора. При этом весь вывод на дублирующей виртуальной машине подавляется на уровне гипервизора. Основным ограничением данной технологии на сегодняшний момент является невозможность использования FT для виртуальных машин с числом процессоров больше одного, а также невозможность создания FT кластера из машин, построенных на процессорах различной архитектуры. Кроме того, естественным ограничением является требование хранения виртуальных машин на разделяемой СХД.
VMware FT не требует дополнительного лицензирования, доступен для vSphere, начиная с версии Advanced.

VMware Site Recovery Manager (SRM)

В отличие от двух предыдущих решений, обеспечивающих локальные отказоустойчивые решения, SRM позволяет создавать распределенные решения для послеаварийного восстановления.
На DR-сайте разворачивается самостоятельная виртуальная инфраструктура, по мощности достаточная для выполнения виртуальных машин, которые планируется перенести в случае выхода из строя основного сайта. Из дополнительных элементов на обоих площадках разворачивается vCenter Site Recovery Manager.
В момент чрезвычайной ситуации отрабатывается план(ы) послеаварийного восстановления, которые определяют последовательность «выключения» виртуальных машин на основном сайте (если он доступен), и их запуска на DR сайте. Если в «мирное» время DR сайт используется для решения других задач, то SRM позволяет перед выполнением плана аварийного восстановления временно перевести в оффлайн функционирующие на сайте машины, и начать их восстановление  после того, как отработает DR план.
 Из основных отличий SRM версии 4 от предыдущей версии:
  • Поддержка vSphere;
  • Возможность работать с shared DR сайтами, что позволяет использовать один DR сайт для резервирования нескольких основных сайтов;
  • Поддержка переноса машин, работающих в режиме Fault Tolerance;
  • Расширенная поддержка СХД — NFS, iSCSI, Fiber Channel.
При использовании решения важно учитывать, что SRM никоим образом не обеспечивает репликацию данных — образы виртуальных машин реплицируются средствами СХД.
Site Recovery Manager лицензируется, как отдельный продукт.
%d такие блоггеры, как: