Как сделать бэкап дорого и неэффективно

И снова про бэкапы. ИТ ландшафт с каждым годом становится сложнее, данных становится больше, бюджеты традиционно не резиновые. Бэкапы — это очень скучно. До того момента, как они вам понадобятся.

Традиционно, три темы для рефлексии.

  1. Кто отвечает за то, чтобы бэкап делался? Простой вопрос, но на него не всегда есть простой ответ. Инфраструктура рапортует, что честно бэкапит все, что ей сказали. Владельцы приложений уверены, что инфраструктура бэкапит все, что должно бэкапиться.
    Есть только одна проблема: из процесса передачи системы в промышленную эксплуатацию иногда выпадает создание заданий на резервное копирование. И из процесса изменений — тоже выпадает. Потому, что как бы очевидно и должно само.
    В итоге все, как мы любим — проблема спряталась на стыке зон ответственности. Система есть, а бэкапа нет. А в случае отсутствия интеграции с управлением изменениями, спрятаться проблема может гораздо глубже — мы будем бэкапить только часть необходимой информации.
  2. Как определить оптимальную частоту и глубину хранения бэкапов? Чаще всего для простоты создается несколько (3-4) типовых шаблонов, а дальше все идет по ним без детального BIA и анализа жизненного цикла данных. А ведь здесь кроется довольно большое пространство для оптимизации как используемых хранилищ, так и пропускной способности сети, для которой массовые бэкапы являются серьезным испытанием. Что-то можно делать не так часто, что-то хранить не так долго, где-то достаточно инкрементального копирования, и т.д. Это — прямая экономия. Да-да, те самые деньги, которых вам в этом году дали так мало.
  3. Репликация резервное копирование. Повышение отказоустойчивости — да, но не резервное копирование. Потому, что репликация :
    • не защищает от логического разрушения данных (да, можно использовать отложенную репликацию, но надо успеть вовремя поймать проблему)
    • не защищает от атаки внутреннего или внешнего злоумышленника
    • не позволит нам восстановить срез данных за прошлый период
    • не обеспечивает соответствия требованиям регуляторов

За кадром осталась еще тема тестирования бэкапов, но это отдельная большая боль. Будем есть слона по частям.

3 элемента успешного On Call процесса

On Call для сотрудника организации — состояние повышенной готовности. Он трезв, на связи, должен ответить на сообщение в любое время суток, и оперативно подключиться к решению проблемы. Почти всегда это элемент процесса управления инцидентами в организации.

Кто-то относится к организации On-Call процесса системно, кто-то считает, что «будет проблема — будем решать», «наши люди не подведут». Как показывает опыт, как раз люди то чаще всего и оказываются самым слабым элементом системы, поэтому поговорим немного о выстраивании процесса. Лучше всего он организован у компаний с большим количеством транзакций в режиме 24х7 (т.е. крупный финтех и телеком), поэтому что-то мы подглядим у них.

Continue reading

Автоматизация непрерывности бизнеса — обзор рынка (2025)

Давно не писал я о рынке иноземных решений по автоматизации BCM, а зря. Надо все-таки за ними приглядывать в полглаза, чтобы не упускать основные тренды в этой области. Итак, обратимся к гуру аналитики.


Gartner перестал делать свои отчеты по BCM Software еще в 2019 году, поэтому сначала идем к SoftwareReviews.

Continue reading

Как все аккуратно сломать, чтобы цена акций выросла?

Итак, сегодня пошла вторая неделя недоступности сети алкомаркетов Винлаб. Давайте посмотрим, как реагирует цена акций материнской компании Новабев на эту ситуацию. Внимание, сюрприз — за неделю цена акций выросла на 4,36%.

Следует ли из этого вывод, что рынку больше нравится, когда компания не работает? Скорее всего нет, но что же тут не так?

Continue reading

Как считать убытки от перерыва деятельности

Я уже давно собирался написать эту заметку, но последней каплей (в прямом и переносном смысле) стала хакерская атака на Винлаб, в результате которой все алкомаркеты сети приостановили свою работу.

В этот раз хакеры покусились практически на святое, поэтому реакция населения оказалась весьма бурной. Общество обсуждает как влияние простоя на акционерную стоимость Новабев (материнская компания сети, торгуется на бирже), так и оценку ущерба от простоя. Но если уж делать что-то, то будем делать это правильно.

Continue reading

BIA: не рублем единым…

Любой крупный инцидент всегда дает возможность чему-то научиться. Если можно это сделать на чужих ошибках — еще лучше. Сегодня мы разберем аварию в датацентре Спортмастера, а точнее — реакцию пользователей на недоступность различных сервисов.

Немного фактов: вечером, в субботу 13.07.2025, на инфраструктуре Спортмастера произошла существенная авария, приведшая к недоступности практически всех сервисов компании примерно на сутки. Не работали магазины, сайт, приложение и т.п. Декларированная причина аварии — затопление датацентров.

Continue reading

Страхование, РНПК и планы непрерывности производства

В этом году число организаций, которые должны иметь планы непрерывности бизнеса, существенно увеличилось. Все организации, которые страхуют перерыв в производстве и задержку начала производственной деятельности, теперь должны иметь план «непрерывности производства / реализации проекта», и этот план будет анализироваться РНПК при заключении договора страхования.

Ну ок, не все, но при страховании рисков свыше 20 млрд. рублей. Учитывая то, что риск страхования перерыва деятельности всегда идет дополнением к страхованию более понятных рисков потери объекта, риск в 20 млрд. не выглядит запредельной суммой.

Continue reading

Атака шифровальщика — есть ли у вас план?

Сценарий атаки шифровальщика — отличный кейс для продвижения идей непрерывности бизнеса в организации. Как минимум, благодаря трем причинам:

  1. Вероятность велика (даже при продвинутой системе безопасности)
  2. Последствия катастрофичны
  3. Восстановление требует вовлечения почти всех подразделений

Удастся ли кому-то отсидеться в сторонке, пока организация будет восстанавливаться? Похоже, что нет, потому что…

Continue reading

Непрерывность бизнеса: оптимизируем расходы. Часть 3 — стратегия

К моменту разработки стратегии у нас уже накоплено достаточно информации о том, какие процессы критичны для организации, ранжированы риски. Пришла пора строить систему защиты. Этот этап будет наиболее ресурсоемким (естественно, мы говорим про строительство, а не про проектирование).

Поэтому перед тем, как начинать строить светлое будущее, необходимо убедиться в том, что строить будем именно то, что надо, и потом не придется все переделывать.

Попробуем определить ключевые принципы стратегии непрерывности бизнеса. Конечно же, для каждой конкретной организации этот набор будет приземлен на специфику предметной области, и дополнится более частными принципами, но общие принципы должны остаться неизменными.

Continue reading

Новые риски 2025 года

В конце 2024 МВД поделилось интересной статистикой: «Мошенники ежедневно совершают порядка 20 млн звонков россиянам, из них «срабатывает» около тысячи«. Это в день. Т.е. за год примерно 350 000 человек попадается на удочку мошенников.

Это примерно каждый 400-й житель России. Здесь будет очень сильное смещение в сторону людей в возрасте, наверное у МВД такая статистика тоже есть, но обратимся к старому доброму принципу Парето. Пусть будет 80% — пенсионеры, 20% — трудоспособное население. Итого, раз в год 1 человек на 2 000 трудоустроенного населения начинает вести себя неадекватно и превращается в марионетку в руках злых сил.

Continue reading