BRS (backup restore systems) – вы спите спокойно !

Сисадмины делятся на тех, кто еще не делает бэкапы и тех, кто уже делает.
Народная мудрость

Эта народная мудрость появилась не сама по себе, она — плод многочисленных случаев, которые привели к потере самого ценного, что есть у бизнеса, – информации. Как показывают исследования, те компании, которые потеряли рабочие данные за значительный период времени или те, которые не сумели восстановить рабочий режим работы предприятия в сжатые сроки, в большинстве своем  теряли критическую массу заказчиков или вообще приходили к банкротству.

Чтобы разобраться какие шаги нужно предпринять для эффективной защиты данных, первым делом нужно дать определение следующим моментам и понятиям:

ЧТО – какие данные представляют коммерческую ценность и требуют резервного копирования, как они эксплуатируются, какие специфические действия нужно предпринять для того, чтоб созданная резервная копия данных могла быть восстановлена консистентно и без дополнительных трудозатрат.

RPO (Recovery Point Objective) – насколько часто должны проходить процессы резервного копирования, чтобы максимально сузить “окно уязвимости” данных. Мы должны помнить о том, что чрезмерно частое резервное копирование повышает технические требования к комплексу и приводит к увеличению бюджета решения.

RTO (Recovery Time Objective) – точка во времени (PIT – Point In Time) когда Ваши данные будут восстановлены из резервных копий, и инфраструктура выйдет на рабочий режим обслуживания бизнеса. Это понятие имеет прямое отношение к времени восстановления из резервной копии и сопутствующих мероприятий по восстановлению и перезапуску инфраструктуры из резервной копии.

Оптимальное решение задачи резервного копирования представляет собой строгий баланс между этими параметрами. Только тщательный анализ и трезвая оценка позволит создать решение обладающее еще одним важным для бизнеса параметром — приемлемой ценой.

brs_01

ПРОВЕДЕМ ДЕТАЛЬНЫЙ РАЗБОР ПЕРЕЧИСЛЕННЫХ ВЫШЕ ПАРАМЕТРОВ

ЧТО. Современный бизнес  использует в своей работе очень разные типы данных обслуживаемые разными приложениями, каждая комбинация которых требует к себе индивидуального подхода для достижения желаемого результата.

Наиболее часто встречаются следующие основные категории и проблемы с ними связанные:

  • Файловые хранилища (файл-сервисы). Для файл-сервиса проблемным моментом являются открытые на редактирование файлы, которые не могут быть скопированы без создания специфических условий со стороны файл-сервиса.
  • Базы данных. В случае баз данных необходимо принимать меры для обеспечения “завершенности транзакций” и  учитывать в процессе резервного копирования структуру БД и ее распределение по различным таблицам/файлам.
  • Почтовые сервисы. Проблемы связанные с почтовыми сервисами схожи одновременно с файл-сервисами и базами данных: открытые объекты, сохранение инфраструктуры почтового сервиса . Также зачастую может быть необходимо восстановление конкретного письма либо группы писем, но не всего почтового сервера. Наличие подобного функционала важно, поскольку  позволяет значительно экономить время на восстановительные работы.
  • Средства коллективной работы. Большая часть современных средств коллективной работы представляют собой сервер приложений и базу данных, в которой хранятся объекты. Сложности связанные с восстановлением данных не имеют принципиальных отличий от серверов БД
  • Виртуальные машины. Для эффективного резервного копирования виртуальных машин необходимо поддержка сервисом резервного копирования интеграции с гипервизором и операционной системой виртуальной машины функционирующей внутри. Гипервизор по команде средства резервного копирования должен обеспечить очистку кешей операций записи на диск и заморозить состояние машины с целью создания снимка ее состояния который и будет использоваться для создания резервной копии.

RPO. Чтобы определить для бизнеса этот параметр, нужно понимать, что резервное копирование — это инструмент созданий именно копий данных и есть граница “разумности его применения” как с точки зрения требований к оборудованию, так и бизнеса, для достижения непрерывности функционирования систем служат кластера. В случае большого объема данных, непродуманной архитектуре, малой производительности комплекса может случится “нахлест” — предыдущая операция резервного копирования еще не закончилась и уже должна начинаться следующая.

brs_02

 

RTO. Время, затраченное на приведение системы в работоспособное состояние после аварии зависит от:

  • наличия отработанного плана восстановления работоспособности комплекса — Disaster Recovery Plan (DRP). Важно, чтобы такой план существовал не только на бумаге, но и проходил регулярные тесты на соответствие плана реальному состоянию ИТ структуры;
  • квалифицированного персонала в ИТ подразделении, обладающего необходимыми навыками;
  • целостности структуры данных в резервных копиях, в случае нарушения которой придется тратить дополнительное время на правку/восстановление данных  техническим персоналом;
  • производительности и готовности принять в себя восстанавливаемые данные оборудования. Было несколько случаев когда заказчик в момент аварии пытались взгромоздить обработку основных массивов данных на «железо не первой свежести», что приводило к невозможности работы с данными: сервис есть, он функционирует, но ресурсы, доступные ему, недостаточны и первый серьезный запрос приводит к долгому ожиданию результата;
  • производительности сервиса резервного копирования, которая состоит из вычислительных ресурсов, выделенных под сам сервис, и производительности хранилища резервных копий. В случае выделения под задачи сервиса резервного копирования малых ресурсов мы сами себя обрекаем на большое окно RTO и потери. Также нужно помнить , что сложные схемы резервного копирования с большим количеством промежуточных точек повышают требования к ресурсам сервиса резервного копирования и увеличивают RTO.

brs_03

О том, ЧТО мы хотим копировать и о временных интервалах мы уже поговорили. Пора уделить внимание КУДА мы будем копировать наши данные.

На текущий момент в качестве средства хранения резервных копий используются следующие технологии: ленточные приводы, диски в кассетах RDX, системы хранения данных общего назначения, заполненные экономичными дисками, специализированные СХД и внешние хранилища «облачного типа». Справедливости ради нужно отметить, что за термином «облако» скрываются очень большие комплексы ПО и специализированных СХД.

ЛЕНТА. Ключевой элемент – кассетный привод, именно его модель определяет производительность, интерфейс подключения и тип кассеты. На текущий момент подавляющую долю рынка получила технология кассет LTO (Linear Tape Open), эпизодически могут встречаться существующие устройства с лентами DLT/SDLT (Digital Linear Tape / Super DLT) и AIT/S-AIT (Advanced Intelligent Tape / Super AIT). LTO приводы между собой отличаются интерфейсом подключения (USB, SCSI, FC, SAS), форм-фактором корпуса привода (половинный, полный, двойной – больший размер привода позволяет разместить более производительный и долговечный механизм привода) и поддерживаемым стандартом кассеты. Учитывая долгий жизненный цикл технологии было приложено много усилий для обеспечения совместимости: в большинстве случаев привод поколения N может работать с кассетами своего поколения на полной скорости, с предыдущим поколением — на сниженной скорости, и читать кассеты пред-предыдущего поколения на минимальной скорости.

 

Поколение устройств

Параметр LTO-1 LTO-2 LTO-3 LTO-4 LTO-5 LTO-6
Год появления 2000 2003 2005 2007 2010 2013
Физическая ёмкость 100 ГБ 200 ГБ 400 ГБ 800 ГБ 1,5 ТБ 2,5 ТБ
Максимальная скорость (MБ/с) 15 15-40 15-80 60-120 80-140 120-160

 

Физически ленточные решения бывают в следующем виде:

  • отдельные приводы на 1 кассету (USB, SCSI, SAS);
  • автозагрузчики на 6-12 кассет (SCSI, SAS, FC);
  • ленточные библиотеки, поддерживающие от 24 до сотен кассет и от 2 до десятков одновременно работающих приводов (SAS,FC).

Как продукт с многолетним стажем эксплуатации, лента с одной стороны избавилась от всех детских болезней, а с другой стороны стали ясны все ее недостатки.

Плюсы ленты:

  • низкая стоимость отдельного носителя;
  • мобильность носителя, возможность переноса копий данных в защищенное банковское хранилище;
  • низкое энергопотребление.

Минусы ленты:

  •  низкая скорость произвольного доступа к данным из-за последовательного доступа;
  •  отсутствие поддержки де-дупликации;
  •  сложности с одновременным проведением нескольких параллельных сессий резервного копирования;
  •  необходимость дублирования копий для достижения высокой надежности хранения;
  •  жесткие требования к обеспечению скорости источника резервных копий в связи с требованиями механических компонентов привода, нарушение этого правила приводит к преждевременному износу механизма;
  •  большие копии могут быть разделены на несколько кассет и таким образом быть менее надежны;
  •  невысокая максимальная скорость резервного копирования.

RDX — попытка создать простое решение для небольших задач без проблемных моментов ленточных приводов. Представляет собой головной модуль — приемник кассет с жесткими дисками. Этот продукт не получил широкого распространения в наших реалиях в связи с тем, что большинство малых предприятий не уделяют должное внимание проблематике резервного копирования, а для тех организаций, которые обеспокоены сохранностью информации, такой продукт уже не может удовлетворить потребности.

Плюсы RDX:

  • мобильность копий;
  • приличная скорость чтения/записи, как последовательная, так и произвольная.

Недостатки RDX:

  • относительно высокая цена;
  • нужно специфическое ПО резервного копирования.

 

СХД общего назначения. Допустимо использовать в качестве хранилища резервных копий в случае соблюдения следующих параметров:

  • наличие ПО резервного копирования, поддерживающее диск в качестве целевого устройства (очень часто этот функционал является отдельно лицензируемой опцией);
  • СХД должно поддерживать RAID 6 группы большого объема или аналогичную по идеологии технологию;
  • для комфортной эксплуатации СХД должна поддерживать выделение томов/экспортов большого объема.

Все перечисленные параметры вместе не представляют ничего сложного, но нарушение любого из них приводит к невозможности комфортной эксплуатации. Также стоит отметить, что использование резервного ПО  без функционала де-дупликации серьезно увеличивает совокупную стоимость хранения резервных копий, таким образом снижая привлекательность использования СХД общего назначения в качестве хранилища резервных копий. В современных СХД общего назначения могут присутствовать технологии компрессии и де-дупликации блоков данных что в некоторых случаях позволяет применять их под задачу резервного копирования даже с традиционным ПО без расширенного функционала. Каждый такой случай требует очень подробного планирования для достижения желаемого результата.

Специализированные СХД для хранения резервных копий представляют собой оптимизированные программно-аппаратные комплексы. Могут быть представлены как в виде монолитных решений (EMC Data Domain, HP Store Once), так и в виде appliance (IBM ProtecTIER, Fujitsu ETERNUS CS) использующих СХД общего назначения.

Принципиальным отличием специализированных решений от СХД общего назначения являются компрессия и де-дупликация данных в реальном времени. Поток данных, попадающий в комплекс, сжимается немедленно и таким образом полезная емкость дисков специализированного комплекса имеет очень высокую виртуальную емкость.

Плюсы специализированных СХД:

  • очень высокая результирующая емкость решения;
  • возможность всегда использовать резервные копии типа “full” – именно бекапы такого типа требуют меньше всего времени на восстановление из копии в связи с тем, что ПО резервного копирования не имеет необходимости проводить сложную обработку данных и выбирать нужные блоки информации из инкрементальных/дифференциальных резервных копий;
  • вне зависимости от того, какие типы резервных копий мы используем и какие приложения копируем, если в этой резервной копии присутствуют повторяющиеся блоки данных, они будут де-дуплицированы и сжаты;
  • лучшие представители специализированных СХД хранения резервных копий могут реплицировать резервные копии между площадками с учетом де-дупликации и компрессии данных, таким образом требования к пропускной полосе между площадками снижаются в десятки/сотни раз;
  • специализированные драйвера для пакетов ПО резервного копирования позволяют распределить нагрузку между сервером, клиентом и специализированным СХД увеличивая производительность решения;
  • гибкость внедрения — возможность представить систему как файловый ресурс, виртуальную ленточную библиотеку, устройство акселерации;
  • высокая скорость записи/чтения.

Минусы специализированных СХД:

  • для достижения нужных результатов необходима экспертиза на стадии планирования и внедрения;
  • максимальное КПД/минимальное TCO достигается при соблюдении множества факторов.

Дизайн правильного BRS решения требует оценки параметров как вычислительных систем, так и сетевой среды, определения типов и параметров резервируемых систем и объемов информации. Сбалансированные характеристики перечисленных составляющих обеспечивают достижение желаемого результата.

Исследуйте вместе с нашими специалистами Вашу ситуацию в области BRS, получите качественные рекомендации, храните свою информацию надежно!

LinkedIn
< Назад в раздел