Как это работает?
Звездность гостиницы определяет уровень обслуживания клиентов и сервис, который они получают. Если провести аналогию между отелем и ЦОД, то можно заметить, что и в первом, и во втором случае используется уровневая классификация: за качество обслуживания гостинице присуждается звездность — от одной до пяти, а надежность ЦОД оценивается по 4-балльной системе и соответствует Tier 1, 2, 3 и 4. Доступность и безопасность ЦОД, как и звездность отелей, увеличивается с порядковым номером уровня. Из этого следует, что при выборе IaaS-провайдера, который использует ЦОД в качестве облачной площадки, для размещения собственного серверного оборудования или вычислительных мощностей следует учитывать уровень ЦОД.
Центр обработки данных
ЦОД — отдельное специализированное помещение с максимально проработанной инженерной инфраструктурой и толстым каналом связи для обработки, хранения и распространения информации с помощью консолидации вычислительных ресурсов и сопутствующих технологий.
Если по-русски: центр обработки данных является большой серверной комнатой с десятками тысяч стоек, на которых хранятся и перерабатываются данные с очень большой скоростью. Но ЦОД — это не просто кучка серверных шкафов в машинном зале. Совокупность различных технологий, вроде перераспределения нагрузок, позволяет максимально эффективно использовать каждый мегабайт оперативной памяти, а это, в свою, очередь позволяет достигать 100% аптайма и соблюдения самых требовательных SLA.
На данный момент самый актуальный стандарт проектирования и построения ЦОД — Tier 3 TIA 942 (Rated 3 Data Center). Стандарт TIER разработала компания Uptime Institute и на него равняется весь мировой рынок. Существует и следующая ступень — Tier IV, но количество ЦОД получивших такую сертификацию — единицы (сейчас это пытается сделать DataPro).
Требования к инфраструктуре достаточно жесткие, но это и является гарантом качества работы центра. Сюда входят такие параметры как: подключение к как минимум двум операторам связи, резервирование магистральных кабелей СКС, ИБП, ЦП маршрутизаторов, обязательная маркировка всех патч-панелей, розеток, кабелей, шкафов. Одно из главных преимуществ спецификации Tier 3 — возможность проведения ремонтных и аварийных работ (вплоть до замены компонентов) без остановки работы, благодаря тому, что все инженерные системы в нём зарезервированы.
Что такое Tier 2 и Tier 3?
Вышедшее из строя оборудование заменяется в течение не более 4 часов.
Резервирование всех элементов инфраструктуры
Отсутствует единая точка отказа. Выход из строя любого узла приводит в мгновенному автоматическому распределению его функций среди резервных элементов. Это касается полностью всех элементов инфраструктуры – каналов доступа в сеть Интернет, сетевого оборудования, серверов, систем хранения данных (SAN).
Электропитание
Для обеспечения электроснабжения центра обработки данных (ЦОД) проложено два независимых кабеля средневольтного напряжения, подключенных со стороны Latvenergo к высоковольтным подстанциям, а в самом ЦОД – к двум независимым распределителям. Специально для нужд центра обработки данных (ЦОД) построена подстанция средневольтного напряжения с сухими трансформаторами, что уменьшает риск пожара. В электроинсталляции центра обработки данных (ЦОД) использованы медные кабели с огнеупорной изоляцией. Всё низковольтное и средневольтное оборудование является совершенно новым и соответствует требованиям стандартов безопасности ЕС, прогнозируемый срок эксплуатации – не менее 35 лет (до 2050 года).
Источник бесперебойного питания (UPS)
В центре обработки данных (ЦОД) обеспечиваются две полностью независимые системы UPS, разработанные в соответствии с самыми высокими требованиями TIER IV. Такой порядок является дополнительным гарантом безопасности, так как таким образом обеспечивается работа расположенного в центре обработки данных (ЦОД) оборудования с двух симметричных сторон. Кроме того, он не допускает перенапряжения и искажения сети Latvenergo или попадания высоковольтных шумов в цепи электроснабжения оборудования. Коэффициент полезного действия равномерен на всем диапазоне напряжения и достигает 96%.
Пожарная безопасность
В центрах обработки данных установлена автоматическая система пожаробезопасности, использующая для тушения инертный газ.
Физическая безопасность
Отделенный периметр вокруг помещений центра обработки данных, круглосуточная физическая охрана, комбинированный контроль доступа RFID и биометрии, удаленное видеонаблюдение и архив записей.
Системы кондиционирования и вентиляции
Система кондиционирования разработана на базе энергоэффективной технологии free–cool, предусматривающей использование для охлаждения как можно большего объема воздуха с улицы без дополнительного использования систем кондиционирования. Работа вентиляторов и насосов управляется в зависимости от необходимого объема подачи холода, с использованием технологии инверторного управления.
Отечественные сертификаты для малых ЦОД и госзаказчиков
Однако в сертификации Uptime есть и свои недостатки. Прежде всего, это высокая стоимость проведения аудита на соответствия требованиям отказоустойчивости. «Цена сертификата Uptime на дизайн ЦОД составляет около 5 млн. руб. и почти не изменяется в зависимости от объема площадки, поэтому ее делают только коммерческие ЦОД от 500 стоек и выше для привлечения крупных и требовательных клиентов в «колокейшн» и облака, а также создания позитивного имиджа», — говорит Петр Царьков.
Таким образом, нацстандарт может оказаться востребован в нише небольших дата-центров, для которых проведение сертификации Uptime экономически нецелесообразно. Предполагается, что в национальной системе стоимость сертификации будет минимальной. По словам Видии Железнова, в отечественной системе сертификации не будет проводиться столь глубокий аудит, как в случае с Uptime Institute, следовательно, стоимость услуги по сертификации будет ниже. «По сути, сертификация будет носить заявительный характер», — говорит он.
В свою очередь, Дмитрий Басистый утверждает, что закрытый стандарт частной компании позволяет диктовать рынку любую цену, а открытые отечественные стандарты позволят избежать подобной ситуации. Впрочем, о конечной стоимости услуг говорить преждевременно, оговаривается он: «Что касается реальной стоимости сертификации, то о ней можно будет говорить только после разработки методик».
Кроме того, национальные стандарты и система сертификации «РосЦОД» будут заточены под нужды госструктур, где использование иностранных частных стандартов является нежелательный практикой с точки зрения государства. В 2018 г. Минсвязи провело аудит дата-центров ФОИВ, и выяснилось, что 70% ЦОД не соответствуют минимальным требованиям к отказоустойчивости. Именно с целью создать прозрачные критерии для дата-центров, используемых госзаказчиками, в нацпрограмму «Цифровая экономика». был внесен проект по созданию отечественной классификации ЦОД. Кроме того, в дальнейшем, нацстандарт может быть использован для определения правил размещения в ЦОД объектов КИИ, предполагает Видия Железнов.
Система национальных ЦОД-стандартов может быть востребована при масштабной поддержке государством программ строительства дата-центров для собственных нужд: «Когда заказчиком и пользователем дата-центров выступает государство, то оно вполне может требовать соответствия объектов своему видению, а также нормам и критериям касательно того, какими они должны быть», — полагает Тарас Чирков.
Таким образом, национальные ЦОД-стандарты и система сертификации «РосЦОД» вряд ли смогут в обозримом будущем вытеснить с рынка практики Uptime (если, конечно, не будет принято соответствующее политическое решение). В то же время, национальная система может оказаться весьма востребована в госсекторе и сегменте небольших частных площадок.
Учебный курс от Uptime Institute, разработанный специально для инженеров ЦОД
Разработанная специалистами Uptime Institute система классификации Tier служит международным языком для описания требований в области функциональности и доступности ЦОД. Владельцы дата-центров по всему миру формулируют требования для соответствия стандартам Tier в официальных документах и контрактах на строительство ЦОД.
Объем инвестиций в отрасль ЦОД растет с каждым днем, так что несоблюдение требований в ходе проектирования или сокращение жизненного цикла объекта приводит к очень серьезным последствиям. Можете ли вы позволить себе совершить ошибку на этапе проектирования ЦОД? Во что может вылиться такая ошибка с точки зрения необходимости повторного проектирования, выплаты штрафов, ущерба для репутации, потери рыночной доли?
Более того, программа ATD является одним из инструментов от Uptime Institute, позволяющих владельцам ЦОД защитить инвестиции, вложенные в проект. Наличие сертификата ATD облегчает процесс выбора среди множества фирм, занимающихся проектированием дата-центров и являющихся частью динамичного рынка с высоким уровнем конкуренции. Годы присутствия на рынке, занимаемая рыночная доля и ежегодный уровень дохода не имеют прямой связи со способностью компании разрабатывать Tier-совместимые решения. ATD позволяет владельцам ЦОД выбрать наиболее подходящую команду специалистов по проектированию.
Виртуальный ЦОД (VDC)
Virtual Data Center (VDC) или ВЦОД — это услуга предоставления в аренду физических ресурсов ЦОД с помощью выделения виртуальных мощностей (процессоры, память, жесткий диск). Иными словами, эта услуга называется IaaS (Infrastructure as a Service) — инфраструктура, как сервис, где оператор ЦОД предоставляет комплексное облачное решение для размещения информационной системы клиента
Выгода использования VDC заключается в том, что вы получаете ресурсы ЦОД без необходимости установки своего оборудования, траты на обслуживание инфраструктуры и избавляетесь от головной боли вечного пропадания канала связи. Помимо этого:
- Географическое разнесение — нет привязки к одной локации
- Интуитивно-понятная панель управления и доступ к управлению с любой точки мира, где есть интернет. Наличие гайдов и инструкций по настройке
- Безопасность (в том числе физическая — контроль доступа, видеонаблюдение) обеспечивается лучшими ИБ-специалистами и технологиями
- Надежность, катастрофоустойчивость, защита от DDoS и точное соблюдение SLA
- Снижение капитальных затрат
- Круглосуточный саппорт и мониторинг недоступности каналов связи и виртуальных машин, помощь в развертывании информационных систем в облаке
- Настройка периодичности бэкапа
Сертификаты
Институт аптайма разработал три программы сертификации для дата-центров. Эти программы действуют на разных стадиях жизненного цикла ЦОД.
- Проект. Оценка соответствия проектной документации, применяемых решений, мощности, инженерных требований объекта, а также архитектуры и месторасположения.
- Строительство. Проверка, что объект построен в соответствии с проектной документацией, прошедшей сертификацию Tier (см. выше). Демонстрация ключевых систем в реальных условиях для подтверждения соответствия требованиям.
- Стабильная работа. Всесторонняя оценка практики управления и эксплуатации объекта. Выявление проблем, которые могут поставить под угрозу надёжность.
Сертификаты Tier
Не каждый дата-центр может позволить себе сертификацию Tier, потому что это дорогая процедура. За 16 лет существования стандарта выдано немногим более 2500 сертификатов.
Институт аптайма подчёркивает, что аудит и сертификация — это не просто оформление документа, а эффективная процедура по оптимизации бизнеса. То есть она выгодна владельцам дата-центра, поскольку помогает повысить эффективность, снизить риски и затраты, а также обеспечить высочайший уровень производительности инфраструктуры.
Для некоторых операторов получение сертификата — это стимул провести необходимую модернизацию оборудования, обеспечить резервирование питания и каналов связи. В таком случае сертификация действительно помогает в бизнесе. Понятно, что добиться высокой надёжности можно и без сертификации. Но документ с уровнем Tier автоматически повышает статус ЦОД в глазах клиентов.
По мере внедрения инновационных технологий они включаются в стандарт Tier, так что документация обновляется. Но сам целевой показатель остаётся неизменным. Таким образом, стандарт Tier Standard сегодня такой же актуальный, как и в момент его разработки. По сути, такой стандарт не может устареть, разве что цифры аптайма для разных уровней Tier могут подкорректировать. Например, сегодня максимальная надёжность соответствует уровню Tier 4 с аптаймом 99,995%, максимум 26 минут простоя в год. Возможно, через десять лет в Tier 4 будут брать только пять девяток.
Какой уровень Tier выбрать для своего бизнеса?
Стандарты Tier имеют большое распространение в мире, но далеко не все российские центры обработки данных проходят эту сертификацию. Для относительно небольшого ЦОД расходы на прохождение официальной сертификации достаточно ощутимы, что также сказывается на конечной стоимости предоставляемых услуг. Тем не менее классификация Tier стала неким эталоном в измерении надежности и эксплуатационных характеристик ЦОД. По этой причине практически все дата-центры, официально не подтвердившие свой стандарт в Uptime Institute, используют сопоставимые классификации Tier для обозначения своего уровня ЦОД.
- Для самых требовательных и критически важных ресурсов лучше выбирать объекты 4 типа. Однако, на данный момент рынок ЦОД Tier 4 в России практически отсутствует.
- Если вам требуется качественные услуги дата-центра, то лучше выбирать центры 3 уровня. Вы получите достойный сервис и высокую надежность услуг.
- Для «домашних» или нетребовательных проектов можно рассматривать уровень Tier 2. В этом случае стоимость услуг будет более привлекательной, но следует быть готовым к возможным простоям.
При выборе дата-центра в первую очередь следует руководствоваться надежностью инфраструктуры объекта
Обращайте внимание на резервируемые компоненты энергопитания, дублирование каналов связи, многоуровневую физическую безопасность, круглосуточную техническую помощь
Оркестратор
Помимо панели управления и виртуализации, важным звеном в работе ЦОД является оркестратор. Оркестратор — это система управления всеми модулями ЦОД, которая организовывает и автоматизирует рабочие процессы. Иными словами, оркестратор — это планировщик задач, который аккумулирует в себе все необходимые запросы для создания виртуальной машины (или IaaS целиком), когда соответствующее задание инициирует клиент с панели управления, а также помогает с перезапуском задач, резервным копированием, загрузкой данных и мониторингу (траблшутингу). Оркестратор тесно «работает» с системами виртуализации, телекоммуникационной инфраструктурой, биллингом, файрволлом, но не привязан к какому-то определенному гипервизору. Один из самых известных оркестраторов — VMware vRealize Orchestrator
Описание учебной программы ATD
Учебный курс рассчитан на инженеров. Подразумевается американская квалификация professional engineer (PE), имеющая международные эквиваленты, к примеру, chartered engineer в Великобритании. Необходимым условием для прохождения обучения является официальная регистрация с подтверждением квалификации инженера, поскольку преподаваемый в рамках курса материал рассчитан на опытных профессионалов в области проектирования ЦОД.
Курс представляет собой три дня интенсивного обучения, затрагивающего технические аспекты проектирования. Учебная программа выходит за рамки традиционного преподавания инженерных дисциплин и завершается экзаменом. Успешное прохождение экзамена приводит к получению звания аккредитованного проектировщика Tier. Официальный веб-сайт Uptime Institute Professional Services хранит список всех прошедших обучение специалистов.
Учебная программа предоставляется подразделением Uptime Institute Professional Services. Администрирование курса выполняется старшим преподавательским составом, обладающим реальным опытом в области практического применения стандартов Tier. Более того, каждый преподаватель является соавтором документов Tier Standard: Topology и/или Tier Standard: Operational Sustainability.
Основной принцип стандарта Tier
В отношении топологии основной принцип очень простой: уровень Tier топологии всей площадки соответствует уровню слабейшей подсистемы, влияющей на работу площадки. Например, площадка с надёжной конфигурацией ИБП уровня Tier IV и системой чиллерного охлаждения уровня Tier II будет иметь итоговый рейтинг Tier II.
Это действительно жёсткий принцип. Получается, что площадка может соответствовать абсолютно всем требованиям уровня Tier IV, кроме одного мелкого требования — и по этой причине не получит сертификат Tier IV. По идее разработчиков стандарта, такой крайне жёсткий подход отвечает пожеланиям топ-менеджеров, которые принимают решения о многомиллионных инвестициях и хотят иметь объективную картину возможностей ЦОДа.
По этой причине уровни Tier не бывают дробными. Не бывает уровня Tier 2.5 или 2.9. Или площадка полностью соответствует Tier 3, или остаётся на втором уровне.
Стандарт Tier топологии инфраструктуры ЦОД описывает базовые требования к топологии площадки, в том числе:
- Генераторные системы. Энергогенерирующие системы площадки (например, дизель-генераторы) рассматриваются как основной источник электроснабжения. Местная электрическая сеть — всего лишь экономичная альтернатива. Перебои в электрической сети считаются не аварийной ситуацией, а ожидаемым рабочим условием.
- Расчётные значения температуры окружающего воздуха.
- Телекоммуникации.
- Подпиточная вода (в случае чиллерного охлаждения)
Дополнительный стандарт Tier по операционной устойчивости дополняет стандарт топологии инфраструктуры ЦОД и определяет требования к производительности в отношении конфигурации оборудования электроснабжения и охлаждения, включая возможности резервирования, планового технического обслуживания и реагирования на отказ без воздействия на критическую нагрузку. В этом дополнительном стандарте описаны требования конкретно по обслуживанию ЦОДа.
Например, так выглядит категория подбора персонала и организационной структуры для уровней Tier I, II, III и IV:
Подробнее о каждой сфере применения стандарта см. в документации.
История
Единую систему стандартов Tier в 2005 году разработал Uptime Institute (Институт аптайма) — научно-исследовательское учреждение, созданное в 90-е годы для классификации и сертификации дата-центров.
Создатели исходили из нужд бизнес-клиентов, которые не могли разобраться в многообразии технических характеристик и нуждались в простой системе классификации дата-центров.
Необходимость сертификации была понятна, поскольку к тому моменту существовали другие стандарты сертификации ЦОД. Некоторые из них по-прежнему актуальны.
- SAS 70 (до 2011 года), SSAE 16 (до 2017 года), SSAE 18 (текущий стандарт)
- SOC 1, 2, 3. Отчёт Service Organization Control (SOC) составляется по результатам аудита Statements on Standards for Attestation Engagements (SSAE)
- и другие (например, существует ряд национальных требований к информационным системам, в том числе российские стандарты ГОСТ Р 58811-2020 и 58812-2020)
Быстрая окупаемость
Столь серьезные требования к системе противопожарной защиты ЦОД уровня Tier 3 свидетельствуют о том, что наличие сертификата The Uptime Institute является весьма надежной гарантией при страховании ЦОД. При этом страховая премия будет значительно ниже, чем для ЦОД без сертификата. Крупные клиенты смогут без лишних волнений хранить свой самый ценный на сегодня капитал – информацию. А изначально более высокие вложения в ЦОД уровня Tier 3 в итоге окупятся быстрее и принесут более высокие дивиденды инвестору.
Опубликовано: Журнал «Системы безопасности» #5, 2011Посещений: 12992
Автор
|
|||
В рубрику «Пожарная безопасность» | К списку рубрик | К списку авторов | К списку публикаций
Российская сертификация ЦОД. Начало
В сентябре 2020 г. Ассоциация участников отрасли ЦОД одобрила концепцию создания российской системы сертификации ЦОД, которая получила рабочее наименование «РосЦОД». В организационной структуре «РосЦОД» самой Ассоциации отведена роль держателя системы сертификации и органа аккредитации независимых компаний-аудиторов, которые будут заниматься непосредственной сертификацией. На первом этапе сертификация будет добровольной, однако в дальнейшем нельзя исключать, что ее использование будет регламентировано на государственном уровне, утверждает Заурбек Алехин, руководитель ТК-120, технического комитета при Росстандарте, который был образован Ассоциацией для разработки стандартов создания центров обработки данных.
Сертификация будет реализована на основе отечественной модели классификации дата-центров, проект который был разработан в рамках нацпрограммы «Цифровая экономика» в 2019 г. По данным CNews, всего рассматривалось три модели классификации, а финальный проект, принятый в начале 2019 г., был согласован с ФСТЭК, ФСБ и Банком России. Согласно этому документу ЦОД предлагается оценивать по 30 показателям, включая параметры надежности, физической, информационной и пожарной безопасности, доступности услуг информационных систем. Каждый из показателей оценивается по пятибалльной шкале: от A (наивысший балл) до E (минимальный). Впрочем, в дальнейшем система показателей может быть упрощена, сообщил CNews директор
по стратегии и маркетинговым
коммуникациям «Ростелеком-ЦОД» Видия Железнов, участвовавший в согласовании документа.
Таким образом, собственно технические требования к дата-центрам пока не были сформулированы. Дмитрий Басистый, ответственный секретарь ТК 120 и один из разработчиков отечественных стандартов, сообщил CNews, что сначала нужно создать документы, формирующие «процессный базис», а появление собственно технических стандартов можно ожидать в 2022 г.
Требования к сертификации
По международным стандартам, разработанным The Uptime Institute (Институт бесперебойных процессов, США) – всемирно известным центром сертификации дата-центров, сегодня выделяют четыре уровня отказоустойчивости (надежности) ЦОД – от Tier 1 (наиболее низкий) до Tier 4 (наиболее высокий). Стандарты Tier задают различные уровни отказоустойчивости (надежности) функционирования всего комплекса ЦОД, состоящего из большого количества инженерных, силовых и слаботочных систем – электропитания, охлаждения, вентиляции, отопления, систем безопасности, видеонаблюдения, контроля доступа, автоматической пожарной сигнализации, автоматического газового пожаротушения, голосовой эвакуации и многих других. Tier 3 означает резервирование всех инженерных подсистем и возможность параллельного обслуживания – Concurrent Maintainability. Дата-центр не прекращает свою работу при проведении плановых ремонтных работ и замене нагревательного или охлаждающего оборудования. Полностью исключается необходимость остановки сервисов, поэтому ЦОД может работать в режиме 24 часа,
7 дней в неделю.
Несмотря на высокую стоимость создания ЦОД уровня Tier 3 (а также хостинг-услуг), они пользуются все большим спросом, так как предоставляют более высокое и, главное, более надежное качество услуг. Поэтому большинство запускаемых в ближайшее время ЦОД будут по крайней мере проектироваться в соответствии со стандартом Tier 3.
Разделение ЦОД на уровни
Разделение ЦОД на уровни является важным критерием выбора и гарантией того, что ваши системы в облаке провайдера будут работать безотказно и бесперебойно. Кроме того, высокий уровень указывает на производительность дата-центра, а присвоение ему конкретного уровня позволяет избежать неточных формулировок во время проектирования и описания основных характеристик ЦОД
Однако важно помнить о том, что не во всех случаях при увеличении уровня надежности возрастает качество предоставляемых услуг. Из этого следует, что классификация ЦОД — это не единственный критерий выбора и определения лучшего дата-центра
Для того чтобы понять, какой ЦОД самый производительный и отказоустойчивый, нужно учитывать и другие факторы: время присутствия компании — владельца дата-центра на рынке услуг и ее практический опыт в реализации аналогичных проектов
Немаловажное значение имеют цели, для реализации которых используется дата-центр, так как размещение некритичных серверов небольших компаний и обслуживание вычислительной платформы облачного провайдера — разные задачи, требующие разного уровня компетенции
Резервирование электропитания
Ключевой параметр, который обеспечивает надёжность работы и высокий аптайм, — это резервирование электропитания.
В частности, уровень Tier 4 требует наличия системы резервирования 2N+1, то есть двукратное резервирование плюс одна дополнительная система на случай технического обслуживания одной из двух основных. Это максимальный уровень надёжности. Такой реализован в дата-центре «Миран».
Схема резервирования электропитания в «Миран»
В целом сводка требований стандарта Tier выглядит следующим образом.
Cводка требований стандарта Tier
В таблице собраны все требования, определяющие четыре различных уровня классификации стандарта Tier. Распределение бесперебойного энергоснабжения определяется в данной таблице как участок схемы от выходов ИБП до ИТ-нагрузки.
Tier I | Tier II | Tier III | Tier IV | |
Минимальное кол-во активных компонентов, поддерживающих ИТ-нагрузку | N | N+1 | N+1 | N после любого отказа |
Каналы распределения — входной участок системы энергоснабжения | 1 | 1 | 1 активный, 1 запасной | 2 активных одновременно |
Распределение бесперебойного энергоснабжения | 1 | 1 | 2 активных одновременно | 2 активных одновременно |
Возможность обслуживания без остановки оборудования | Нет | Нет | Да | Да |
Отказоустойчивость | Нет | Нет | Нет | Да |
Секционирование | Нет | Нет | Нет | Да |
Непрерывное охлаждение | Нет | Нет | Нет | Да |
Дата-центр уровня Tier-3 – что это?
Ни для кого не секрет, что стабильность и бесперебойность работы напрямую зависят от серверного оборудования и условий, в которых оно функционирует. Оборудование, которое мы используем, находится в сертифицированном европейском дата-центре уровня Tier-3.
Уровень Tier-3 – крайне высокий стандарт надежности оборудования и инфраструктуры. Ключевым отличием подобных дата-центров является возможность проведения ремонтных работ (включая замену компонентов системы, добавление и удаление вышедшего из строя оборудования) без остановки работы дата-центра. При этом осуществляется круглосуточный мониторинг всех элементов инфраструктуры.
Перенаправление операций ввода вывода
Модуль перенаправления ввода/вывода
В виртуализации без резервирования, ввод-вывод направляется из виртуальной машины ниже на физический уровень и обратно из физического уровня в виртуальную машину. В данном решении, ввод-вывод кроме того направляется на другой узел, чем обеспечивается резервирование данных в случае сбоя одного из устройств. Если устройство неисправно, то оно удаляется из работы и предпринимаются соответствующие восстановительные действия прозрачные для приложения.
В случае выхода из строя сетевого адаптера, сетевой трафик будет маршрутизироваться через другой узел. Рис .1.
В случае сбоя диска, виртуальная машина будет работать с исправным диском на другом сервере.- Рис.2
Согласованное состояние приложений и данных между узлами системы будет обеспечено и в случае, когда один из серверов выйдет из строя. Данные и транзакции не потеряются..
Рис.1.Работа сетевой подсистемы
Рис.2.Работа дисковой подсистемы
Уровни отказоустойчивости
Каждый уровень доступности определяется по метрикам отказоустойчивости
Уровни доступности указаны по аналитическим отчётам IDC
Высоконадёжный уровень (Reliable)
Начальный уровень. Многие приложения не требуют защиты или просто используется оборудование с аппаратным резервированием возможностью горячей замены.
Требуется восстановление, но процесс управления не зависит от этих приложений.
Восстанавливаемый уровень (Recoverable)
Обеспечивается механизмами репликации данных.
Высокая доступность (Highly Available)
Уровень доступности для ERP систем, баз данных, почтовых и других сервисов, которые обеспечивают производственные процессы. Когда сервисы становятся недоступными, возможна потеря данных, что может значительно сказаться не цену простоя. Для этого уровня необходим расчёт метрик RTO и RPO.
Постоянная доступность ( Fault Tolerant)
Этот уровень требуется для критически важных задач, когда недопустимо малейшее время простоя и потеря транзакций
Основные метрики отказоустойчивости
Время восстановления –RTO (Recovery Time Objective)- время, в течение которого система должна быть восстановлена.
Определяет максимальное время недоступности сервиса.
Точка восстановления— RPO (Recovery Point Objective)- точка восстановления.