Типы raid-массивов

RAID 2, 3, 4, 5, 6 — что такое и с чем едят их?

Описание этих массивов тут по стольку по скольку, т.е. чисто для справки, да и то в сжатом (по сути описан только второй) виде. Почему так? Как минимум в силу низкой популярности этих массивов среди рядового (да и в общем-то любого другого) пользователя и, как следствие, малого опыта использования оных мною.

RAID 2 зарезервирован для массивов, которые применяют некий код Хемминга (не интересовался что это, посему рассказывать не буду). Принцип работы примерно такой: данные записываются на соответствующие устройства так же, как и в RAID 0, т.е они разбиваются на небольшие блоки по всем дискам, которые участвуют в хранении информации.

Оставшиеся же  (специально выделенные под оное) диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо винчестера из строя возможно восстановление информации. Тобишь в массивах такого типа диски делятся на две группы — для данных и для кодов коррекции ошибок

Например, у Вас два диска являют собой место под систему и файлы, а еще два будут полностью отведены под данные коррекции на случай выхода из строя первых двух дисков. По сути это что-то вроде нулевого рейда, только с возможностью хоть как-то спасти информацию в случае сбоев одного из винчестеров. Редкостно затратно, — четыре диска вместо двух с весьма спорным приростом безопасности.

RAID 3, 4, 5, 6.. Про них, как бы странно это не звучало на страницах этого сайта, попробуйте почитать на Википедии. Дело в том, что я в жизни сталкивался с этими массивами крайне редко (разве что пятый попадался под руку чаще остальных) и описать доступными словами принципы их работы не могу, а перепечатывать статью, с выше предложенного ресурса решительно не желаю, как минимум, в силу наличия в оных зубодробительных формулировок, которые даже мне понятны со скрипом.

RAID DP

Вариант массива, использующий двойной паритет также как и RAID 6, однако для служебной информации используются только два диска без всякого чередования, на остальных дисках располагаются исключительно данные. Фактически это тот же RAID 4 с записью битов паритета на отдельный диск, но в случае DP этих дисков два для повышения отказоустойчивости (как в RAID 6). Спецификация принадлежит компании NetApp . Для решения проблемы производительности, упирающейся в быстродействие жесткого диска для записи битов четности, была использована собственная файловая система WAFL .

Минусы — проприетарный стандарт, более сложен в администрировании и поставляется в дорогих конфигурациях сетевых хранилищ, а потому является стандартом «не для всех»;

Плюсы — при ребилде производительность не снижается , имеет неплохую надежность (максимум 2 вышедших из строя диска).

На этом все. В сети можно встретить информацию о других гибридных уровнях RAID, но в большинстве случаев они существуют лишь в безумных головах авторов статей, например, RAID 160 , RAID 6E, RAID 500 и другие. Intel Matrix RAID рассматриваться не будет, поскольку это вообще не уровень RAID, а технология. Точно так же с другими технологиями построения различных массивов, которых в сущности нельзя назвать RAID-уровнями. В сети можно найти удобные калькуляторы для определения минимального количества дисков в различных конфигурациях RAID, если самому лень считать.

Notes:

  1. Бюджетный RAID. Тестируем производительность.
  2. SSD + raid0 — не всё так просто
  3. Сравнение производительности серверных RAID-контроллеров
  4. Сравнение производительности новейших серверных RAID-контроллеровIntel и Adaptec
  5. RAID 0, RAID 1, RAID 10 and RAID 5: how do they actually work?
  6. Why is RAID 1+0 better than RAID 0+1?
  7. Nested-RAID: The Triple Lindy
  8. Non-standard RAID levels
  9. RAID 10 или RAID 1E. Что лучше?
  10. Код Хэмминга
  11. RAID
  12. Бит четности
  13. Nested RAID levels
  14. Raid2 raid3 raid4 what it is how it works the history lesson
  15. Basic RAID Levels
  16. Почему RAID-5 — «mustdie»?
  17. Технология RAID
  18. Что такое RAID?
  19. RAID 50 offers a balance of performance, storage capacity, and data integrity
  20. RAID 30 And RAID 50
  21. RAIDs anidados: Configuraciones basadas en RAID-5 y RAID-6 (Tercera y última)
  22. Does the world need Triple Parity RAID?
  23. Системы хранения данных
  24. RAID-DP
  25. Write Anywhere File Layout
  26. Файловая система WAFL — «фундамент» NetApp
  27. RAID-4 / RAID-DP — превращаем недостатки в достоинства
  28. RAID Levels Explained
  29. Intel Matrix RAID
  30. Non-RAID drive architectures
  31. RAID Size Calculator

comments powered by HyperComments

Для чего используется RAID на моем сервере NAS?

NAS-серверы обычно имеют 2 отсека для размещения жестких дисков или более, логически они также совместимы с SSD диски, но по сути это то же самое, диски хранения. Самая простая конфигурация, которую мы можем сделать в нашем NAS, — это не настраивать какой-либо тип RAID, то есть мы можем настроить диски как «Простые», чтобы они работали полностью независимо, однако вы упускаете все преимущества наличия RAID. .

Если мы настроим хранилище нашего NAS с различными типами RAID, которые мы сейчас собираемся вам объяснить, мы сможем иметь большая целостность данных , чтобы избежать потери данных в случае выхода из строя одного или нескольких жестких дисков или твердотельных накопителей. У нас также будет Отказоустойчивость , хотя жесткий диск выходит из строя, это не проблема, потому что система может продолжать работать правильно, хотя логически рекомендуется как можно скорее заменить этот сломанный диск или SSD на новый, чтобы восстановить информацию и чтобы операционная система не проверяйте, деградировал ли RAID

В случае длительного использования сломанного диска, возможно, что другой диск сломается, тогда у нас может быть потеря данных, поэтому очень важно как можно скорее заменить сломанный жесткий диск. RAID-массивы также предлагают нам более высокая скорость передачи либо при чтении данных, либо при записи данных, либо при чтении и записи, в зависимости от типа используемого RAID-массива у нас будут те или иные характеристики

Наконец, RAID дает нам большая емкость , мы можем «соединить» несколько дисков, как если бы они были одним, и получить все хранилище, одновременно улучшив общую производительность.

Очень важный аспект, который позволяет нам создавать операционную систему с RAID, — это: зарезервировать жесткий диск, который находится в режиме ожидания чтобы активировать его сразу же при выходе из строя жесткого диска, принадлежащего RAID, этот резервный диск предназначен для использования сразу после сбоя, чтобы уменьшить поверхность подверженности еще одному катастрофическому отказу еще одного жесткого диска, а также для возврата как можно скорее, чтобы RAID был в идеальном состоянии.

Когда мы настраиваем несколько дисков в RAID, операционная система будет видеть одну логическую единицу, на серверах NAS, таких как QNAP, это называется пулом хранения, а внутри пула хранения (RAID) мы можем создавать тома или набор данных, в зависимости от используем ли мы файловую систему EXT4 или ZFS. В RAID-массивах обычно используются жесткие диски или твердотельные накопители с одинаковой емкостью, если мы не используем ту же емкость, возможно, мы тратим емкость впустую. Во всех примерах, которые мы дадим вам позже, мы предполагаем, что все диски имеют одинаковую емкость.

RAID-массивы очень распространены при установке сервера в компании или домашнем NAS, и есть разные типы различные RAID-массивы, каждый со своими характеристиками в зависимости от цели, которую мы ищем, и количества дисков, которые мы собираемся использовать.

Почему софтрейд?

Железный рейд нужен только в одном случае – если у него есть батарейка и набортный кеш. Тогда контроллер сразу отвечает ОС что запись на диск завершена на физическом уровне и всякие ACID базы работают очень быстро и безопасно.
В остальных случаях никаких бонусов по сравнению с софт-рейдом нет, одни минусы:

  1. Сгорело железо? Новый сервер? Будьте добры купить тот же контроллер, ну или молитесь о совместимости. Софтрейд из тех-же дисков собирается где угодно.
  2. Цена. Собственно, из-за этого нормальных рейдов с батарейкой я в руках так ниразу и не держал

Ну а те «рейд-контроллеры» которые стоят на обычных материнских платах – вообще никогда не стоит использовать. Они просто дают грузить ОС с рейда за счет набортного биоса (который выполняется центральным процессором, своего процессора нет), на этом их польза заканчивается, и остаются только минусы.

RAID 1

Один из самых интересных уровней RAID — RAID 1. Это классический уровень, описанный в документе 1988 года. В основу RAID 1 лег принцип зеркального отображения — все диски массива в точности копируют друг друга. По затратам это недешево — ведь два винчестера образуют массив, не прибавляя ни байта в объеме относительно одного.

Для большинства простых задач хватит контроллера RAID, встроенного в материнскую плату.

Основное достоинство RAID 1 — повышенная надежность: информация потеряется только в том случае, если откажут сразу все диски массива.

Еще один плюс RAID 1 — возрастающая в зависимости от количества дисков скорость. Современные контроллеры RAID способны считывать информацию сразу со всех винчестеров. Следовательно, если в вашем RAID 1 объединено два диска, то скорость считывания данных возрастет почти в два раза. Почему «почти»? Потому что часть времени будет уходить на необходимые вычисления. То же самое происходит с передачей и копированием информации. А вот скорость записи не возрастает, так как одну и ту же информацию все равно приходится писать на все диски сразу.

Старые версии контроллеров RAID не могли считывать информацию с трех дисков одновременно — они «перестраховывались», считывая файл с одного диска и сверяя его с копиями. В наше время жесткие диски оснащены технологиями проверки и исправления ошибок, так что в «устаревшей» реализации RAID 1 уже нет надобности.

RAID 1 используется тогда, когда необходима максимальная защита данных. Случаев «гибели» информации, хранимой подобным образом, история насчитывает весьма мало.

RAID уровня 1

Технология RAID 1 также известна как
зеркалирование (disk mirroring). В
этом случае, копии каждого куска
информации хранятся на отдельном
диске; или, обычно каждый
(используемый) диск имеет
«двойника», который хранит точную
копию этого диска. Если
происходит сбой одного из основных
дисков, этот замещается своим
«двойником».
Производительность произвольного
чтения может быть улучшена, если
для чтения информации будет
использоваться тот из
«двойников», головка которого
расположена ближе к требуемому
блоку.

Время записи может оказаться несколько
больше, чем для одного диска, в
зависимости от стратегии записи:
запись на два диска может
производится либо в параллель (для
скорости), либо строго
последовательно (для надежности).

Уровень RAID 1 хорошо подходит для
приложений, которые требуют
высокой надежности, низкой
латентности при чтении, а также
если не требуется минимизация
стоимости. RAID 1 обеспечивает
избыточность хранения информации,
но в любом случае следует
поддерживать резервную копию
данных, т.к. это единственный способ
восстановить случайно удаленные
файлы или директории.

Диск
1
(данные)
Диск
2
(копия диска 1)
Диск
3
(данные)
Диск
4
(копия диска 3)
Диск
5
(свободный)
Сегмент 1 Сегмент 1 Сегмент 2 Сегмент 2
Сегмент 3 Сегмент 3 Сегмент 4 Сегмент 4

рис. 2. Распределение данных по
дискам для RAID 1.

Рейд 2

RAID 2 – использует так называемый код Хемминга. Данные разбиваются по жестким дискам аналогично RAID 0, на оставшихся дисках хранятся коды исправления ошибок, при сбое по которым можно регенерировать информации. Этот метод позволяет на лету обнаруживать, а затем и исправлять сбои в системе.

Быстрота чтения/записи в этом случае в сравнении с использованием одного диска повышается. Минусом является большое количество дисков, при котором его рационально применять, чтобы не было избыточности данных, обычно это 7 и больше.

Рейд 3

RAID 3 – в массиве данные разбиваются на все диске кроме одного, в котором хранятся байты четности. Устойчив к отказам системы. Если один из дисков выходит из строя. То его информацию легко «поднять», используя данные контрольных сумм четности.

В сравнении с RAID 2 нет возможности коррекции ошибок на лету. Этот массив отличается высокой производительностью и возможностью использовать от 3 дисков и больше.

Главным минусом такой системы можно считать повышенную нагрузку на диск, хранящий байты четности и низкую надежность этого диска.

Рейд 4

В целом RAID 4 аналогичен RAID 3 с той разницей, что данные четности хранятся в блоках, а не в байтах, что позволило увеличить скорость передачи данных малого объема.

Минусом указанного массива оказывается скорость записи, ведь четность записи генерируется на один единственный диск, как и RAID 3.

Представляется собой неплохое решение для тех серверов, где файлы чаще считываются, чем записываются.

Рейд 5

RAID от 2 до 4 имеют недостатки, связанные с невозможностью распараллеливания операций записи. RAID 5 устраняет этот недостаток. Блоки четности записываются одновременно на все дисковые устройства массива, нет асинхронности в распределении данных, а значит, четность является распределенной.

Число используемых винчестеров от 3. Массив очень распространён благодаря своей универсальности и экономичности, чем большее число дисков будет использоваться, тем экономнее будет затрачиваться дисковое пространство. Скорость при этом высокая за счет распараллеливания данных, но производительность снижается в сравнении с RAID 10, за счет большого числа операций. Если выходит из строя один диск, то надежность снижается до уровня RAID 0. Требуется много времени на восстановление.

Рейд 6

Технология RAID 6 схожа с RAID 5, но повышается надежностью за счет увеличения количества дисков четности.

Однако, дисков уже требуется минимум 5 и более мощный процессор для обработки возросшего числа операций, причем количество дисков обязательно должно быть равно простому числу 5,7,11 и так далее.

Рейд 10, 50, 60

Далее идут комбинации указанных ранее рейдов. Например, RAID 10 это RAID 0 + RAID 1.

Они наследуют и преимущества массивов их составляющих в плане надежности, производительности и количестве дисков, а вместе с тем экономичности.

RAID 0

Дисковый массив состоящий минимум из двух дисков, информация на которые записывается поочередно (принцип чередования). Сначала информация разбивается на одинаковые по длине блоки (обозначим их Аi), которые записываются по очереди на каждый из дисков, составляющих массив. Таким образом, файл может оказаться разделенным на части, которые будут хранится на разных HDD.

К плюсам можно отнести существенное увеличение скорости работы, поскольку обработка информации распараллеливается между несколькими дисками. К тому же вся емкость дисков доступна операционной системе. Если применены два диска емкостью 500 ГБ, то в системе будет виден диск объемом 1 ТБ.

Однако есть и ложка дегтя, теперь сохранность информации зависит от работоспособности не одного диска, а всех дисков входящих в массив. Если мы используем два накопителя, то надежность снижается практически в два раза, поскольку даже в случае проблем только с одним из дисков, мы теряем всю хранящуюся информацию. Что уж говорить о случае, когда накопителей больше двух. Другими словами, повышаем скорость работы, жертвуя надежностью системы. Справедливости ради стоит отметить, что поскольку в данном случае не используется резервирование информации (нет избыточности), то порой RAID 0 вовсе не считают полноценным RAID-массивом.

Данный тип массива будет оптимальным выбором, когда требуется обеспечить высокое быстродействие при ограниченном бюджете, а вопрос надежности хранения информации не имеет принципиального значения. Именно такое сочетание качеств делает RAID 0 интересным для домашних продвинутых пользователей компьютера в некоторых ситуациях.

Причем восстановить информацию в случае сбоя будет гораздо труднее, чем с одиночного жесткого диска. Если информация для вас ценная, то лучше не пытаться восстановить работоспособность самостоятельно, поскольку своими действиями можно усугубить ситуацию или даже полностью уничтожить данные в рейде. Гораздо разумнее будет доверить восстановление профессионалам, например компании Paradise-R. Впрочем это касается RAID-массивов любого уровня.

Matrix RAID

Matrix RAID — это технология, реализованная фирмой Intel в своих чипсетах начиная с ICH6R. Строго говоря, эта технология не является новым уровнем RAID (ее аналог существует в аппаратных RAID-контроллерах высокого уровня), она лишь позволяет, используя лишь 2 диска, организовать одновременно один или несколько массивов уровня RAID 1 и один или несколько массивов уровня RAID 0. Это позволяет за сравнительно небольшие деньги обеспечить для одних данных повышенную надёжность, а для других высокую скорость доступа.

Пример использования:

Имеются в наличии два диска по 160 Гбайт. Каждый диск разбивается на тома по 60 и по 100 Гбайт, затем 100-гигабайтные тома объединяются в скоростной массив RAID 0, а 60-гигабайтные — в массив повышенной надежности RAID 1. В массиве RAID 1 можно разместить операционную систему, рабочие документы, фото- и видеоархивы, коллекцию mp3 и прочие важные данные, а файл подкачки и «игрушки» в массиве RAID 0. В результате получается весьма рациональное сочетание повышенной производительности и надежности хранения данных.

Software RAID (Программный RAID)

Преимущества:

В отличие от аппаратного RAID, программный RAID использует вычислительную мощность операционной системы, в которой установлены диски RAID. Стоимость ниже, потому что не требуется дополнительный аппаратный RAID-контроллер. Это также позволяет пользователям реконфигурировать массивы без ограничений со стороны аппаратного RAID-контроллера.

Недостатки:

Software RAID обычно работает медленнее, чем аппаратный RAID. Поскольку некоторая вычислительная мощность потребляется программным обеспечением, скорость чтения и записи вашей конфигурации RAID, а также другие операции, выполняемые на сервере, могут быть замедлены им. Программный RAID часто зависит от используемой операционной системы, поэтому обычно его нельзя использовать для разделов, совместно используемых операционными системами. Замена вышедшего из строя диска в программном RAID несколько сложнее. Вы должны сначала сказать вашей системе, чтобы она перестала использовать диск, а затем замените диск.

Реальность

В реальности производительность RAID1, RAID5 и RAID6 на одном и том же наборе дисков зачастую оказывается довольно близкой, и вот по каким причинам:

  • Операции чтения и записи в массиве происходят параллельно (данные и четность);

  • Операции записи могут быть отложены (хост получает подтверждение уже после попадания данных в кэш);

  • Кэширование, откладывание записи и параллелизация операций (и/или просто удачное совпадение размеров блока) дают возможность работать «полным страйпом»;

  • Технологии «распределенного RAID» позволяют лучше распределять ввод-вывод по дискам.

В качестве примера рассмотрим что-то полезное в быту. Например, имитацию операции Merge в Veeam B&R на одном и том же наборе дисков, но с разным уровнем RAID.

Формулы обещают, что RAID1 будет на 28% быстрее (что само по себе не особо и круто) и это даже без учета сложностей расчета четности:

R — Ratio, X -Raw IOPS. Особая благодарность Wolfram Alfa за потакание моей лени.

А на практике разница исчезающе мала, всего около 5% (нагрузка в обоих случаях уперлась в производительность backend, т.е. единичных дисков):

RAID10

RAID6

IOPS

39

37

Bandwidth (MB/s)

20

19

Latency (ms)

25

27

Выводы делайте сами.

RAID 5

Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. RAID 5 не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR (исключающее или). Xor обладает особенностью, которая даёт возможность заменить любой операнд результатом, и, применив алгоритм xor, получить в результате недостающий операнд. Например: a xor b = c (где a, b, c — три диска рейд-массива), в случае если a откажет, мы можем получить его, поставив на его место c и проведя xor между c и b: c xor b = a. Это применимо вне зависимости от количества операндов: a xor b xor c xor d = e. Если отказывает c тогда e встаёт на его место и проведя xor в результате получаем c: a xor b xor e xor d = c. Этот метод по сути обеспечивает отказоустойчивость 5 версии. Для хранения результата xor требуется всего 1 диск, размер которого равен размеру любого другого диска в raid.

Достоинства

RAID5 получил широкое распространение, в первую очередь, благодаря своей экономичности. Объём дискового массива RAID5 рассчитывается по формуле (n-1)*hddsize, где n — число дисков в массиве, а hddsize — размер наименьшего диска. Например, для массива из четырех дисков по 80 гигабайт общий объём будет (4 — 1) * 80 = 240 гигабайт. На запись информации на том RAID 5 тратятся дополнительные ресурсы и падает производительность, так как требуются дополнительные вычисления и операции записи, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких дисков массива могут обрабатываться параллельно.

Недостатки

Производительность RAID 5 заметно ниже, в особенности на операциях типа Random Write (записи в произвольном порядке), при которых производительность падает на 10-25% от производительности RAID 0 (или RAID 10), так как требует большего количества операций с дисками (каждая операция записи, за исключением так называемых full-stripe write-ов, сервера заменяется на контроллере RAID на четыре — две операции чтения и две операции записи). Недостатки RAID 5 проявляются при выходе из строя одного из дисков — весь том переходит в критический режим (degrade), все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность. При этом уровень надежности снижается до надежности RAID-0 с соответствующим количеством дисков (то есть в n раз ниже надежности одиночного диска). Если до полного восстановления массива произойдет выход из строя, или возникнет невосстановимая ошибка чтения хотя бы на еще одном диске, то массив разрушается, и данные на нем восстановлению обычными методами не подлежат

Следует также принять во внимание, что процесс RAID Reconstruction (восстановления данных RAID за счет избыточности) после выхода из строя диска вызывает интенсивную нагрузку чтения с дисков на протяжении многих часов непрерывно, что может спровоцировать выход какого-либо из оставшихся дисков из строя в этот наименее защищенный период работы RAID, а также выявить ранее не обнаруженные сбои чтения в массивах cold data (данных, к которым не обращаются при обычной работе массива, архивные и малоактивные данные), что повышает риск сбоя при восстановлении данных

Минимальное количество используемых дисков равно трём.

RAID 5

RAID-контроллеры

Для создания дискового массива нужен контроллер. Он может быть нескольких видов: программный, интегрированный в материнскую плату, аппаратный.

Программный RAID

Cофтовый вариант рейда самый бюджетный и простой в использовании. Создайся за счет утилит в операционной системе и полностью от нее зависит. Это накладывает некоторые ограничения в виде сложностей со сменой версии ОС, уязвимость к вирусам и любым сбоям со стороны операционной системы. Работает полностью на ресурсах серверного процессора, который и выполняет функцию контроллера. Это образует дополнительную нагрузку на сервер и его производительность. Программный RAID считается достаточно медленным и ненадежным решением. Кроме того, этот тип поддерживает не все уровни RAID массивов и не все типы дисков. Лучшими схемами для программного рейда считаются 0, 1, 10. 

Аппаратный RAID

Модульный RAID-контроллер может быть как внутренним, так и внешним. Это отдельное устройство в виде платы расширения для слотов PCIe. Аппаратный RAID-контроллер обладает собственным процессором и кэш-памятью, небольшим блоком питания (опционально), что создает дополнительный уровень защиты и увеличивает производительность операций записи. Аппаратный рейд запускается через BIOS и никак не связан с ОС, а его работа не зависит от нагрузки на сервер и его процессор. Модульный рейд позволяет создать любые уровни массивов. Данный вариант считается самым надежным, производительным, но и наиболее затратным.

Интегрированный RAID

Эта версия ближе к программному RAID за исключением, что дополнительно используется встроенный в материнскую плату микрочип. Этот чип берет на себя определенную часть задач контроллера, но остальная нагрузка все-таки ложится на центральный процессор. Данные контроллеры могут иметь встроенную кэш-память в зависимости от спецификации системной платы

При выборе материнской серверной платы обращайте внимание на эти характеристики. Интегрированный рейд быстрее программного, но не сильно превосходит его по надежности

Более того, его также называют «Fake-RAID» из-за его «неполноценности».

Самый надежный контроллер – аппаратный. Он автономен, производителен, не влияет на работу центрального процессора, поддерживает любые уровни RAID массивов. Этот вариант идеально подходит для северов с требовательными приложениями, критическими данными или большим количеством накопителей. Аппаратный RAID обладает большими возможностями и потенциалом, чем его аналоги.

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Работатека
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: