oevm_exam_RAIDx

advertisement
43. RAID массивы: основные уровни и сравнительные характеристики.
Массивом называют несколько накопителей, которые централизованно настраиваются,
форматируются и управляются. Логический массив – это уже более высокий уровень
представления, на котором не учитываются физические характеристики системы.
Соответственно, логические диски могут по количеству и объему не совпадать с
физическими. Для операционной системы вообще весь массив является одним большим
диском.
Принцип функционирования RAID-системы заключается в следующем: из набора
дисковых
накопителей
создается
массив,
который
управляется
специальным
контроллером и определяется компьютером как единый логический диск большой
емкости. За счет параллельного выполнения операций ввода-вывода обеспечивается
высокое быстродействие системы, а повышенная надежность хранения информации
достигается дублированием данных или вычислением контрольных сумм.
Следует отметить, что применение RAID-массивов защищает от потерь данных
только в случае физического отказа жестких дисков.
Различают несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 5, 6, 7.
Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п.
Классификация RAID – массивов
RAID 0
Дисковый массив без отказоустойчивости (Striped Disk Array without Fault
Tolerance) (Рисунок 5). Дисковый массив без избыточного хранения данных. Информация
разбивается на блоки, которые одновременно записываются на отдельные диски, что
обеспечивает повышение производительности. Такой способ хранения информации
ненадежен, поскольку поломка одного диска приводит к потере всей информации,
поэтому уровнем RAID как таковым не является.
1
RAID
0
–
дешевый
и
производительный, но ненадежный. За
счет
возможности
одновременного
ввода / вывода с нескольких дисков
массива
RAID
0
обеспечивает
максимальную скорость передачи данных
и
максимальную
эффективность
использования дискового пространства,
так как не требуется места для хранения
контрольных сумм. Реализация этого
уровня очень проста. RAID 0, как
правило, применяется в тех областях, где
требуется быстрая передача большого
объема данных. Для реализации массива
требуется не меньше двух винчестеров.
Рисунок 5 - массив RAID 0
Преимущества:

наивысшая производительность в приложениях, требующих интенсивной
обработки запросов ввода / вывода и данных большого объема;

простота реализации;

низкая стоимость;

максимальная эффективность использования дискового пространства - 100%.
Недостатки:

по
сути,
RAID-массивом
не
является,
поскольку
не
поддерживает
отказоустойчивость;

отказ одного диска влечет за собой потерю всех данных массива.

надёжность RAID 0 заведомо ниже надёжности любого из дисков в отдельности
и падает с увеличением количества входящих в RAID 0 дисков, т. к. отказ
любого из дисков приводит к неработоспособности всего массива.
RAID 1
RAID 1 (mirroring — «зеркалирование») — массив из двух дисков, являющихся
полными копиями друг друга. Не следует путать с массивами RAID 1+0, RAID 0+1 и
RAID 10, в которых используется более двух дисков и более сложные механизмы
2
зеркалирования. В простейшем случае два накопителя содержат одинаковую информацию
и являются одним логическим диском. При выходе из строя одного диска его функции
выполняет другой. Для реализации массива требуется не меньше двух винчестеров.
RAID 1 – простейший
отказоустойчивый массив
Рисунок - массив RAID 1
Преимущества:

простота реализации;

простота восстановления массива в случае отказа (копирование);

Обеспечивает приемлемую скорость записи и выигрыш по скорости чтения при
распараллеливании запросов.

Имеет высокую надёжность — работает до тех пор, пока функционирует хотя
бы один диск в массиве. Вероятность выхода из строя сразу двух дисков равна
произведению вероятностей отказа каждого диска. На практике при выходе из
строя одного из дисков следует срочно принимать меры — вновь
восстанавливать избыточность. Для этого с любым уровнем RAID (кроме
нулевого) рекомендуют использовать диски горячего резерва. Достоинство
такого подхода — поддержание постоянной доступности.
Недостатки:

высокая стоимость – 100-процентная избыточность;

невысокая скорость передачи данных.
3
RAID 1+0, RAID 0+1
Зеркало на многих дисках — RAID 1+0 или RAID 0+1. Под RAID 10 (RAID 1+0) имеют в
виду вариант, когда два или более RAID 1 объединяются в RAID 0. Достоинства и
недостатки – такие же, как и у уровня RAID1. Под RAID 0+1 может подразумеваться два
варианта:


два RAID 0 объединяются в RAID 1;
в массив объединяются три и более диска, и каждый блок данных записывается
на два диска данного массива. Таким образом, при таком подходе, как и в
«чистом» RAID 1, полезный объём массива составляет половину от суммарного
объёма всех дисков (если это диски одинаковой ёмкости).
Как и в других случаях, рекомендуется включать в массив диски горячего резерва из
расчёта один резервный на пять рабочих.
Уровень RAID 10 используется там, где требуется безупречная надежность в сочетании с
исключительной производительностью. В последние годы появились новые
разновидности (мутации) этого классического уровня, имеющие схожие с ним
организацию и характеристики.
Рисунок RAID 1+0 (RAID 10)
4
Рисунок RAID 0+1
RAID 2
Массивы такого типа основаны на использовании кода Хемминга. Диски делятся на две
группы: для данных и для кодов коррекции ошибок, причём если данные хранятся на
дисках, то для хранения кодов коррекции необходимо дисков. Данные распределяются
по дискам, предназначенным для хранения информации, так же, как и в RAID 0, т.е. они
разбиваются на небольшие блоки по числу дисков. Оставшиеся диски хранят коды
коррекции ошибок, по которым в случае выхода какого-либо жёсткого диска из строя
возможно восстановление информации. Метод Хемминга давно применяется в памяти
типа ECC и позволяет на лету исправлять однократные и обнаруживать двукратные
ошибки.
Из плюсов можно выделить исправление ошибок "на лету", высокую скорость потоковой
передачи данных.
5
Достоинством массива RAID 2 является повышение скорости дисковых операций по
сравнению с производительностью одного диска.
Недостатком массива RAID 2 является то, что минимальное количество дисков, при
котором имеет смысл его использовать, - 7. При этом нужна структура из почти двойного
количества дисков (для n=3 данные будут храниться на 4 дисках), поэтому такой вид
массива не получил распространения. Если же дисков около 30-60, то перерасход
получается 11-19%.
RAID 3
Отказоустойчивый дисковый массив с параллельной передачей данных и
четностью (Parallel Transfer Disks with Parity). Отказоустойчивый массив с параллельным
вводом / выводом данных и диском контроля четности. Поток данных разбивается на
порции на уровне байт (хотя возможно и на уровне бит) и записывается одновременно на
все диски массива, кроме одного. Один диск предназначен для хранения контрольных
сумм, вычисляемых при записи данных. Поломка любого из дисков массива не приведет к
потере информации.
В RAID 3 информация разбивается на порции одинакового размера. Этот уровень имеет
намного меньшую избыточность, чем RAID 2. Во втором рэйде большинство дисков,
хранящих контрольную информацию, нужны для определения неисправного разряда. Как
правило, RAID-контроллеры могут получить данные об ошибке с помощью механизмов
отслеживания случайных сбоев. За счет разбиения данных на порции RAID 3 имеет
высокую производительность. Поскольку при каждой операции ввода / вывода
производится обращение практически ко всем дискам массива, то одновременная
обработка нескольких запросов невозможна.
6
Этот уровень подходит для приложений с файлами большого объема и малой
частотой обращений (в основном это сфера мультимедиа). Использование только одного
диска для хранения контрольной информации объясняет тот факт, что коэффициент
использования дискового пространства достаточно высок (как следствие этого –
относительно низкая стоимость). Для реализации массива требуется не меньше трех
винчестеров.
Преимущества:

отказ диска мало влияет на скорость работы массива;

высокая скорость передачи данных;

высокий коэффициент использования дискового пространства.
Недостатки:

сложность реализации;

низкая производительность при большой интенсивности запросов данных
небольшого объема.
RAID 4
RAID 4 похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не
на байты. Данные записываются блоками на разные диски, один диск используется для
хранения битов чётности.
Преимущества заключаются в высокой скорости передачи при работе с большими
файлами. Также высока скорость работы с большим числом запросов на чтение. Из
недостатков можно отметить доставшиеся от RAID 3 – дисбаланс в скорости операций
чтения/записи и существование условий, затрудняющих параллельный доступ к данным.
7
Из систем хранения широкого распространения RAID-4 применяется на устройствах
хранения компании NetApp (NetApp FAS), где его недостатки успешно устранены за счет
работы дисков в специальном режиме групповой записи, определяемом используемой
на устройствах внутренней файловой системой WAFL.
RAID 5
Отказоустойчивый массив независимых дисков с распределенной четностью
(Independent Data Disks with Distributed Parity Blocks). Самый распространенный уровень.
Блоки данных и контрольные суммы циклически записываются на все диски массива,
отсутствует
выделенный
диск
для
хранения
информации
о
четности,
нет
асимметричности конфигурации дисков.
В случае RAID 5 все диски массива имеют одинаковый размер – но один из них
невидим для операционной системы. Например, если массив состоит из пяти дисков
емкостью 10 Гб каждый, то фактически размер массива будет равен 40 Гб – 10 Гб
отводится на контрольные суммы. В общем случае полезная емкость массива из N дисков
равна суммарной емкости N-1 диска. Основным недостатком уровней RAID от 2-го до 4-го
является невозможность производить параллельные операции записи, так как для
хранения информации о чётности используется отдельный контрольный диск. RAID 5 не
имеет этого недостатка.
8
Блоки данных и контрольные суммы циклически записываются на все диски
массива, нет асимметричности конфигурации дисков. Под контрольными суммами
подразумевается
результат
операции
XOR
(исключающее
или).
Xor
обладает
особенностью, которая применяется в RAID 5, которая даёт возможность заменить любой
операнд результатом, и, применив алгоритм xor, получить в результате недостающий
операнд. Например: a xor b = c (где a, b, c — три диска рейд-массива), в случае если a
откажет, мы можем получить его, поставив на его место c и проведя xor между c и b: c xor
b = a. Это применимо вне зависимости от количества операндов: a xor b xor c xor d = e.
Если отказывает c тогда e встаёт на его место и проведя xor в результате получаем c: a xor
b xor e xor d = c. Этот метод по сути обеспечивает отказоустойчивость 5 версии. Для
хранения результата xor требуется всего 1 диск, размер которого равен размеру любого
другого диска в raid.
Преимущества:

высокая скорость записи данных;

достаточно высокая скорость чтения данных;

высокая производительность при большой интенсивности запросов чтения /
записи данных;

высокий коэффициент использования дискового пространства;
Недостатки:

низкая скорость чтения / записи данных малого объема при единичных запросах;
9

достаточно сложная реализация;

сложное восстановление данных;
RAID 6
Отказоустойчивый
массив
независимых
дисков
с
двумя
независимыми
распределенными схемами четности (Independent Data Disks with Two Independent
Distributed Parity Schemes) (Рисунок 11). RAID 6 – это отказоустойчивый массив
независимых дисков с распределением контрольных сумм, вычисленных двумя
независимыми способами. Этот уровень во многом схож с RAID 5. Только в нем
используется не одна, а две независимые схемы контроля четности, что позволяет
сохранять работоспособность системы при одновременном выходе из строя двух
накопителей. Для вычисления контрольных сумм в RAID 6 используется алгоритм,
построенный на основе кода Рида-Соломона. Обычно использование RAID-6 вызывает
примерно 10-15% падение производительности дисковой группы, по сравнению с
аналогичными показателями RAID-5, что вызвано большим объёмом обработки для
контроллера (необходимость рассчитывать вторую контрольную сумму, а также
прочитывать и перезаписывать больше дисковых блоков при записи каждого блока).
рисунок RAID 6
Преимущества:

высокая отказоустойчивость;

достаточно высокая скорость обработки запросов.
Недостатки:
10

низкая скорость чтения / записи данных малого объема при единичных
запросах;

очень сложная реализация;

сложное восстановление данных;

низкая скорость записи данных.
RAID 7
RAID 7 - зарегистрированная торговая марка компании Storage Computer Corporation,
отдельным уровнем RAID не является. Структура массива такова: на дисках хранятся
данные, один диск используется для складирования блоков чётности. Запись на диски
кешируется с использованием оперативной памяти, сам массив требует обязательного
ИБП; в случае перебоев с питанием происходит повреждение данных.
Преимущества:

очень высокая скорость передачи данных и высокая скорость обработки
запросов (в 1,5…6 раз выше других стандартных уровней RAID);

хорошая масштабируемость;

значительно возросшая (благодаря наличию кэша) скорость чтения данных
небольшого объема;

отсутствие необходимости в дополнительной передаче данных для вычисления
четности.
Недостатки:

собственность одной компании;

сложность реализации;
11

очень высокая стоимость на единицу объема;

не может обслуживаться пользователем;

необходимость
использования
блока
бесперебойного
питания
для
предотвращения потери данных из кэш-памяти;

короткий гарантийный срок.
 Matrix RAID


рисунок – массив Intel Matrix RAID

Matrix RAID – это технология, реализованная фирмой Intel в своих чипсетах
начиная с ICH6R. Строго говоря, эта технология не является новым уровнем RAID
(ее аналог существует в аппаратных RAID-контроллерах высокого уровня), она
позволяет,
используя
небольшое
количество
дисков
организовать
одновременно один или несколько массивов уровня RAID 1, RAID 0 и RAID5. Это
позволяет за сравнительно небольшие деньги обеспечить для одних данных
повышенную надёжность, а для других высокую скорость доступа.
12
Download