дискові Масиви

  1. Продуктивність дискових масивів
  2. Все залежить від додатка
  3. 1. Вибір зовнішнього інтерфейсу
  4. NAS (Network Attached Storage)
  5. SCSI
  6. Fibre Channel (FC)
  7. 2. Розмір кешу контролера

Даний розділ допоможе вам вибрати дисковий масив, який найбільш повно відповідає вашим потребам.
Продуктивність дискових масивів повинна, перш за все, задовольняти потребам ваших додатків.
Даний розділ допоможе вам вибрати дисковий масив, який найбільш повно відповідає вашим потребам Продуктивність дискових масивів
Все залежить від додатка

  1. Вибір зовнішнього інтерфейсу
  2. Розмір кешу контролера
  3. Інтерфейс жорстких дисків

Позиціонування дискових масивів
Корисні посилання
Допомога консультанта

Основними елементами масиву є:
1) Зовнішній інтерфейс (зазвичай це інтерфейс RAID контролера масиву): NAS, SCSI, Fibre Channel, iSCSI
2) Кеш контролера
3) Інтерфейс жорстких дисків масиву: sATA, SCSI, Fibre Channel
Кожен з вище перерахованих елементів повинен бути підібраний для гармонійної роботи з вашим додатком, бо воно є чільним.

Продуктивність дискових масивів


Продуктивність можна розглядати як показник обсягу роботи, виконаної за певний проміжок часу. Продуктивність сховищ даних часто виражається в числі операцій введення / виводу за секунду (IOPS) і / або мегабайт в секунду (MB / s). Число операцій введення / виводу за секунду (IOPS) і / або кількість переданих мегабайт інформації в секунду (MB / s) є показниками продуктивності, але не її синонімами, більш того, вони мають зворотну залежність - велике значення показника IOPS означає низьку MB / s , як показано на діаграмі:
Продуктивність можна розглядати як показник обсягу роботи, виконаної за певний проміжок часу
Наприклад, додаток вимагає 1 000 IOPS при розмірі блоку в 8k, що рівнозначно пропускної здатності в 8 Мб / с (1 000 IOPS x блок 8k = 8 Мб / с). При використанні 200 Мб / с з'єднання Fibre Channel, 8 Мб / с вже не представляється занадто хорошою продуктивністю (8 Мб / с має на увазі використання тільки 4% пропускної здатності шини Fibre Channel) якщо говорити про продуктивність в показниках Мб / с. Однак якщо додаток запитує 1 000 IOPS і пристрій зберігання даних надає 1 000 IOPS без організації черги (глибина черги команд
З іншого боку, якщо додаток відеомонтажу послідовно читає дані при розмірі блоку 64 Мб і 3 паралельних потоках, це означає 192 Мб / сек загальної продуктивності в 200 Мб / с з'єднанні Fibre channel (64 Мб x 3 потоку = 192 Мб / с). І, хоча немає ніяких сумнівів, що продуктивність 192 Мб / с висока (використовується 96% пропускної здатності шини Fibre Channel), слід зазначити, що в даному середовищі додатка підтримується лише 3 IOPS.
Ці два простих прикладу наочно ілюструють залежність продуктивності від ситуації, тобто продуктивність залежить від того, чого ви намагаєтеся досягти - Мб / с або IOPS.

Все залежить від додатка


Не важливо, які можливості має сховище даних, воно не може надати більше число операцій введення / виводу, ніж запрошувати додаток, тому саме додаток формує і задає продуктивність. Наприклад, припустимо, що додаток генерує запит на 2 500 IOPS від сховища. Чи існує якась різниця в продуктивності на рівні додатку між сховищем, які надають 2 500 IOPS і 10 000 IOPS? Очевидно, що відповіддю на питання є чітке "ні", оскільки будь-яке сховище може надати 2 500 IOPS за запитом. Це можна порівняти з веденням машини на автостраді з обмеженням швидкості: якщо всі машини починають рух в один і той же час і дотримуються обмеження по швидкості, то будь-яка машина доставить вас в призначене місце в один і той же час, незалежно від її марки - будь це Chevy Lumina або Ferrari F40.
Продуктивність залежить від ситуації, тобто від того, чого ви намагаєтеся досягти. Занадто багато виробників систем зберігання даних прагнуть опублікувати продуктивність I / O в показниках пропускної здатності (Мб / с). Більшість бізнес додатків орієнтовані на транзакції і найбільш важливим показником продуктивності для них є саме число операцій введення / виводу в секунду (IOPS). В кінцевому рахунку, продуктивність може вважатися хорошою, якщо додаток не очікує черги в сховище. Розуміння вимог до робочих характеристик програми та забезпечення відповідним сховищем, дозволяє досягти максимальної продуктивності і ефективності програми. Будьте уважні до вимог продуктивності - якщо середовище, генеруюча вимоги не ідентична і сильно відрізняється від вашої, ви не зможете отримати ті ж результати продуктивності. Єдиний перевірений і надійний спосіб побачити реальну продуктивність - визначити її в вашому середовищі додатка.

1. Вибір зовнішнього інтерфейсу


Ще років 5 назад все було простіше. Були RAID масиви, з 6 - 9 дисками з SCSI інтерфейсом і все. За останні чотири роки з'явилися ще як мінімум три інтерфейсу. Це Fibre Channel (FC), Gbit Ethernet NAS (Network Attached Storage, iSCSI (SCSI over IP). Масиви з інтерфейсом SCSI, все ще залишаються популярним рішенням для розширення обсягів дискового простору індивідуальних серверів.
Отже, наважимося ввести кілька правил вибору зовнішнього інтерфейсу.

NAS (Network Attached Storage)

Вибирайте NAS, коли вам необхідно швидко і без особливого клопоту додати дисковий простір в локальній мережі для клієнтів мережі. Доступ до NAS пристроїв здійснюється по локальній мережі на рівні протоколів передачі файлів (NFS, CIFS), так як, по суті, це файловий сервер з 8 - 12 дисками hot swap, з 1 або 2 портами Gbit Ethernet, що підтримує основні рівні RAID. Від звичайного сервера його відрізняє його власна операційна система (зазвичай урізаний виробником Linux в Flash Memory), підтримка одночасно клієнтів різних ОС (Windows, Linux, Solaris, Macintosh і т.д.), простота інсталяції (зазвичай до півгодини). Ще одна перевага NAS - він не вимагає для користувача ліцензій.
NAS слід використовувати для зберігання файлів клієнтів мережі. За статистикою NAS обходиться на 30% дешевше звичайного файл сервера в мережі. Він не вимагає користувальницьких ліцензій. Він підтримує гетерогенні платформи. Він оптимізований під файловий ввід / вивід.
NAS не слід використовувати

  • Як дискового сховища для серверів додатків і файлових серверів локальної мережі
  • Як сховище для back-up на диск (допускається в разі, якщо back-up робиться в неробочий час).
    На малюнках нижче наведені декілька прикладів використання NAS:

    Мал. 2: Застосування NAS пристрої компанії Axus Microsystems ємністю 2 терабайта в локальній мережі з гетерогенними клієнтами. Типові програми: відділ програмування, відділ проектування CAM / CAD, відділ аналізу медичних зображень і даних, дизайнерський відділ т.д.

    д

    Мал. 3: Місцева (в межах будівлі) або віддалена (через WAN) IP реплікація томів серверів A, B і С з використанням NAS пристроїв sNAZ S8 компанії Raidtec.


    Пристрої на рис. 1 і 2 застосовують відповідно АТА і sATA диски в якості носіїв.

    SCSI

    Використовуйте дискові масиви з інтерфейсом SCSI коли потрібно збільшити дисковий простір індивідуального сервера і винести його за корпус.
    SCSI масиви не слід використовувати, якщо ви, в недалекому майбутньому, плануєте перейти на мережу зберігання даних (SAN).

    Рис 4: Підключення кластера з двох вузлів до високопродуктивної масиву SANnet II Ultra 320 SCSI. Приклад для середовищ з високою щільністю транзакцій. Області застосування: білінг, CRM, ERP і т.д.


    д

    Рис 5: Підключення 4х терабайт зовнішнього дискового простору до сервера архіву документів з використанням дискового масиву Demon SA16 Ultra 320 SCSI, компанії Аxus Microsystems. Області застосування: розширення дискового простору NAS пристроїв, електронний архів, документообіг, video on demand, disk-to-disk back-up.


    Fibre Channel (FC)


    Використовуйте дискові масиви з інтерфейсом FC, коли вам необхідно підключити до нього кілька серверів додатків або клієнтів які будуть ділити його дисковий простір між собою. Вибирайте масив виходячи з вимог вашої програми.
      Масиви з інтерфейсом FC слід використовувати для серверів:
    • Oracle, Sybase, SQL, DB2, Informix і інших баз, які люблять швидкі диски
    • Високопродуктивних додатків таких як: документообіг, B2C, billing, сховищ корпоративних даних.
    • Вимагають безвідмовний доступ до даних (24 х 7)
    • Серверів back-up, коли back-up робиться через SAN.
    • Для станцій відеомонтажу і серверів мовлення
    • У корпоративних середовищах, для централізації всіх ресурсів зберігання з метою централізованого менеджменту, дублювання і захисту.
      Масиви з інтерфейсом FC не слід використовувати:
    • Для Web серверів.
    • Для DNS, WINS, DC, PDC
    • Для Desk Top PC (якщо це не станція відео монтажу)
    • Для серверів не потребують більш 100GB простору
    • Для серверів вимагають розділення файлових ресурсів. Для цього краще використовувати NAS


    Рис 6: Побудова високопродуктивної, відмовостійкої (99,9998%) мережі зберігання даних, для додатків з високою щільністю транзакцій (до 160 000 IOPs) з використанням масиву SANnet II FC-FC від DotHill. (6 серверів, 2 FC switch, 2 DotHill, no-single point of failure). Області застосування: hot billing, телекомунікації, моделювання в реальному часі, CRM, ERP, банківські та фінансові системи, великі високотранзакціонние бази даних.


    Області застосування: hot billing, телекомунікації, моделювання в реальному часі, CRM, ERP, банківські та фінансові системи, великі високотранзакціонние бази даних

    Рис 7: Використання контролера зберігання даних RIO для побудови корпоративної мережі зберігання даних з ієрархічним менеджментом. До контролера RIO підключений JBOD c дисками FC ємністю 2 терабайта і три JBOD з sATA дисками, ємністю 4 терабайта кожен. Ієрархічний менеджер відстежує частоту доступу до даних і мігрує рідше використовуються дані на sATA диски. Області застосування: документообіг в великих компаніях, електронний архів, бібліотечні системи, ТВ студії і мовлення, студії нелінійного монтажу.

    Області застосування: документообіг в великих компаніях, електронний архів, бібліотечні системи, ТВ студії і мовлення, студії нелінійного монтажу

    Мал. 8: Використання дискових масиву RIVA FC-FС і Stratis FC-SCSI для побудови мережі зберігання даних невеликого підприємства або підрозділу для додатків із середньою щільністю транзакцій (до: 64 000 IOPs). Області застосування: cold billing, e-business, потоковий відео, невеликий банк.

    Області застосування: cold billing, e-business, потоковий відео, невеликий банк

    Мал. 9: Використання дискового масиву Demon SA16-FC-sATA як недорогого і ємного сховища з sATA дисками для архівних і файл серверів, студій нелінійного монтажу, disk-to-disk back-up через SAN, розширення дискового простору NAS.


    iSCSI: Цей розділ в стадії розробки.
    Нижче наведені графіки масивів, пропонованих Storus в залежності від інтерфейсу, продуктивності, ціни і області застосування.
    iSCSI: Цей розділ в стадії розробки

    Мал. 10: Позиціонування дискових масивів SCSI

    10: Позиціонування дискових масивів SCSI

    Мал. 11: Позиціонування дискових масивів FC (на 4 терабайта)

    2. Розмір кешу контролера


    Оптимальний розмір кеш пам'яті контролера дискового масиву може значно підвищити його продуктивність. Важливо розуміти в яких випадках збільшення кеш пам'яті підвищить продуктивність, а в яких ні.
    Існує два типи доступу до даних з боку програми: послідовний (відео, великі файли, і т.д.), коли дані пишуться на диск великими порціями (блоками), та лягають на поверхню послідовно, і випадковий (бази даних із записами малих розмірів , високотранзакціонние додатки), коли дані пишуться на диск малими порціями і розкидані по всьому дискового простору масиву. Легко припустити, що при запиті на читання, в першому випадку контролер збере дані швидше, тому що блоки розташовані поруч і час позиціонування головок диска мінімально. У другому випадку, голівках диска необхідно зробити набагато більше, щоб зібрати розрізнені крихітні. З іншого боку, доступ в кеш, який є оперативною пам'яттю, набагато швидше, ніж до диска. Алгоритми кешування працюють однаково (з деякою різницею в ефективності, в залежності від виробника): найбільш часто запитувані дані зберігаються в кеш.
    Тому ми можемо припустити, що розмір кеш пам'яті контролера, перш за все, критичний для додатків з випадковим доступом, які характеризуються високою щільністю транзакцій в одиницю часу. Збільшення кеш пам'яті контролера в двоє може підвищити продуктивність системи в цілому на 35% (!). Якщо для потокового відео цілком буде досить 128 МВ, то для системи буде потрібно не менше 1GB

    3. Інтерфейс жорстких дисків


    Storus пропонує дискові масиви з дисками Fibre Channel, SCSI і sATA.
      FC HDD:
    • Надійність висока. Кожен диск забезпечений двома каналами FC. У разі виходу з ладу одного, робота триває по другому. 1 500 000 годин напрацювання на відмову.
    • Продуктивність відмінна. Найвища продуктивність для додатків з випадковим методом доступу.
    • Масштабованість відмінна. Ємність масиву нарощується до 60 терабайт.
      SCSI HDD:
    • Надійність середня. Кожен диск має один канал. У разі виходу з ладу підлягає заміні. 1 000 000 годин напрацювання на відмову.
    • Продуктивність хороша. Для додатків з випадковим методом доступу.
    • Масштабованість погана. Ємність масиву нарощується до 4 терабайт.
      SATA HDD:
    • Надійність нижче середньої. Чи не для масивів з інтенсивним циклом. Напрацювання на відмову 500 000 годин.
    • Продуктивність середня. Хороша для додатків з послідовним методом доступу.
    • Масштабованість відмінна. До 120 терабайт в одному масиві.

    Корисні посилання:


    1) В огляді розглядаються переваги і недоліки нтерфейси систем зберігання даних таких як: SCSI, Fibre Channel, IEEE 1394 (FireWire), Serial ATA і iSCSI.
    storage_interfaces.pdf
    2) Дослідження, проведене аналітичною компанією Taneja Group, пророкує перспективи використання в ярусном зберіганні (tiered storage) дисків ATA і Serial ATA. У статті також дано опис ярусів зберігання (storage tiers), представлені 4 ключові чинники, що впливають на розвиток даної технології і думки Taneja Group з приводу майбутнього технології.
    Storage-Tiers-ATA-Tech-Brief-01-2004.pdf
    3) У цій статті розглядаються різні методи підключення сховищ до хост системам, такі як SAS (DAS), NAS і SAN, а також варіанти організації резервного копіювання, що використовуються в кожному випадку.
    host_connection_1.htm
    4) Виробники дискових систем часто звертають увагу на "внутрішню пропускну здатність" дискових систем. Чи є вона корисним показником продуктивності для додатків? Чи можна використовувати це показник для порівняння продуктивності двох різних дискових систем? Відповіді на ці питання обговорюються в цій статті
    DiskSystemInternalBandwidthWars.pdf
  • Чи існує якась різниця в продуктивності на рівні додатку між сховищем, які надають 2 500 IOPS і 10 000 IOPS?
    Чи є вона корисним показником продуктивності для додатків?
    Чи можна використовувати це показник для порівняння продуктивності двох різних дискових систем?

    Дополнительная информация

    rss
    Карта