МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ
Національний університет «Львівська політехніка»
Кафедра САПР
Доповідь
на тему: “Технологія організація масивів даних RAID.
Порівняння RAID0 та RAID6“
з курсу: “Мережеве забезпечення комп’ютерних систем проектування”
ЗМІСТ
ЗМІСТ 3
ВСТУП 4
1. ПРИСТРОЇ ЗАПАМ’ЯТОВУВАННЯ 8
1.1 ХАРАКТЕРИСТИКИ ПРИСТРОЇВ ЗАПАМ’ЯТОВУВАННЯ 8
1.1.1 МЕТОД ДОСТУПУ 11
1.1.2 ПРОДУКТИВНІСТЬ ПЗ 12
1.1.3 ФІЗИЧНІ ТИПИ ПЗ 13
1.2 СТРУКТУРНА ОРГАНІЗАЦІЯ ПЗ 16
1.2.1 ЛОГІЧНА СТРУКТУРА МІКРОСХЕМИ ПАМ'ЯТІ 17
1.3. КЕШ-ПАМ'ЯТЬ 18
1.4 ЗБЕРІГАННЯ ІНФОРМАЦІЇ НА МАГНІТНИХ ДИСКАХ 20
1.4.1 ОРГАНІЗАЦІЯ ДАНИХ НА МАГНІТНОМУ ДИСКУ 21
2. ТЕХНОЛОГІЯ ОРГАНІЗАЦІЇ МАСИВІВ ДАНИХ RAID 24
2.1 RAID 0 25
2.2 RAID 1 27
2.3 RAID 2 28
2.4 RAID 3 29
2.5 RAID 4 30
2.6 RAID 5 31
2.7 RAID 6 32
3. ПОРІВНЯЛЬНА ХАРАКТЕРИСТИКА СХЕМ 34
RAID 0 І RAID 6 34
3.1 RAID 0 І ПЕРЕДАЧА ВЕЛИКОГО ОБ'ЄМУ ДАНИХ 34
3.2 RAID 0 І ВИСОКА ЧАСТОТА ЗАПИТІВ ВВОДУ-ВИВОДУ 35
ВИСНОВОК 37
СПИСОК ЛІТЕРАТУРИ 38
ВСТУП
Час змінюється із ним міняються комп’ютерні технології. Поява нових технологій призводить до швидкості обміну інформації яка зростає за допомогою пз та накопичувачів інформації.
Першим електронним комп'ютером можна назвати систему, створену в 1942 році Джоном В. Атанасовим (John V. Atanasoff) в коледжі штату Айова. У цьому пристрої в якості перемикачів використовувалися вакуумні лампи. Для військових були потрібні більш довершені обчислювальні системи. У 1946 році в Пенсільванському університеті Джоном Мошлі і Дж. Преспером Экертом була створена електронно-обчислювальна машина ENIAC (Electrical Numerical Integrator and Calculator). Вона працювала з 10-розрядними числами і виконувала 300 операцій в секунду. Продуктивність комп'ютера ENIAC була в 1 000 разів вища, ніж у механічних і електромеханічних пристроїв. У цьому комп'ютері використовувалося 18 тис. вакуумних ламп, він займав площу 167 квадратних метрів і споживала 180 тис. ватів.
У 1945 році математик Джон фон Нейман показав, що комп'ютер є цілісна фізична структура і може ефективно виконувати будь-які обчислення без зміни апаратної частини. Іншими словами, програми можна змінювати, не міняючи апаратного забезпечення. Ця ідея набула подальше поширення у вигляді програм, що зберігаються в комп'ютері.
Перші комерційні комп'ютери ENIAC і UNIVAC з'явилися в 1947 році (до появи UNIVAC комп'ютери використовувалися тільки в науці і у військових цілях). У них використовувалася оперативна пам'ять для зберігання деяких програм і часто використовуваних даних; програмування здійснювалося за допомогою машинної мови.
У 1973 році були розроблені перші мікропроцесорні комплекти на основі мікропроцесора 8008. Правда, вони годилися хіба що для демонстрації своїх можливостей і включення індикаторів. В кінці 1973 років Intel випустила мікропроцесор 8080, швидкодія якого була в 10 разів вище, ніж у 8008, і який міг адресувати пам'ять об'ємом до 64 Кбайт.
У 1975 році фотографія комплекту Altair фірми МITS була поміщена на обкладинку січневого номера журналу Popular Еlесtronic. Цей комплект, який можна вважати першим ПК, складався з процесора 8080, блоку живлення, лицьової панелі з безліччю індикаторів і запам’ятовуючого пристрою місткістю 256 байт. Вартість комплекту складала 395 доларів, і покупець повинен був сам зібрати комп'ютер. Цей ПК був побудований по схемі з відкритою шиною (роз'ємами), що дозволяло іншим фірмам розробляти додаткові плати і периферійне устаткування. Поява нового процесора стимулювала розробку різного програмного забезпечення, включаючи операційну систему СР/М (Control Program for Microprocessors) і першу мову програмування — BASIC (Beginners All-purpose Symbolic Instruction Code) фірми Microsoft.
У 1975 році ІВМ вперше випустила те, що можна було б назвати персональним комп'ютером. Модель 5100 мала пам'ять місткістю 16 Кбайт, вбудований дисплей на 16 рядків по 64 символи, інтерпретатор мови ВASIС і касетний накопичувач БС-300. Проте вартість комп'ютера (9 000 доларів) для рядового покупця виявилася дуже високою, особливо якщо врахувати, що безліч любителів (названих пізніше хакерами) пропонували власні комплекти всього за 500 доларів.
Очевидно, що ПК фірми IВМ не могли витримати такій конкуренції на ринку і продавалися дуже погано.
Після появи першого IВМ РС пройшло більше 18 років, і за цей час, звичайно, багато що змінилося. Наприклад, IВМ-совмістимі комп'ютери, що раніше використовували процесор 8088 з тактовою частотою 4,77 Мгц, тепер на основі процесора Pentium II працюють з тактовою частотою 500 Мгц і вище, швидкодія сучасних систем виросла більш ніж в 4 000 разів (мається на увазі загальна продуктивність, а не тільки тактова частота). Перший ІВМ РС мав два односторонні накопичувачі на гнучких дисках місткістю 160 Кбайт і використовував операційну систему DOS 1.0, а сучасні комп'ютери працюють з жорсткими дисками місткістю 20 Гбайт і вище.
Можна вважати, що в загальному вигляді комп'ютер складається з компонентів трьох типів — ЦП, оперативної пам'яті і модулів вводу-виводу, причому компонентів деяких типів в системі може бути декілька. Для того, щоб компоненти в процесі роботи могли обмінюватися даними і управляючими сигналами, повинна існувати якась підсистема, що забезпечує зв'язок між ними. Таким чином, описуючи в загальному вигляді комп'ютерну систему, ми повинні специфікувати:
функції кожного компоненту по відношенню до інших, тобто дані і управляючі сигнали, якими він обмінюється з іншими компонентами;
структуру, що забезпечує передачу цих сигналів за призначенням.
Дуже важливо виробити загальний погляд на структуру і функції компонентів, оскільки він дозволить зрозуміти суть того, що ж відбувається в процесі роботи комп'ютера.
Розглядаючи комп'ютер з цієї точки зору, можна виявити недоліки в конструкції системи і відшукати способи їх усунення, проаналізувати шляхи забезпечення працездатності системи при відмові якого-небудь з компонентів. У багатьох випадках вимогу забезпечити максимальну продуктивність і надійність системи в цілому можна задовольнити не стільки за рахунок нарощування параметрів окремих компонентів, скільки правильним вибором методу їх структурної організації.
Зростання продуктивності пристроїв зовнішньої пам’яті внаслідок розвитку технології виробництва компонентів відбувається значно повільніше, ніж зростання продуктивності оперативної пам'яті. Це відставання робить підсистему зовнішньої пам'яті найвужчим місцем в сучасній обчислювальній системі і примушує розробників зосередити увагу на пошуку структурних методів подолання цієї суперечності.
Основна ідея застосування подібних методів до пристроїв зовнішньої пам'яті оригінальністю не відрізняється — якщо швидко виконати операцію одному виконавцю (пристрою) не під силу, потрібно додати в "команду" ще декілька виконавців і розподілити між ними роботу так, щоб жоден не простоював.
Що стосується пристроїв зовнішньої пам`яті на магнітних дисках (ПЗПМД), то ця ідея виливається в організацію багатодискової підсистеми, в якій є масив щодо незалежних і, в той же час, координованих працюючих пристроїв, здатних загальними зусиллями вчасно виконати поставлену задачу. Висока продуктивність обчислювальних систем забезпечується застосуванням технології RAID. Ця технологія використовується для створення функціонуючих масивів кількох пристроїв запамятовування з метою збільшення продуктивності, швидкодії і надійності роботи системи. Ця стратегія замінює диски з великою щільністю запису безліччю дисків з малою щільністю і розподіляє дані таким чином, що забезпечує можливість одночасного доступу до даних з різних дисків. Це істотно підвищує ефективність вводу-виводу і дає можливість поступового нарощування місткості масиву.
1. ПРИСТРОЇ ЗАПАМ’ЯТОВУВАННЯ
Хоча структура пам'яті комп'ютерної системи досить проста, мабуть, жодна інша підсистема не може похвалитися такою різноманітністю типів пристроїв, вживаних технологій, способів організації, таким широким діапазоном значень продуктивності і вартості. Не існує технології (якій можна було б віддати незаперечну перевагу), що оптимально задовольняє вимогам до цього компоненту з боку системи. Саме тому типова комп'ютерна система включає декілька пристроїв, які, врешті-решт, виконують одну і ту ж функцію — зберігають інформацію. Ці пристрої розрізняються залежно від ступеня їх близькості до процесора. Ті пристрої, до яких процесор може звертатися безпосередньо, відносять до внутрішньої пам'яті системи, а інші, доступ до яких виконується через проміжний модуль вводу-виводу, — до зовнішньої.
1.1 ХАРАКТЕРИСТИКИ ПРИСТРОЇВ ЗАПАМ’ЯТОВУВАННЯ
Аналіз різних типів пристроїв зберігання інформації набуде систематичного характеру, якщо скласти перелік ключових характеристик таких пристроїв і використати ці характеристики для класифікації (табл. 1.).
Таблиця 1. – Характеристики ПЗ
Характеристика
Набір параметрів/Можливе значення
Розміщення
Процесор; внутрішня,
зовнішня (вторинна память)
Місткість
Розмір слова; кількість слів
Порція передавання
Слово; блок
Метод доступу
Послідовний; прямий; довільний; асоціативний;
Продуктивність
Час доступу; час циклу; швидкість передачі
Фізичний тип
Напівпровідникові мікросхеми;магнітне
середовище; оптичний; магнітооптичний
Фізичні характеристики
Енергозалежні/незалежні; стираючі/нестираючі
Розміщення. Пристрої, що запам'ятовують, по місцю розміщення в системі діляться на внутрішні і зовнішні. Дуже часто внутрішня пам'ять ототожнюється з оперативною, хоча до цієї групи входять і інші типи ЗП. У складі процесора є невелика локальна пам'ять у вигляді декількох регістрів. Крім того пристрій управління, який організаційно входить до складу процесора, також має власну внутрішню пам'ять для зберігання мікропрограм. Іншим типом внутрішнього ЗП є кешпамять, яка стала неодмінним компонентом всіх сучасних процесорів. До зовнішніх ЗП відносять периферійні пристрої зберігання інформації, такі, як накопичувачі на магнітних дисках і стрічках, для доступу до яких процесору потрібно звернутися до відповідного модуля вводу-виводу.
Місткість — одна з основних природних характеристик будь-якого ЗП. Загальноприйнятою одиницею вимірювання інформаційної місткості є 8-бітовий байт, але місткість внутрішніх ЗП, крім того, вимірюється і в словах. Довжина слова в сучасних комп'ютерах кратна 1 байт — 1, 2 або 4 байт (8, 16 або 32 біт). Місткість зовнішньої пам'яті завжди оцінюється в байтах.
Порція передавання. При кожному зверненні до внутрішнього ЗП передається (враховується із ЗП або до НП) певна порція даних. Як правило, розмір порції відповідає довжині слова ЗП, але це не обов'язково. Чому справа йде саме так, стане зрозумілішим, якщо пояснити значення трьох взаємозв'язаних термінів.
Слово — це "природна" одиниця, що відображає організаційну структуру ЗП. У більшості комп'ютерів розмір слова оперативної пам'яті рівний кількості розрядів, використовуваних для представлення цілого числа і машинної команди, хоча з цього правила існує маса виключень.Наприклад, в комп'ютері CRAY-1 використовується ЗП з довжиною слова 64 біт, а ціле число представляється 24 розрядами. У комп'ютерах сімейства VAX при довжині слова ЗП, рівної 32 біт, машинні команди мають змінну довжину, кратну 1 байт.
Одиниця, що адресується. У багатьох системах одиницею, що адресується, також являється слово, але іноді можна адресувати і окремий байт, хоча слово має довжину 2 байт або більш. У будь-якому випадку між довжиною (розрядністю) коду адреси А і кількістю одиниць N, що адресуються, отримується співвідношення 2A=N.
1.1.1 МЕТОД ДОСТУПУ
Розрізняють наступні методи доступу до інформації, що зберігається на ПЗ:
а) Послідовний доступ (sequential access). Інформація, що зберігається, розділена на елементи, Які називаються записами (records). Крім власне даних зберігається і додаткова адресна інформація, яка служитьдля розділення записів і використовується в процесі пошуку потрібного запису. Для доступу використовується суміщений механізм читання/запису, що перемикається, який переміщається з поточного положення до потрібного запису, проходячи всі проміжні. В результаті час доступу до потрібного запіису може змінюватися в досить широких межах і залежить від результатного положення механізму читання/запису і положення шуканого запису. Послідовний доступ характерний для деяких конструкцій зовнішніх ПЗ, зокрема — накопичувачів на магнітній стрічці.
б) Прямий доступ (direct access). Як і при послідовному доступі, припрямому використовується суміщений механізм читання/запису. Але кожен запис має свою адресу, відповідну її фізичному положенню на носії. Доступ здійснюється прямим зверненням до зониносія, в якій знаходиться запис, що адресується, і далі послідовноє видимим усередині цієї зони, поки механізм читання/запису не буде суміщений з шуканим записом. Час доступу до довільного запису змінний, хоча розкид значень не значний, як при послідовному доступі. Прямий доступ реалізований в конструкціях тих зовнішніх ПЗ, які використовують як носій інформації.
в) Довільний доступ (random access). Кожна одиниця, що адресується, має свій вбудований механізм адресації. Час доступу до будь-якої одиниці (осередку) не залежить від передісторії і від адреси цього осередку. Таким чином, можливий безпосередній доступ до осередків в довільному порядку з мінімальними втратами часу. Саме такий спосіб доступу використовується в оперативних ПЗ. У деяких конструкціях кеш-пам'яті також використовується механізм довільного доступу.
г) Асоціативний доступ (associative access). Існують такі ПЗ з довільним доступом, які оснащені вбудованим механізмом порівнянняпевних бітів в кожному осередку із заданим зразком, причому порівняння виконується по всіх осередках одночасно. Таким чином, потрібний осередок відшукується не стільки за своєю фізичною адресою, скільки по вмісту. Як і в звичному ПЗ з довільним доступом, час доступу не залежить від адреси осередку або передісторії. Такий метод доступу отримує все більше розповсюдження в конструкціях блоків кеш-пам'яті.
1.1.2 ПРОДУКТИВНІСТЬ ПЗ
З погляду конструктора обчислювальної системи найважливішими характеристиками ПЗ є інформаційна місткість і продуктивність. Для оцінки продуктивності використовується три параметри:
а) Час доступу (access time). Для ПЗ з довільним доступом цей параметр характеризує час виконання операцій читання або запису, і виміряється як тривалість тимчасового інтервалу між моментом, коли в пристрій передана адреса, і моментом, коли дані зафіксовані в памяті (при виконанні запису) або коли ними може скористатися інший пристрій комп'ютера (при виконанні читання). Для ПЗ з послідовним або прямим доступом цей параметр характеризує час, необхідний для перекладу механізму читання/запису в потрібну позицію по відношенню до носія інформації.
б) Тривалість циклу звернення до пам'яті (memory cycle time). Цей параметр характеризує ПЗ з довільним доступом. Він вимірюється мінімальною тривалістю тимчасового інтервалу між послідовнимисеансами доступу до пам'яті. Таким чином, час циклу включає часдоступу плюс час виконання додаткових операцій, пов'язаних зпідготовкою пристрою до наступного обігу. Ці додатковіоперації залежать від типу конструкції пристрою — в одних потрібендеякий час для скидання сигналів на лініях, а в інших може бути потрібним відновлення інформації в елементі, що запам'ятовує, після її зчитування (так звані ПЗ з руйнуванням інформації при зчитуванні).
в) Швидкість передачі (transfer rate). Цей параметр характеризує інтенсивність інформаційного потоку між ПЗ і тими пристроями, які потребують інформації, що зберігається в ньому. Для ПЗ з довільним доступом швидкістю передачі є величина, зворотна тривалості циклу обігу.
1.1.3 ФІЗИЧНІ ТИПИ ПЗ
Історія конструювання засобів зберігання інформації налічує стільки ж років, скільки і історія електронної обчислювальної техніки. За цей час були створені ПЗ на основі різних фізичних явищ. В даний час зі всієї різноманітності конструкцій на практиці застосовуються чотири типи ЗУ (точніше, чотири типи фізичних носіїв інформації):
а) напівпровідникові, в яких зберігання інформації виробляється або в електронних елементах з двома стійкими станами, або в запапамятовуючих напівпровідникових місткостях;
б) магнітні, де для зберігання використовується ефект перемагнічування магнітного матеріалу, нанесеного на яку-небудь поверхню (стрічку, диск і т.п.);
в) Оптичні;
г) Магнітооптичні;
Конструктора системи цікавить така характеристика фізичного типу носіїв інформації, як можливість збереження інформації при відключенні живлення (цей параметр одержав назву "незалежність" ПЗ). Всі магнітні, оптичні і магнітооптичні ПЗ (точніше, носії інформації) є незалежними. Що стосується напівпровідникових ПЗ, та більшість їх конструкцій вимагає наявності електроживлення для збереження інформації, але існують і спеціальні конструкції, що зберігають інформацію при відключенні живлення. Серед останніх особливе місце відводиться постійним ПЗ, або — в сучасній термінології — ROM-пам'яті (read only memory). Інформація в ROM-пам'ять записується на стадії виготовлення компоненту або включення його в комп'ютерну систему, а потім може тільки прочитуватися.
Таким чином, менш ємкі, але швидкісніші ПЗ доповнюються менш швидкісними пристроями, але володіючими більшою місткістю. Ключовим питанням, рішення якого забезпечує успіх проекту, є організація потоків інформації в системі, забезпечуючи у міру переходу від пристроїв верхніх рівнів ієрархії до пристроїв нижніх рівнів зниження інтенсивності звернень до ПЗ з боку процесора.
Якщо необхідно всього декілька екземплярів постійних ПЗ з ідентичною інформацією, економічно доцільніше застосовувати програмовані (programmable) постійні ПЗ — PROM-ПЗ. Пристрої цього типу також є незалежними, але процес запису відокремлений від процесу виготовлення мікросхеми і виконується за допомогою електричних сигналів за допомогою спеціального устаткування поза комплектованою обчислювальною системою. Тому запис можна виконувати не на заводі виготовлення мікросхем, а при виготовленні комп'ютера, в якому пристрій з конкретною інформацією повинен використовуватися. Таким чином, область застосування PROM-ПЗ — спеціалізовані обчислювальні системи, що виготовляються дрібними серіями.
Останнім часом набули досить широке поширення ПЗ постійної інформації, допускаючі її стирання і заміну — перепрограмовуючі постійні ПЗ (іноді можна зустріти термін напівпостійні ПЗ). На відміну від RAM-ПЗ такі пристрої є незалежними, і в той же час дозволяють змінювати інформацію, що зберігається в модулі. Існує три типи таких ПЗП: стирані ПЗП, ПЗП з електричним стиранням і флеш-ПЗ (flash memory).
У стираних постійних ПЗ — EPROM-ПЗ (erasable programmable ROM) — і читання, і запис інформації виконується електричними сигналами, але перед процедурою запису всі осередки модуля повинні бути переведені в початковий стан, відповідний зберіганню в них кодів 0. Ця процедура називається стиранням ПЗ. Стирання EPROM-ПЗ виконується оптично — засвіченням модуля потоком ультрафіолетового випромінювання. Звичайно на це йде досить багато (за комп'ютерними мірками) часу — порядком 20 хв. Стирати один і той же модуль EPROM-ПЗ можна багато разів. Записана в модуль після цього інформація може зберігатися досить довго — до декількох років (при дотриманні певних умов експлуатації і зберігання устаткування). Вартість EPROM-ПЗ декілька вищі, ніж порівнянного за об'ємом інформації PROM-ПЗ, але це окупається можливістю час від часу модифікувати дані, що зберігаються.
Ще привабливіші для конструкторів спеціалізованих комп'ютерних систем ПЗ з електричним стиранням — EEPROM-ЗУ (electrically erasable programmable ROM). У таких ПЗ немає необхідності стирати перед записом весь вміст модуля — операції стирання із записом виконуються на рівні осередку, що адресується (як правило, байта). Операція запису займає значно більше часу, ніж операція читання — порядком декількох стільників мікросекунд на байт. У EEPROM-ПЗ поєднуються достоїнства незалежного зберігання інформації з можливістю її довільно змінювати, не витягуючи пристрій з системи, тобто посилаючи сигнали по тих же лініях магістралі (адресним і лініям даних). Це, поза сумнівом, значно підвищує гнучкість комп'ютерної системи з пристроєм такого типу. Але вартість EEPROM-ПЗ вища, ніж EPROM-ПЗ, і, до того ж, густина упаковки осередків в модулі (що, кінець кінцем, визначає об'єм інформації, що зберігається) менше.
Ще один тип ПЗ — так звані пристрої флеш-пам'яті (flash memory). Вперше модулі флеш-пам'яті з'явилися на ринку компонентів у середині 1980-х років і зайняли проміжне положення між EPROM-ПЗ і EEPROM-ПЗ як за вартістю, так і по функціональних можливостях. По своїх функціях флеш-пам'ять схожа з EEPROM-ПЗ — запис нової інформації можливий за допомогою чисто електричних сигналів, а по конструктивних характеристиках, зокрема густина упаковки елементів, що запам'ятовують, в модулі, — з EPROM-ЗУ. Час стирання інформації — декілька секунд, причому стиратися може не весь вміст пам'яті, а вибрані блоки (але все-таки не окремі байти).
1.2 СТРУКТУРНА ОРГАНІЗАЦІЯ ПЗ
Базовим елементом напівпровідникового ПЗ є елемент що запам'ятовує (ЗЕ) — комірка пам'яті. Хоча існує декілька схемних рішень побудови такого елементу, всі типи елементів напівпровідникових мікросхем, що запам'ятовують, мають ряд загальних властивостей:
а) елемент може знаходиться в одному з двох стійких станів, одне з яких інтерпретується як зберігання двійковогокоду 1, а інше — коду 0;
в) у елемент хоча б один раз можна записати потрібний двійковий код і таким чином цілеспрямовано встановити його стан;
В)поточний стан елементу можна зчитувати.
Найчастіше елемент має три висновки, по яких можуть передаватися електричні сигнали. Сигнал на виході Вибірка, як і виходить з його назви, вибирає елемент для виконання операції. Сигнал на виході Управління задає режим обігу (виконувану операцію) — запис або читання. У режимі запису на третій висновок, Введення/зчитування, подається сигнал, відповідний записуваному двійковому коду: 0 або 1. При читанні третій висновок є виходом, і на ньому формується сигнал, відповідний поточному стану елементу: 0 або 1. Електрична схема елементу, метод синхронізації і деталі виконання кожної операції залежать від принципу роботи конкретного типу елементів і технології його виготовлення.
1.2.1 ЛОГІЧНА СТРУКТУРА МІКРОСХЕМИ ПАМ'ЯТІ
Розглядаючи ієрархічну організацію компонентів комп'ютера, зокрема пам'яті, не можна не звернути увагу на те, що перед конструктором підсистеми будь-якого рівня ієрархії завжди стоїть проблема оптимального узгодження таких параметрів, як швидкодія, інформаційна місткість і вартість. Цю проблему повинен вирішувати і розробник модуля напівпровідникової пам'яті при виборі методу організації масиву елементів, що запам'ятовують, і визначенні відповідних цій організації функцій обрамлення. Для модулів напівпровідникової пам'яті ключовим є питання обґрунтованого вибору кількості бітів інформації, зчитаних/записаних в модуль в одному циклі обігу. Діапазон можливих рішень досить великий. Один крайній варіант — фізично скомпонувати масив осередків в модулі так, щоб модуль мав довжину слова, відповідну довжині слова всього ПЗ (значення цього параметра в комп'ютері диктується вибраним типом процесора), тобто елементи, що запам'ятовують, організовуються у вигляді масиву з W слів по В бітів в кожному. Наприклад, модуль місткістю 16 Мбіт фізично компонується як блок пам'яті, 1 М 16-бітових слів, що містять. Інший крайній варіант — так звана однобітова організація модуля, коли за кожен обіг в модуль записується (або прочитується) 1 біт.
В DRAM-модулі місткістю 16 Мбіт за один обіг зчитується/записується 4 біт. Елементи, що логічно запам'ятовують, в цьому модулі розділені на чотири масиви, кожний з яких включає матрицю елементів розміром 2048x2048. При будь-якій схемі фізичної організації масивів кожен елемент пов'язаний з однією з горизонтальних (по рядках) і однієї з вертикальних (по стовпцях) ліній. Кожна горизонтальна лінія підключена до виходів Вибірка елементів даного рядка матриці, що запам'ятовують. Кожна вертикальна лінія підключена до виходів Введення/зчитування елементів відповідного стовпця матриці, що запам'ятовують.
Мікросхеми пам'яті для комп'ютерів загального призначення конструктивно виконуються в корпусах типа DIP (dual inline package) з дворядним розташуванням виходів. Кількість виходів, як правило, не перевищує 32. На рис. 1. показаний корпус EPROM-модуля місткістю 8 Мбіт з організацією Шх8, тобто за одне звернення до модуля прочитується 8-бітовий байт. Корпус має 32 виходи — це один із стандартів корпусів типа DIP.
1.3. КЕШ-ПАМ'ЯТЬ
Підвищення продуктивності окремих компонентів комп'ютера у міру вдосконалення технології виготовлення інтегральних елементів йде нерівномірно. Найшвидше росте продуктивність процесорів, а темпи зростання швидкодії модулів пам'яті поступаються, хоча багато в чому це пояснюється зростанням інформаційної місткості окремого модуля. Через це виявляється, що при звертанні процесора напряму до оперативної пам'яті за необхідною йому інформацією — командами і даними — остання не встигає виконувати поступаючі заявки, і процесору доводиться простоювати. Повною мірою реалізувати потенційну продуктивність процесора можна тільки, погодивши якими-небудь методами пропускну спроможність підсистеми внутрішньої пам'яті і процесора. Це можна зробити, або застосовуючи при побудові оперативної пам'яті більш швидкодійну елементну базу, або використовуючи спеціальні структурні рішення при організації ієрархічних рівнів підсистеми пам'яті. Перший шлях приведе до істотного дорожчання комп'ютера, оскільки компоненти, більш швидкодійні, ніж широко поширені DRAM-модулі, виявляються і на порядок дорожче. Найбільше поширення в сучасній практиці проектування комп'ютерів набув другий шлях — включення між оперативною напівпровідниковою пам'яттю (як правило, на основі DRAM-модулів) і процесором проміжної швидкодійної пам'яті невеликої (в порівнянні із загальним об'ємом оперативної пам'яті) місткості.
Ця проміжна пам'ять недоступна для програми в тому значенні, що ніяк не може бути адресована машинними командами, від чого і назва — кеш-пам'ять (cache memory). У складі комп'ютера є оперативна пам'ять досить великого об'єму і невисокої швидкодії і блок кеш-пам'яті, володіючий високою швидкодією, але значно меншою місткістю, ніж оперативна пам'ять. У кеші тимчасове зберігається копія деякого фрагмента інформації з оперативної пам'яті. Коли процесору потрібно одержати від підсистеми пам'яті чергове слово, насамперед перевіряється, чи не міститься вже воно в кеші. Якщо так, то таку подію прийнято називати кеш-попаданням — cache hit), це слово зчитується з кешу і передається процесору. Якщо ні (таку подію прийнято називати кеш-промахом — cache miss), то з оперативної пам'яті в кеш зчитується блок фіксованої довжини, у складі якого є потрібне слово і потім це слово передається процесору.
1.4 ЗБЕРІГАННЯ ІНФОРМАЦІЇ НА МАГНІТНИХ ДИСКАХ
Магнітний диск як носій інформації є пластиною круглої форми з немагнітного металу (найчастіше алюміній) або пластику, покритого шаром магнітного матеріалу з достатньою корекційною силою і невеликим значенням індукції насичення. Дані записуються на носій і зчитуються з нього за допомогою магнітної головки, яка є мініатюрним електромагнітом. Запис і зчитування інформації відбувається в результаті взаємодії рухомого носія з нерухомою головкою.
Процес запису заснований на явищі збудження магнітного поля при протіканні електричного струму через обмотку головки. Імпульси струму подаються в обмотку і перемагнічують матеріал поверхні носія в тому місці, яке на даний момент знаходиться в безпосередній близькості від головки. Напрям магнітного поля, залежного від полярності електричного імпульсу в обмотці, визначає знак локального перемагнічування матеріалу. Зчитування інформації виробляється при проходженні під головкою перемагніченого носія. Магнітний потік, утворюваний ділянкою, яка проходить під намагніченою головкою, частково замикається через сердечник головки, пронизуючи її обмотку. При проходженні під головкою ділянок з різною полярністю намагнічення потокощеплення обмотки міняється, і в ній виникають електричні імпульси тієї або іншої полярності, які відповідно до прийнятого методу запису сприймаються як сигнали "лог. 1" або "лог. 0".
1.4.1 ОРГАНІЗАЦІЯ ДАНИХ НА МАГНІТНОМУ ДИСКУ
Головка запису/зчитування має дуже маленькі розміри і формоване нею магнітне поле впливає тільки на маленьку ділянку поверхні носія. Оскільки носій під головкою обертається, це дає можливість організувати на ньому дані у вигляді концентричних кіл — доріжок. Ширина доріжки залежить від конструкції головки, як правило на поверхні магнітного диска формується від 500 до 2000 доріжок. На рис. 2 показана схема розподілу окремих зон на поверхні. Сусідні доріжки розділені зазором (gap), який перешкоджає появі помилок (або, принаймні, знижує вірогідність їх появи) внаслідок неточного позиціонування головки щодо взаємодії магнітних полів сусідніх доріжок. Для спрощення електричних схем однакова кількість бітів інформації записується на всіх доріжках, хоча вони і відрізняються по діаметру, а отже, мають різну величину. Таким чином, густина запису (density) інформації — кількість записів на одиницю довжини доріжки — зменшується у міру переходу від внутрішніх доріжок диска до доріжок, розташованих на його периферії.
Рис. 2_ Розмітка магнітного диску
Дані записуються на диск і зчитуються з нього блоками. Зазвичай розділ блоку такий, що на одній доріжці записується безліч блоків. Доріжка розбивається на ділянки, відповідні довжині блоку, які називаються секторами (рис. 2). Як правило, уздовж однієї доріжки розміщено від 10 до 100 секторів, що мають або фіксовану, або змінну довжину, між секторами на доріжці існує міжсекторний проміжок. Необхідно якимось чином ідентифікувати положення кожного сектору, для цього, по-перше, на доріжці повинна бути якась початкова мітка, пo-друге, яким-небудь чином повинні бути помічені початок і кінець сектору. Ці вимоги реалізуються записом на диск службової інформації. Таким чином, на диску крім основної записана ще і спеціальна службова імформпція, яка потрібна тільки схемам управління пристроєм і не доступна користувачу.
Приклад форматування диска представлений на рис. 2.1 В даному випадку кожна доріжка розбита на 30 секторів фіксованої довжини, кожний з яких вміщає 600 байт інформації. З них 512 байт — дані, записувані користувачем, а інші — службова інформація, використовувана контролером диска. Поле ID містить унікальний код, що є по суті адреса відповідного сектора. Поле включає байт SYNCH — спеціальний код, що ідентифікує початок поля ID, за яким слідують два байти номера доріжки, байт номера головки (диск входить до складу пакету, що має декілька поверхонь), байт номера сектора і два байти CRC, в яких зберігається контрольна сума поля.
Рис. 2.1_ Формат доріжки диску пристрою типу «Вінчестер»
2. ТЕХНОЛОГІЯ ОРГАНІЗАЦІЇ МАСИВІВ ДАНИХ RAID
Зростання продуктивності вторинних пристроїв, що запам'ятовують, значно відстає від зростання продуктивності процесорів і основної пам'яті. Така невідповідність вимушує звертати особливу увагу на дискову систему при підвищенні рівня загальної продуктивності.
Як і в інших областях, додаткове підвищення ефективності може бути досягнуте шляхом паралельного використовування декількох пристроїв. У випадку з дисками це означає використовування масивів незалежно і паралельно працюючих дисків. За наявності безлічі дисків різні запити вводу-виводу можуть оброблятися паралельно, якщо блок даних, до якого виробляється обіг, розподілений по безлічі дисків.
У разі застосування безлічі дисків є велика кількість варіантів організації даних і додавання надмірності для підвищення надійності (а це може створити труднощі при розробці схем баз даних, здатних працювати на різних платформах під управлінням різних операційних систем) На щастя, є промисловий стандарт RAID (Redundant Array of Independent Disks — надмірний масив незалежних дисків). RAID-схема складається з 7 рівнів — від нульового до шостого. Ці рівні не мають ієрархічної структури, але визначають різну архітектуру з наступними загальними характеристиками.
а) RAID — це набір фізичних дисків, що розглядаються операційною системою як єдиний логічний диск.
б) Дані розподілені по фізичних дисках масиву.
в) Надмірна місткість дисків використовується для зберігання контрольної інформації, що гарантує відновлення даних у разі відмови одного з дисків.
Друга і третя характеристики різні для різних рівнів RAID. RAID нульового рівня не підтримує третю характеристику зовсім.
Термін RAID спочатку був використаний в науковій доповіді групи розробників Університету Каліфорнії в Берклі [РАТТ88]. У доповіді у загальних рисах були розглянуті різні конфігурації і застосування RAID, а також визначення рівнів RAID. Ця стратегія замінює диски з великою густиною запису безліччю дисків з малою густиною і розподіляє дані таким чином, що забезпечує можливість одночасного доступу до даних з різних дисків. Це істотно підвищує ефективність вводу-виводу і дає можливість поступового нарощування місткості масиву.
Унікальність запропонованої технології полягає в ефективному використовуванні надмірності. Завдяки наявності великої кількості дисків підвищується продуктивність, але збільшується вірогідність збоїв. У зв'язку з цим RAID передбачає зберігання додаткової інформації, що дозволяє відновлювати дані, загублені унаслідок збійної ситуації.
2.1 RAID 0
Рівень 0 не є справжнім RAID-рівнем, оскільки він не використовує надмірність для підвищення ефективності. Проте існує ряд застосувань, таких, як деякі суперкомп'ютери, де домінують питання продуктивності і місткості, а зниження вартості більш важливе, ніж надійність.
У схемі RAID 0 призначені для користувача і системні дані розподіляються по всіх дисках масиву. Це дає помітну перевагу перед використовуванням одного великого диска: якщо два різні запити вводу-виводу звертаються до двох різних блоків даних, то є чимала вірогідність того, що ці блоки розміщені на різних дисках, і два запити можуть бути оброблені, зменшуючи тим самим час очікування в черзі вводу-виводу.
Помітимо, про те, що RAID 0 йде далі за простий розподіл даних по масиву дисків: дані розщеплені (stripped) по всіх наявних дисках (рис. 3). Всі призначені для користувача і системні дані розглядаються як дані, що зберігаються на одному логічному диску. Диск ділиться на смуги, які можуть бути фізичними блоками, секторами або іншими одиницями зберігання. Смуги циклічно розміщуються на послідовних дисках масиву. У n-дисковому масиві перші n логічних смуг фізично розташовуються як перші смуги кожного з n дисків; другі n смуг розташовуються як другі смуги кожного з дисків і т.д. Перевага такої компоновки полягає у тому, що якщо один запит вводу-виводу звертається до безлічі логічно послідовних смуг, то паралельно може бути оброблено до n смуг, і набагато зменшується тим самим час обробки запиту.
На рис. 3. показано, що для відображення логічного і фізичного дискових просторів використовується відповідне програмне забезпечення, яке може бути реалізоване як в дисковій підсистемі, так і в комп'ютері.
Рис. 3_ Розміщення даних в масиві RAID 0
2.2 RAID 1
RAID 1 відрізняється від RAID 2-RAID 6 способом досягнення надмірності. У всій решті RAID-схем використовується який-небудь спосіб обчислень, тоді як в RAID 1 надмірність досягається простим дублюванням всіх даних. В цій схемі використовується те ж розщеплювання даних, що і в RAID 0, але кожна логічна смуга розміщується на двох різних фізичних дисках, так що для кожного диска масиву є дзеркальний диск, що містить точно такі ж дані.
RAID 1 володіє наступними позитивними характеристиками.
а)Запит на читання може бути обслужений будь-яким з двох дисків, що містять необхідні дані; для обслуговування вибирається той диск, у якогомінімальний час пошуку.
б) Для запиту на запис необхідне оновлення обох смуг, що може бути виконане в паралельному режимі. Тому швидкість запису визначаєтьсяповільнішою з них (тобто тієї, для якої час пошуку виявляється великим). Проте ніяких додаткових витрат на запис при застосуванні RAID 1 не вимагається. На рівнях з другого по шостий операція запису вимагає обчислення контрольних бітів.
в). Простота відновлення даних у разі збою — при збої одного диска дані можуть бути доступні з другого.
Принциповою негативною характеристикою RAID 1 є вартість, пов'язана з необхідністю подвійного дискового простору для логічного диска. З цієї причини використовування RAID 1 обмежене дисками з системним програмним забезпеченням і даними, а також іншими дуже важливими файлами. У цих випадках RAID 1 забезпечує створення резервних копій всіх файлів в режимі реального часу, так що у разі аварійної ситуації на диску всі критичні дані можуть бути негайно витягнуті.
У середовищі, орієнтованому на транзакції, RAID 1 може досягти високої частоти запитів вводу-виводу, якщо основна маса запитів — на читання диска. У цій ситуації продуктивність RAID 1 може наблизитися до подвійної продуктивності RAID 0. Проте якщо велика частина запитів — на запис, істотного підвищення продуктивності в порівнянні з RAID 0 досягти не вдасться. RAID 1 може також забезпечити підвищену продуктивність для додатків з інтенсивним зчитуванням з диска.
2.3 RAID 2
Рівні 2 і 3 використовують технологію паралельного доступу. У такому масиві