МІНІСТЕРСТВО ОСВІТИ, НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИНАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА»
ІНСТИТУТ КОМП’ЮТЕРНОЇ ТЕХНІКИ АВТОМАТИКИ ТА МЕТРОЛОГІЇ
ЗВІТ ЛАБОРАТОРНОЇ РОБОТИ №1
З ПРЕДМЕТУ: «Архітектура комп’ютерів. Частина 2»
ТЕМА: «Робота з симулятором DLX.
Дослідження виконання асемблерної програми симулятором.»
Львів – 2013
Мета роботи: опанування технології обробки потоку інструкцій конвеєром універсальних процесорів (на прикладі обробки програми додавання трьох чисел) та отримання навичок з кількісного оцінювання ефективності мікроархітектур цих процесорів; опанування навичок з самостійного планування експерименту та розв'язування інженерних задач, що виникають при подальшому оцінюванні ефективності запропонованих та втілених пропозицій за відповідними критеріями.
Завдання: Скласти асемблерну програму для обчислення виразу А/2+В. Дослідити виконання цієї програми симулятором DLX. Пояснити та проаналізувати інформацію, отриману в результаті виконання обчислень за програмою.
Варіант 18 А/2+В
Складання програми
Нехай дві змінні А та В містяться у головній пам’яті за наступними адресами та набувають наступних значень:
Змінна
Адреса
Вмістиме
А
0х0
0х10
В
0х4
0х5
Результат дорівнює 0х10/ 0х2 + 0х5 = 0х10. Результат має замістити операнд за адресою 0х8. Зараз текст асемблерної програми має такий вигляд:
.data 0x0
.word 10
.word 5
.word 0
.text
lw r2,0x0(r1)
srl r2,r2,1
lw r3,0x4(r1)
add r12,r2,r3
sw 0x8(r1),r12
trap 0
Інструкцією trap #0 завершують усі програми у випадку відсутності в системі додаткових програмних засобів моніторингу та системного керування.
Симулювання базисної програми
На рис. 1 подано зафіксований стан симулятора на момент завершення виконання програми. Асемблерну програму, подану вище, було запущено та пройдено по етапах симулятором DLX. ЇЇ виконання було припинено інструкцією trap #0, яка надіслала модальне повідомлення “Trap #0 occurred!”, згашене щиглем миші.
Рис. 1. Протокол роботи конвеєра
Усього опрацьовано повних 6 інструкцій. На перші 5 інструкцій витрачено 11 циклів замість теоретично очікуваних 10-ти циклів. При цьому на виконання 2-ї, 3-ї, 4-ї та 5-ї інструкцій витрачено по шість циклів на кожну замість очікуваних п’яти. Це пояснюється затримкою конвеєра (R-stall, що додана в інструкції 2 та 4) через RAW-залежність даних поміж інструкціями 1 та 2, 3 та 4, і автоматично спричиненою цим затримкою (stall, що додана в інструкції 3 та 5) на відповідний один цикл інструкцій 3 та 5.
Чітко видно випереджувальне пересилання даних до виконавчої сходинки інструкції додавання, що позначено стрілами. Тут дані надсилають не з регістрового файла, а з відповідних полів конвеєрних регістрів.
На рис.2 показано вікно комірок головної пам’яті. На адресою 0х0 міститься перше значення 10, 0х4 міститься друге значення 5, 0х8 міститься результат 10.
Рис. 2. Протокол вмістимого комірок головної пам’яті
Рис. 3 містить протокол статистик, отриманих під час опрацювання програми. Характеристики цього протоколу визначено з врахуванням загалом 12-ти витрачених циклів.
Рис.3. Протокол статистик
Експериментальна частина
Скоректувала асемблерний код програми за правилами статичного планування, що реально виконує автоматично оптимізуючий компілятор уведенням інструкції nop щоб розв'язати (скасувати залежності даних). Тоді отримала наступний текст програми:
.data 0x0
.word 10
.word 5
.word 0
.text
lw r2,0x0(r1)
nop
srl r2,r2,1
lw r3,0x4(r1)
nop
add r12,r2,r3
sw 0x8(r1),r12
trap 0
Протокол роботи конвеєра подано рисунком 4. В цій програмі, як можна побачити є 8 інструкцій.
Рис. 4. Протокол роботи конвеєра для експериментальної програми із статичним плануванням
Бачимо, що пригальмування зникли. Зрозуміло, що мої пропозиції щодо усунення залежностей даних в спосіб статичної диспетчеризації підтверджено.
Рис. 5 містить протокол статистик для експериментальної частини, отриманих під час опрацювання програми.
Рис. 5. Протокол статистик для експериментальної програми із статичним плануванням
Висновки
А. Існування притаманих програмі залежностей даних спричинило виникнення залежності RAW, яку автоматично визначила та в спосіб затримки на один цикл знищила апаратна частина машини. При цьому втрата швидкодії склала 2 – 11/10 = - 90 %.
В. Можливе скасування залежності даних уведенням інструкції nop після першої та четвертої інструкції програми, що відповідає не динамічному, а статичному плануванню процесу виконання програми. Введення цієї інструкції скасувало залежності даних та підвищило швидкодію.