Національний університет “Львівська Політехніка”
Кафедра “Електронні обчислювальні машини”
КУРСОВИЙ ПРОЕКТ
на тему: „Розробка та реалізація компонент системного
програмного забезпечення”
Львів 2005
Анотація
В курсовому проекті розроблено компілятор з простої мови програмування .
Компілятор розроблений в середовищі програмування Borland C/C++ на мові С, та поданий у пояснювальній записці, а також в електронному варіанті. В пояснювальній записці подано огляд існуючих методів розробки компіляторів, детальний опис мови, а також описано процес розробки програми компілятора на рівні блок-схем ексту програми. В додатку міститься текст компілятора, а також результати тестування програми.
Завдання на курсовий проект
Розробити транслятор заданої вхідної мови програмування, до якої висуваються наступні базові вимоги :
Кожна програма починається зі слова start і закінчується словом stop. Все що до start і після stop не аналізується. Наприклад як у мові Паскаль begin end.
Програма має надавати можливість працювати зі змінними. Змінні перед використанням мають бути попередньо оголошені за наступним форматом: “тип даних” “змінна1”, “змінна2”; Наприклад int x,y;
Присвоєння до змінних виконується оператором присвоєння :=. Наприклад x:=y+5;
Програма має надавати можливість працювати з константами. Константи ініціюються наступним чином: “константа” = “число;”. Наприклад а=3;
Ввід даних зі стандартного вводу відбувається оператором input(), а вивід оператором output(). Наприклад input(x); output (y).
Програма має працювати з типом даних char, int.
Програма має виконувати операції ,&,~,>
Програма має надавати можливість використовувати оператор case (Pascal)
Програма має надавати можливість працювати з масивами.
Вихідною мовою трансляції є мова С.
Математичний вираз має бути розібраний в залежності від пріоритету виконання та розписаний викликом власних С функцій.
Цільова мова компілятора: ANSI C. Для отримання виконавчого файлу на виході розробленого компілятора скористатися програмою bcc.exe. Мова розробки компілятора: ANSI C. Реалізувати інтерфейс командного рядка. На вхід розробленого компілятора має подаватися текстовий файл, написаний на заданій мові програмування. На виході розробленого компілятора мають з’являтися чотири файли: файл з повідомленнями про помилки (або про їх відсутність), файл на мові СІ, об’єктний та виконавчий файли.
Назва вхідної мови програмування утворюється від першої букви у прізвищі студента та номеру його варіанту. Саме таке розширення повинні мати текстові файли, написані на цій мові програмування.
Зміст
Анотація……………………………………………………………………….……………..2
Завдання на курсовий проект....................................................................................3
Формальний опис вхідної мови програмування.......................................................5
Розробка компілятора вхідної мови програмування...............................................7
Формальний опис вхідної мови програмування.................................................7
2.1.1Повне дерево граматичного розбору………………………….………………….9
Розробка лексичного аналізатора....................................................................11
Розробка синтаксичного аналізатора...............................................................13
Розробка генератора коду.................................................................................15
Відладка та тестування компілятора......................................................................16
Висновки...................................................................................................................17
Література.................................................................................................................18
Додаток А. Текст програми………………………………………………..……..................19
Додаток Б. Тестові програми ........................................................................................31
Аналітичний розділ
Компілятор – програма, яка зчитує текст програми, що написана на одній мові –вхідній, і транслює (переводить) його в еквівалентний текст на іншій мові –
цільовій. Процес компіляціі складається з двох частин: аналізу та синтезу.
Аналіз – це розбиття вхідної програми на складові частини та створення її проміжного представлення. Синтез – це процес конструювання потрібної цільової програми із проміжного представлення. Стосовно компіляції аналіз поділяють на три фази – лінійного, ієрархічного та семантичного аналізу.
Під час лінійного аналізу потік символів вхідної програми зчитується зліва направо і групується у токени (token) – послідовності символів із певним спільним значенням. Тобто токеном є сукупність символів із певним логічним значенням. Сукупність символів, що формує токен – це лексема.
Фаза ієрархічного аналізу передбачає процес, коли символи чи токени ієрархічно групуються у вкладені конструкції із спільним значенням.
Семантичний аналіз – перевіряє коректність спільного розташування компонентів програми. Лінійний аналіз – це, власне, і є лексичний аналіз або сканування. Лексичний аналізатор – це, відповідно, програма, котра втілює принципи такого лінійного аналізу. Для прикладу розглянемо таку конструкцію:
point = init + var * 23
Отримавши таку інструкцію лексичний аналізатор згрупує наступні послідовності символів, токени:
1. ідентифікатор point.
2. символ присвоєння =.
3. ідентифікатор init.
4. знак додавання.
5. ідентифікатор var.
6. знак множення.
7. число 23.
Пробіли, що розділяють токени, зазвичай ігноруються.
Коротко роботу лексичного аналізатора можна описати так: аналізатор зчитує символи із вхідного потоку, групує їх в лексеми та передає токени, які створені цими лексемами, разом з їх атрибутами синтаксичному аналізатору.
Стосовно методів лексичний анлізатор можна поділити на прямий а непрямий лексичний аналізатор. Непрямий лексичний аналіз полягає у послідовній перевірці лексем на відповідність токенам. Якщо аналізатор не „впізнає” в поточній лексемі один з токенів, то відбувається повернення у потоці вхідних символів і здійснюється перевірка на відповідність наступному токену. А прямий лексичний аналіз дозволяє визначити відповідний токен без повернення в потоці вхідних символів.
Непрямий лексичний аналізатор як програма на мові високого рівня складається із окремих функцій, кожна з яких розпізнає лише одну лексему.
Такі функції мають схожу структуру та відрізняються, в основному, тільки лексемою, що потрібна для порівняння із вхідною. Функції викликаються в певному порядку, що визначається перевагою в аналізі одних лексем перед іншими. Наявність приорітету пояснються тим, що деякі лексеми мають подібні початкові символи і деякі лексеми можуть складатися із простіших лексем.
Прямий лексичний аналізатор як програма складається із функцій, що розпізнають окремі лексеми. Така програма зчитує один вхідний символ на кожному кроці і передає його функції, яка може розпізнати лексему чи сформувати помилку. Для лексем, що мають подібні послідовності символів, існують функції, які розпізнають саме ці послідовності. В цих функціях реалізовані інші функції, що розпізнають решту символів у лексемах. Повідомлення про помилку може бути згенеровано тоді, коли не знайдено відповідної послідовності символів.
2. Розробка компілятора вхідної мови програмування
2.1. Формальний опис вхідної мови програмування
Одною з перших задач, що виникають при побудові компілятора, є визначення вхідної мови програмування. Для цього я використовую розширену нотацію Бекуса-Наура (Backus/Naur Form - BNF).
Перелік термінальних символів та ключових слів
{ } ;
: = + & ~ > ( ) [
]
“
start
stop
.
char
int
input
output
case
of
0..9
a..z,A..Z, ’ ‘
23+10+52+1=86 термінальних символів.
Приорітет операторів: 1. &
~
>
В проекті потрібно реалізувати оператор case(), а саме, його форму із мови Pascal :
case <expr> of
const_list1: <stmt>
const_list2: begin
<stmt>
<stmt>
end;
end;
Формальний опис вхідної мови в термінах BNF.
Правила написання правил у розширеній нотації Бекуса-Наура:
нетермінальні вирази записуються у кутових дужках: “<”, “>” ;
термінальні вирази записуються жирним шрифтом або у подвійних лапках;
усі нетермінальні вирази мають бути “розкриті” за допомогою термінальних;
сивол “::=” відділяє праву частину правила від лівої;
символ “|” розділяє альтернативи;
сиволи “[”, “]” означають необов’язковість (вираз в дужках може бути відсутнім);
сиволи “{”, “}” означають повторення.
<program> ::= “start” [{<block>}] “stop” ”.”
<block> ::= <stmt> | “start” [{<block>}] [{<stmt>}] “stop”
<stmt> ::= <declaration> | <const> | <operator>
<declaration> ::= <iddecl> | <ardecl>
<iddecl> ::= <type> <id> [ {“,” <id>} ] ”;”
<ardecl> ::= <type> <id> ”[“ <num> ”]” ”;”
<const> ::= <id> “=” <num> “;”
<operator> ::= <bind> | <inop> | <outop> | <caseop>
<bind> ::= <id> “:” “=” <expr> “;” | <id>”[”<expr>”]” “:” “=” <expr> “;”
<inop> ::= “input” “(“ <expr> “)” “;”
<outop> ::= “output” “(“ [“ “ ”]<expr>[“ “ ”] “)” “;”
<caseop> ::= “case” “(“ <expr> “)” “of” <num> “:” <block> [{<num> ”:” <block>}]
<type> ::= “char” | “int”
<id> ::= <letter>[{<letter>|<number>}]
<num> ::= <number>[{<number>}]
<letter> ::= a|b|c|d|e|f|g|h|i|j|k|l|n|m|o|p|q|r|s|t|u|v|w|x|y|z| A|B|C|D|E|F|G|H|I|J|K|L|N|M|O|P|Q|R|S|T|U|V|W|X|Y|Z
<number> ::= 0|1|2|3|4|5|6|7|8|9
<expr> ::= <operand> [{<op> <operand>}]
<operand> ::=”(”<expr>“)” | <num> | <id> [”[”<expr>”]”]
<op> ::= <grt>
<grt> ::= <inv> | ”>”
<inv> ::= <log> | “~”
<log> ::= “&” | “+” | [<op>]
Формальний опис складено за допомогою 23-ох нетермінальних виразів.
Повне дерево граматичного розбору
Повне дерево граматичного розбору
2.2. Розробка лексичного аналізатора
Основна задача лексичного аналізу – розбити вихідний текст, що складається з послідовності одиночних символів, на послідовність слів, або лексем, тобто виділити ці слова з безперервної послідовності символів. Всі символи вхідної послідовності з цієї точки зору розділяються на символи, що належать яким-небудь лексемам, і символи, що розділяють лексеми. В цьому випадку використовуються звичайнi засоби обробки рядків. Вхiдна програма проглядається послiдовно з початку до кінця. Базовi елементи, або лексичнi одиницi, роздiляються пробiлами, знаками операцiй i спецiальними символами (новий рядок, знак табуляції), i таким чином видiляються та розпізнаються iдентифiкатори, лiтерали i термiнальнi символи (операцiї, ключові слова).
При виділенні лексеми вона розпізнається та записується у таблицю лексем за допомогою відповідного номера лексеми, що є унікальним для кожної лексеми із усього можливого їх набору. Це дає можливість наступним фазам компiляції звертатись лексеми не як до послідовності символів, а як до унікального номера лексеми, що значно спрощує роботу синтаксичного аналізатора: легко перевіряти належність лексеми до відповідної синтаксичної конструкції та є можливість легкого перегляду програми, як вгору, так і вниз, від текучої позиції аналізу. Також в таблиці лексем ведуться записи, щодо рядка відповідної лексеми – для місця помилки – та додаткова інформація.
При лексичному аналiзі виявляються i вiдзначаються лексичнi помилки (наприклад, недопустимi символи i неправильнi iдентифiкатори). Лексична фаза вiдкидає також i коментарi, оскiльки вони не мають нiякого впливу на виконання програми, отже ж й на синтаксичний розбір та генерацію коду.
Лексичний аналізатор (сканер) не обов’язково обробляє всю програму до початку всіх інших фаз. Якщо лексичний аналіз не виділяється як окрема фаза компіляції, а є частиною синтаксичного аналізу, то лексична обробка тексту програми виконується по мірі необхідності по запиту синтаксичного аналізатора.
Блок-схема лексичного аналізатора
2.3. Розробка синтаксичного аналізатора
Синтаксичний аналіз – це процес, в якому досліджується послідовність лексем, яку повернув лексичний аналізатор, і визначається, чи відповідає вона структурним умовам, що сформульовані у визначені синтаксису мови.
Синтаксичний аналізатор – це частина компілятора, яка відповідає за виявлення основних синтаксичних конструкцій вхідної мови. В задачу синтаксичного аналізатора входить: знайти та виділити основні синтаксичні конструкції мови в послідовності лексем програми, встановити тип та правильність побудови кожної синтаксичної конструкції і представити синтаксичні конструкції у вигляді, зручному для подальшої генерації тексту результуючої програми. Як правило, синтаксичні конструкції мови програмування можуть бути описані за допомогою контекстно-вільних граматик. Розпізнавач дає відповідь на питання, належить чи ні, ланцюжок вхідних лексем заданій мові. Але, задача синтаксичного аналізу, не обмежується тільки такою перевіркою. Синтаксичний аналізатор повинен мати, деяку результуючу мову, за допомогою якої він передає наступним фазам компіляції, інформацію про знайдені і розібрані синтаксичні конструкції, якщо відокремлюється фаза генерації об’єктного коду.
2.3.1 Блок-схема синтаксичного аналізатора
2.4. Розробка генератора коду
Вихідною мовою компілятора є мова високого рівня С. Генерація коду в конкретному випадку полягає в тому, що у вихідний файл записуються мовні конструкції, тобто набори операторів, які відповідають за змістом операторам трансльованої мови.
Наприклад, у вхідному файлі маємо конструкцію:
start
int a;
a:=10;
output(a);
stop.
В такому випадку генератор сформує наступну послідовність операторів:
#include <iostream.h>
void main()
{
int a;
a=10;
cout<<(a);
}
Цей приклад показує найпростіший варіант генерації вихідного коду.
Оскільки, це ще не машинний код, потрібно викликати компілятор мови С для запуску написаної програми.
3. Реалізація, відладка та тестування компілятора
При відладці та при тестуванні виникли деякі труднощі, пов’язані з типами змінних.
start
int a;
input(a);
case(a)of
10: output(1234);
20: start
a:=23;
output(a);
stop
stop.
------------------------
succesful..
4. Висновок
При виконанні курсового проекту, я ознайомився з принципами роботи компіляторів, їх структурою а також різними методами їх реалізації. Розроблений компілятор для мови програмування S7 задовільняє вимогам, згаданим у завданні. Компілятор реалізовано із генерацію коду у вигляді програми на мові СІ.
5.Список літератури
1. Страуструп Б. Введение в язык C++, 1985.
2. Джордейн Р. Справочник программиста ПК IBM PC, XT/AT. - – М.: ФиС, 1992.3. Абель П. Ассемблер для IBM PC, 1991.
4. Прата С. Язык программирования Си, 2003
Додаток А. Текст програми
//---------------------------------------[ pack.h ]----------------------------------------------------
#include <stdio.h>
#include <conio.h>
#include <stdlib.h>
typedef struct {
char *lexptr;
int token;
int line;
int type;
} rec;
extern rec symtab[];
extern rec idtab[];
extern FILE *source, *symfile, *idfile, *error, *tree, *prod;
extern int pos;
extern char str[];
extern int strnum;
extern char *resword[];
extern int index;
extern int index2;
extern int numval;
extern char *lex;
extern void err(int ekod);
//---------------------------------------[ scan.c ]----------------------------------------------------
#include "s7pack.h"
#include <stdio.h>
#include <conio.h>
#include <alloc.h>
#include <ctype.h>
#include <string.h>
#include <stdlib.h>
//int scan(void);
rec symtab[350];
rec idtab[60];
FILE *symfile, *idfile;
int pos;
char str[256];
int strnum=0;
char *resword[23]={"start","stop","char","int",
"input","output","case",
"of","const","[","]",".",",",":",";",
"(",")","&","~",">","+",
"\"","=" };
int index=1;
int index2=1;
int numval;
char *lex="\0";
int isreserv(char *lex)
{
int i;
for(i=0;i<23;i++)
if(strcmp(lex,resword[i])==0) return i+260;
return 0;
}
void getstr(void)
{
do
{
if(feof(source))return;
fgets(str,256,source);
strnum++;
} while(str[0]=='\n');
pos=0;
}
void setpos(void)
{
while((isspace(str[pos])) || (!str[pos]))
if((str[pos]=='\n') || (!str[pos])) getstr();
else pos++;
}
int insert(char *lex, int tok, int snum, int mode)
{
if(mode==1)
{
symtab[index].lexptr=(char*)malloc(strlen(lex)+1);
strcpy(symtab[index].lexptr,lex);
symtab[index].token=tok;
symtab[index].line=snum;
index++;
return index;
}
if(mode==2)
{
idtab[index2].lexptr=(char*)malloc(strlen(lex)+1);
strcpy(idtab[index2].lexptr,lex);
idtab[index2].token=tok;
idtab[index2].line=snum;
symtab[index]=idtab[index2];
index++;
index2++;
return index2;
}
return 0;
}
int lookup(char *lex, int mode)
{
int i;
if(mode==0)
{
for(i=index;i>0;i--)
if(strcmp(lex,symtab[i].lexptr)==0) return i;
}
if(mode==1)
{
for(i=index2;i>0;i--)
if(strcmp(lex,idtab[i].lexptr)==0) return i;
}
return 0;
}
int istoken(void)
{
int ch=str[pos];
if(((ch>='A')&&(ch<='Z')) || ((ch>='a')&&(ch<='z'))) return 1;
if((ch>='0')&&(ch<='9')) return 2;
if((ch=='(')||(ch==')')) return 3;
if((ch=='=')||(ch==':')||(ch==';')||(ch==',')||(ch=='.')||(ch=='[')||(ch==']')||(ch=='\"')) return 4;
if((ch=='+')||(ch=='&')) return 5;
if(ch=='~') return 6;
if(ch=='>') return 7;
if(ch!=' '&& ch!='\n'&& ch!='\t') err(17);
return -1;
}
int id(void)
{
int p=0,cond;
if(istoken()==1)
{
lex[p]=str[pos];
p++;
pos++;
while( (cond=istoken())==1 || cond==2)
{
lex[p]=str[pos];
pos++;p++;
}
lex[p]='\0';
return 1;
}
return 0;
}
int num(void)
{
int p=0;
numval=0;
while(istoken()==2)
{
lex[p]=str[pos];
numval=numval*10+str[pos]-'0';
pos++;
p++;
}
lex[p]='\0';
if(p==0) return 0;
return 1;
}
int sign(void)
{
int p=0;
if(istoken()>2)
{
lex[p]=str[pos]; //бЄ®Їiоў вЁ ©®Ј®
pos++;
p++;
lex[p]='\0';
return 1;
}
return 0;
}
int scan(void)
{
int i,v,idmarker=300,numarker=700;
clrscr();
if((symfile=fopen("symf.dat","w+"))==NULL)
{
printf("error: create file symfile.txt\n");
fclose(source);
return 1;
}
if((idfile=fopen("idf.dat","w+"))==NULL)
{
printf("error: create file idfile.txt\n");
fclose(source);
fclose(symfile);
return 1;
}
if((error=fopen("error.txt","w+"))==NULL)
{
printf("error: open file error.txt\n");
fclose(source);
fclose(symfile);
fclose(idfile);
return 1;
}
while((strcmp("start",lex)!=0) && !feof(source))
{
setpos();
id();
}
insert(lex,260,strnum,1);
setpos();
while(!feof(source))
{
if(id())
{
if(v=isreserv(lex)) insert(lex,v,strnum,1);
else if((v=lookup(lex,1))==0) insert(lex,idmarker++,strnum,2);
else
{
symtab[index]=idtab[v];
symtab[index].line=strnum;
index++;
}
setpos();
}
if(num())
{
if((v=lookup(lex,1))==0) insert(lex,numarker++,strnum,2);
else
{
symtab[index]=idtab[v];
symtab[index].line=strnum;
index++;
}
setpos();
}
if(sign())
{
if((isreserv(lex)) && (!lookup(lex,1))) insert(lex,lex[0],strnum,1);
setpos();
}
if(strcmp(".",lex)==0) break;
}
printf("\n\t----------symtab---------"); for(i=1;i<index;i++)
{
printf("\n %d) \tlex: \t%s\ttoken: %d\tline: %d",i,symtab[i].lexptr,symtab[i].token,symtab[i].line);
fprintf(symfile,"\n %d) \tlex: \t%s\ttoken: %d\tline: %d",i,symtab[i].lexptr,symtab[i].token,symtab[i].line);
}
printf("\n\n\t----------idtab---------"); for(i=1;i<index2;i++)
{
printf("\n %d) \tlex: \t%s\tatrib: %d\tline: %d",i,idtab[i].lexptr,idtab[i].token,idtab[i].line);
fprintf(idfile,"\n %d) \tlex: \t%s\tatrib: %d\tline: %d",i,idtab[i].lexptr,idtab[i].token,idtab[i].line);
}
index--;
getch();
return 0;
}
//---------------------------------------[ parc.c ]----------------------------------------------------
#include "s7pack.h"
#include <stdio.h>
#include <conio.h>
#include <string.h>
#include <stdlib.h>
FILE *error, *tree, *prod;
int gen(int ,char*);
void err(int ekod);
int expr();
int block();
int oper();
int operand();
int grt();
int op();
int at=0;
int idtype=0;
struct {
char *lex;
int type;
} dec[20];
//---------------------[semantic interpretation]------------------------------
//----------------------------------------------------------------------------
int link(char *lex, int type)
{
dec[at].lex=lex;
dec[at].type=type;
at++;
return at<20;
}
int check(char *lex)
{
int i;
for(i=0;i<at;i++)
if(strcmp(lex,dec[i].lex)==0) return dec[i].type;
return 10;
}
//------------------------------------------------------------------------
int log()//[ & + ]--------------------------------------------------------
{
if(symtab[++index].token==38) gen(21,"");
else if(symtab[index].token==43) gen(20,"");
else{--index; return 0;}
return 1;
}
int inv()//[ ~ ]---------------------------------------------------------
{
if(log())
if(!operand()) err(192);
if(symtab[++index].token!=126) {--index; return 0;}
gen(19,"");
if(log())
if(!operand()) err(14);
return 1;
}
int grt()//[ > ]--------------------------------------------------------
{
if(inv())
if(!operand()) err(14);
if(symtab[++index].token!=62) {--index; return 0;}
gen(18,"");
if(inv())
if(!operand()) err(14);
return 1;
}
int op()//mathematical expression------------------------------------------
{
if(grt()) return 1;
return 0;
}
int operand()//------------------------------------------------------------
{
if(symtab[++index].token==40) // (
{
gen(15,"");
if(expr()) // <expr>
if(symtab[++index].token==41) // )
{
gen(16,"");
return 1;
}
}
if(symtab[index].token>=700) // <num>
{
gen(5,symtab[index].lexptr);
return 1;
}
if(symtab[index].token>=300||symtab[index].token<700 )// <id>
{
gen(5,symtab[index].lexptr);
if(symtab[index-1].token!=34)
if(check(symtab[index].lexptr)>4) err(15);
}
else err(4);
if(symtab[++index].token!=91) // [
{
--index;
return 1;
}
gen(8,"");
if(!expr())
err(10); // <expr>
if(symtab[++index].token!=93) err(6); // ]
{
gen(9,"");
return 1;
}
}
int expr()//---------------------------------------------------------------
{
if(!operand()) return 0; // operand
if(!op()) return 1; // op
if(!operand()) err(14); // operand
return 1;
}
int type()//---------------------------------------------------------------
{
if(symtab[++index].token==262) // char
{
idtype=1;
gen(4,"");
return 1;
}
if(symtab[index].token==263) // int
{
idtype=2;
gen(3,"");
return 1;
}
--index;
return 0;
}
int caseop()//-------------------------------------------------------------
{
if(symtab[++index].token!=266) {--index; return 0;} // case
gen(22,"");
if(symtab[++index].token!=40) err(7); // (
gen(15,"");
if(!expr()) err(10); // <expr>
if(symtab[++index].token!=41) err(8); // )
gen(16,"");
if(symtab[++index].token!=267) err(12); // of
gen(1,"");
if(symtab[++index].token<700) err(13); // <num>
gen(23,"");
gen(5,symtab[index].lexptr);
if(symtab[++index].token!=58) err(11); // :
gen(11,"");
if(!block())
err(33); // block
gen(24,"");
if(symtab[++index].token<700) {--index; return 1 ;} //[{<num>
gen(23,"");
gen(5,symtab[index].lexptr);
if(symtab[++index].token!=58) err(11); // :
gen(11,"");
if(!block())
err(1); // block}]
gen(24,"");
gen(2,"");
return 1;
}
int outop()//--------------------------------------------------------------
{
if(symtab[++index].token!=265) {--index; return 0;} // output
if(symtab[++index].token!=40) err(7); // (
gen(13,"");
gen(15,"");
if(symtab[++index].token==34) gen(14,"");
else --index;
if(!expr())
err(10); // <expr>
if(symtab[++index].token==34) gen(14,"");
else --index;
if(symtab[++index].token!=41) err(8); // )
if(symtab[++index].token!=59) err(3); // ;
gen(16,"");
gen(7,"");
return 1;
}
int inop()//---------------------------------------------------------------
{
if(symtab[++index].token!=264) {--index; return 0;} // input
if(symtab[++index].token!=40) err(7); // (
gen(12,"");
if(!expr())
err(10); // <expr>
if(symtab[++index].token!=41) err(8); // )
if(symtab[++index].token!=59) err(3); // ;
gen(7,"");
return 1;
}
int bind()//---------------------------------------------------------------
{
int k=0;
if(symtab[++index].token<300 ||
symtab[index].token>=700 ) {--index; return 0;} // <id>
gen(5,symtab[index].lexptr);
if(check(symtab[index].lexptr)>4) err(15);
if(symtab[++index].token!=91) // [
{
--index;
if((k=check(symtab[index].lexptr))!=1 && k!=2) err(16);
}
else
{
if((k=check(symtab[index-1].lexptr))!=3 && k!=4) err(16);
gen(8,"");
if(!expr())
err(10); // <expr>
if(symtab[++index].token!=93) err(6); // ]
gen(9,"");
}
if(symtab[++index].token!=58) {index-=3; return 0;} // :
if(symtab[++index].token!=61) err(9); // =
gen(10,"");
if(!expr()) err(10); // <expr>
if(symtab[++index].token!=59) err(3); // ;
gen(7,"");
return 1;
}
int oper()//---------------------------------------------------------------
{
if(bind() || inop() || outop() || caseop()) return 1;
return 0;
}
int cons()//---------------------------------------------------------------
{
if(symtab[++index].token<300 ||
symtab[index].token>=700 ) {--index; return 0;} // <id>
if(symtab[++index].token!=61) {index-=2; return 0;} // =
gen(17,"");
gen(5,symtab[index-1].lexptr);
link(symtab[index-1].lexptr,5);
gen(10,"");
if(symtab[++index].token<700) err(13); // num
gen(5,symtab[index].lexptr);
if(symtab[++index].token!=59) err(3); // ;
gen(7,"");
return 1;
}
int ardecl()//-------------------------------------------------------------
{
int flag=0;
if(symtab[++index].token==262) idtype=flag=3; // char
if(symtab[index].token==263) idtype=flag=4; // int
if (!flag){--index; return 0;}
if(symtab[++index].token<300 ||
symtab[index].token>=700 ) err(4); // <id>
if(symtab[++index].token!=91) {index-=3; return 0;} // [
if(flag==3) gen(4,"");
else gen(3,"");
gen(5,symtab[index-1].lexptr);
link(symtab[index-1].lexptr,idtype);
gen(8,"");
if(symtab[++index].token<700) err(9); // num
gen(5,symtab[index].lexptr);
if(symtab[++index].token!=93) err(6); // ]
gen(9,"");
if(symtab[++index].token!=59) err(3); // ;
gen(7,"");
return 1;
}
int iddecl()//---------------------------------------------------------------
{
if(!type()) return 0; // type
if(symtab[++index].token<300 ||
symtab[index].token>=700 ) err(4);
gen(5,symtab[index].lexptr); // <id>
link(symtab[index].lexptr,idtype);
while(1)
{
if(symtab[++index].token!=44) {--index; break;} // ,
gen(6,"");
if(symtab[++index].token<300 ||
symtab[index].token>=700 ) err(4);
gen(5,symtab[index].lexptr); // <id>
link(symtab[index].lexptr,idtype);
}
if(symtab[++index].token!=59) {index-=3; return 0;} // ;
gen(7,"");
return 1;
}
int decl()//---------------------------------------------------------------
{
if(ardecl() || iddecl()) return 1;
return 0;
}
int stmt()//---------------------------------------------------------------
{
if(decl() || cons() || oper()) return 1;
return 0;
}
int block()//---------------------------------------------------------------
{
int t=0;
if(stmt()) return 1; // <stmt>
if(symtab[++index].token!=260) {--index; return 0;} gen(1,""); // start
t=0; do{t=block();} while(t); // [{<block>}] // [{<block>}]
t=0; do{t=stmt();} while(t); // [{<stmt>}]
if(symtab[++index].token!=261) err(2); gen(2,""); // stop
return 1;
}
int program()//---------------------------------------------------------------
{
int t=0;
if(symtab[++index].token!=260) err(1); gen(0,"");gen(1,"");// start
do{t=block();} while(t); // [{<block>}]
if(symtab[++index].token!=261) err(2); gen(2,""); // stop
if(symtab[++index].token!=46) err(3); // .
gen(25,"");
fprintf(error,"\n\tsuccesful..\n");
printf("\n\tprogram\n");
return 0;
}
int parcer(void)//---------------------------------------------------------------
{
int i;
index=0;
if((tree=fopen("tree.dat","w+"))==NULL)
{
printf("error: open file tree.txt\n");
fclose(error);
return 1;
}
if((prod=fopen("out.dat","w+"))==NULL)
{
printf("error: create file output.txt\n");
return 1;
}
printf("\n\nparcing now..\n");
program();
for(i=0;i<at;i++)
printf("\n\tlex: %s\ttype: %d",dec[i].lex,dec[i].type);
getch();
fclose(error);
fclose(tree);
fclose(prod);
return 0;
}
//------------------------------- error control-------------------------------
void err(int ekod)
{
char *strings[17]={ "'start' required", "'stop' required",
"';' required", "'id' required",
"'[' required", "']' required",
"'(' required", "')' required",
"':=' required", "'expr' required",
"':' required", "'of' required",
"'num' required", "..operator",
"not declared or const",
"type mismatch", "symbol not allowed"
};
if((error=fopen("error.txt","w+"))==NULL)
printf("error: open file error.txt\n");
if(ekod<17)
{
fprintf(error,"\n\tline: %d > %s",symtab[index].line, strings[ekod--]);
printf("\n\tline: %d > %s",symtab[index].line, strings[ekod]);
}
if(ekod==17)
{
fprintf(error,"\n\tline: %d > '%c' %s",strnum, str[pos], strings[ekod--]);
printf("\n\tline: %d > '%c' %s",strnum, str[pos], strings[ekod]);
}
fclose(error);
getch();
exit(1);
}
//---------------------------------------[ gen.c ]-----------------------------------------------------
#include "s7pack.h"
#include <stdio.h>
#include <conio.h>
#include <string.h>
#include <stdlib.h>
int gen(int skod,char *ch)
{
fprintf(tree,"%d\n",skod);
switch (skod)
{
case 0: fprintf(prod,"#include <iostream.h>\n\nvoid main()\n"); break;
case 1: fprintf(prod,"{\n"); break;
case 2: fprintf(prod,"}\n"); break;
case 3: fprintf(prod,"int "); break;
case 4: fprintf(prod,"char "); break;
case 5: fprintf(prod,"%s",ch); break;
case 6: fprintf(prod,","); break;
case 7: fprintf(prod,";\n"); break;
case 8: fprintf(prod,"["); break;
case 9: fprintf(prod,"]"); break;
case 10: fprintf(prod,"="); break;
case 11: fprintf(prod,":"); break;
case 12: fprintf(prod,"cin>>"); break;
case 13: fprintf(prod,"cout<<"); break;
case 14: fprintf(prod,"\""); break;
case 15: fprintf(prod,"("); break;
case 16: fprintf(prod,")"); break;
case 17: fprintf(prod,"const "); break;
case 18: fprintf(prod,">"); break;
case 19: fprintf(prod,"~"); break;
case 20: fprintf(prod,"^"); break;
case 21: fprintf(prod,"&"); break;
case 22: fprintf(prod,"switch"); break;
case 23: fprintf(prod,"case"); break;
case 24: fprintf(prod,"break;\n"); break;
}
return 0;
}
//---------------------------------------[ pack.h ]----------------------------------------------------
Додаток В. Тестові програми
start
$
int a;
input(a);
a:=a>23;
output(a);
stop.
-----------------------
line: 2 > ‘$’ symbol not allowed
-----------------------
start
int a;
input(a);
case(a)of
10 outpt(1234);
20: output(22);
stop.
---------------------------
line: 6 > ':' required
---------------------------
start
int a;
a[2]:=122;
output(a);
stop.
---------------------------
line: 5 > type mismatch
---------------------------
start
int a;
input(a);
case(a)of
10: output(1234);
20: start
a:=23;
output(a);
stop
stop.
------------------------
succesful..