Міністерство освіти і науки України
Національний університет „Львівська політехніка”
Кафедра електронних
обчислювальних машин
Звіт
про виконання лабораторної роботи № 4
з курсу „ Глобальні інформаційні мережі ”
Тема:
Система X Window і Web-броузер Netscape.
Пошуковий сервіс в Internet.
Львів – 2006
Мета роботи: Ознайомитися з призначенням і можливостями системи X Window та основними характеристиками середовища KDE, ознайомитися із Xтерміналом The eXceed X Server. Дослідити основні настройки конфігурації Webброузера Netscape, за допомогою нього ознайомитися із основними пошуковими сервісами Інтернет.
Теоретична частина
Призначення та можливості системи X Window.
Система X Window - це промисловий стандарт представлення графічної інформації і читання інформації з пристроїв графічного вводу і клавіатури в ОС UNIX.
X Window є великим, потужним і досить складним графічним середовищем для UNIX-систем. Система X Window була розроблена в Масачусетському технологічному інституті, і стала пізніше стандартом для всіх UNIX-систем. Практично кожна робоча станція UNIX в світі працює на одному з варіантів X Window.
Організація системи X Window дуже точно відповідає загальній ідеології ОС UNIX. UNIX - це традиційно мережева операційна система. Девіз Білла Джоя і усієї компанії Sun Microsystems "The Network is the Computer" - "Мережа - це комп'ютер" - в повній мірі відноситься до направлення ОС UNIX в цілому. Популярна архітектура організації програмно-апаратних засобів "клієнт-сервер" завжди була цілком природньою в світі UNIX. Спеціалізація та розділення функцій в мережі - це і означає, що для користувача комп'ютер та мережа нероздільні.
На цих ідеях і побудована система X Window. Оскільки ОС UNIX є інтерактивною операційною системою. то кожний працюючий в системі користувач взаємодіє із системою через наданий йому термінал (як правило, робочу станцію) і, в загальному випадку, викликає програми, які будуть виконуватись на інших комп'ютерах локальної або територіально розділеної мережі. Саме ці програми забезпечують інтерфейс з цим користувачем, тобто вони повинні мати можливість працювати з терміналом користувача незалежно від того, де вони виконуються. Більше того, щоби можливості графічного інтерфейсу цих програм задовольняли загальним вимогам, необхідно, щоби програми могли не піклуватись про такі деталі, як багатовіконна організація екрану, біжуче розташування вікон, керування мишою та ін.
Система X Window надає всі необхідні можливості. На боці користувацького терміналу знаходиться сервер системи X Window, який забезпечує одноманітне керування графічним терміналом, незалежно від його специфічних апаратних характеристик. В інших комп'ютерах мережи (які фактично є серверами з точки зору організації обчислювального процесу) встановлені клієнтські частини системи X Window, які створюють враження у виконуваної програми, що вона взаємодіє з локальним терміналом, а насправді підтримують точно специфікований протокол взаємодії з сервером системи X Window.
Клієнтська та серверна частини системи X Window, хоча в цілому відповідають ідеології архітектури "клієнт-сервер", володіють тією особливістю, що серверна частина системи знаходиться поблизу користувача (тобто основного клієнта обчислювальної мережі), а клієнтська частина системи базується на потужних серверах мережі. Система X Window володіє достатньою гнучкістю, щоби дозволити розташування серверної і клієнтської частин системи в одному комп'ютері, різних комп'ютерах однієї локальної мережі, і віддалених комп'ютерах, що входять в склад територіально розподіленої мережі. В залежності від конфігурації системи X-сервер може обслуговувати один або декілька графічних екранів, клавіатуру і мишу, реально являя собою процес, групу процесів або виділений комп'ютерний пристрій (X-термінал).
Для забезпечення потрібної гнучкості, взаємодія клієнтської та серверної частин системи X Window по мірі можливостей не повинні залежати від використованих мережевого середовища передачі даних та мережевих протоколів. Звичайно, повна незалежність - це недосяжна мета, але, що стосується системи X Window, вона дійсно може працювати в більшості розповсюджених мережевих середовищ (в тому числі, природньо, в стандартних ОС UNIX мережах, основаних на сімействі протоколів TCP/IP).
Основою взаємодії між клієнтом і сервером системи X Window є так званий X-протокол, що являє точну специфікацію допустимих запитів від клієнта до сервера і допустимих відповідей сервера клієнту. Як вказано в документації системи X Window, Х-протокол володіє наступними властивостями:
при використанні цього протоколу обробка взаємодії клієнта і сервера ведеться одноманітно, незалежно від того, базується вона на внутрішніх механізмах IPC (interprocess communication), чи на реальних мережевих обмінах; це дозволяє досягнути прозорості мережевого середовища як з точки зору кінцевого користувача, так і з точки зору розробника прикладних програм;
завдяки наявності суворої і незалежної від оточення специфікації X-протокол може бути реалізований на різних мовах в різних операційних середовищах;
X-протокол може бути реалізований на основі довільного надійно підтримуваного потоку байтів (що забезпечується внутрішніми механізмами IPC або зовнішніми мережевими механізмами); багато придатних механізмів є стандартними і реалізовані в більшості архітектур;
для більшості (хоча і не для всіх) аплікацій X-протокол не породжує суттєвих затримок при роботі з графічними терміналами; звичайно затримки викликаються скоріше часовими потребами самих терміналів, а не витратами на протокольні взаємодії клієнта і сервера.
Одним з клієнтів системи X Window звичайно є так званий "віконний менеджер" (window manager). Це спеціально виділений клієнт віконної системи, який володіє повноваженнями на керування розташуванням вікон на екрані терміналу. Деякі з можливостей X-протоколу (пов'язані, наприклад, з переміщенням вікон) доступні тільки клієнтам з повноваженнями віконного менеджера. У всьому іншому віконний менеджер є звичайним клієнтом.
Основні характеристики середовища KDE.
Віконний менеджер є частиною одного з найсучасніших X Window середовищ - The KDE Desktop Environment.
KDE - це зовсім новий робочий стіл (desktop), який містить велику кількість аплікацій для UNIX робочих станцій. KDE - це віконний менеджер, файловий менеджер, панель, центр керування та багато інших компонентів, що є частиною сучасного середовища робочого стола, реальна потужність якого полягає у можливостях взаємодії його компонентів. KDE забезпечує усі необхідні засоби для роботи з віконною системою, крім того до нього можуть підключатись багато зовнішніх програмних засобів.
X-термінал The eXceed X Server
Для роботи з системою X Window в різних операційних середовищах, відмінних від UNIX, існують різні X-термінали. Одним з найпотужніших X-терміналів для ОС Microsoft Windows NT є The eXceed X Server.
The eXceed X server забезпечує доступ до UNIX-аплікацій з середовища Microsoft Windows NT. Він дозволяє виконувати одночасно як X-аплікації, так і Microsoft Windows NT -аплікації. The eXceed X server також дозволяє виконувати наступні задачі:
проводити обмін даними (виділені прямокутні області, цілі вікна та X-виділення) між клієнтами та буфером обміну (Clipboard),
друкувати виділені прямокутні області, цілі вікна та X-виділення,
трасувати біжучу сесію eXceed.
The eXceed X server при старті виводить на екрані вікно реєстрації в ОС UNIX (
Після реєстрації користувач отримує повний набір можливостей системи X Window.
Основні настройки конфігураціїWeb-броузера Netscape
Для роботи з гіпертекстовими документами WWW в системі X Window існує декілька Web-броузерів, але найпоширенішим та найпотужнішим є Netscape Communicator:
Організація пошукового сервісу
Основні протоколи, що використовуються в Інтернет, не забезпечені достатніми вбудованими функціями пошуку, не кажучи вже про мільйони серверів, що знаходяться в ній. Протокол HTTP, який використовується в Інтернет, ефективний тільки в плані навігації, яка розглядається лише як засіб перегляду сторінок, але не їх пошуку. Теж саме відноситься і до протоколу FTP, який в цьому відношенні ще більш примітивний, ніж HTTP. В зв'язку із швидким ростом кількості інформації, доступної в Інтернет, навігаційні методи перегляду швидко досягають межі їх функціональних можливостей, не кажучі вже про їх ефективність. На сьогодні потрібну інформацію вже неможливо отримати відразу, оскільки в Інтернет знаходяться міліарди документів, доступних користувачам Інтернет, і їх кількість зростає за експоненціальною залежністю. Кількість змін, яким ця інформація була піддана, величезна, і, найголовніше, вони відбулись за дуже короткий проміжок часу. Основна проблема полягає в тому, що єдиної повної функціональної системи оновлення і занесення подібного об'єму інформації, одночасно доступного усім користувачам Інтернет в уьому світі, ніколи не було. Для того, щоби структурувати інформацію, накопичену в Інтернет, і забезпечити її користувачів зручними засобами пошуку необхідних їм даних, були створені пошукові системи.
Пошукові cистеми звичайно складаються з трьох компонентів:
агент (павук або кроулер), який переміщується по мережі і збирає інформацію;
база даних, яка містить всю інформацію, зібрану павуками;
пошуковий механізм, який користувачі використовують як інтерфейс для взаємодії з базою даних.
Засоби пошуку і структурування, що іноді називаються пошуковими механізмами. використовуються для того, щоби допомогти користувачам знайти потрібну інформацію. Засоби пошуку типу агентів, павуків, кроулерів і роботів використовуються для збору інформації про документи, які знаходяться в мережі Інтернет. Це спеціальні програми, які займаються пошуком сторінок в мережі, збирають гіпертекстові посилання з цих сторінок і автоматично індексують інформацію, яку вони знаходять для побудови бази даних. Кожний пошуковий механізм має власний набір правил, якими визначається збір документів. Деякі переміщуються за кожним посиланням на кожній знайденій сторінці і далі, в свою чергу, досліджують кожне посилання на кожній з нових сторінок, і так далі. Деякі ігнорують певні посилання, інші проінструктовані, що потрібно переглядати перш за все найбільш популярні сторінки.
Агенти - найбільш "інтелектуальні" з пошукових засобів. Вони можуть робити більше, ніж просто шукати: вони можуть виконувати навіть транзакції від Вашого імені. Вже зараз вони можуть шукати сайти специфічної тематики і повертати списки сайтів, відсортованих за їх відвідуваністю. Агенти можуть обробляти вміст документів, знаходити та індексувати інші види ресурсів, не тільки сторінки. Вони можуть бути також запрограмовані для витягання інформації з вже існуючих баз даних. Незалежно від інформації, яку агенти індексують, вони передають її назад базі даних пошукового механізму.
Загальний пошук інформації в Інтернет здійснюють програми, які називаються павуками. Павуки повідомляють про зміст знайденого документа, індексують його і добувають підсумкову інформацію. Вони також переглядають заголовки, деякі посилання і відправляють проіндексовану інформацію базі даних пошукового механізму.
Кроулери переглядають заголовки і повертають тільки перше посилання.
роботи можуть бути запрограмовані таким чином, щоби переходити по різним посиланням різної глибини вкладеності, виконувати індексацію і навіть перевіряти посилання в документі. За їх природою вони можуть застрявати в циклах, отже, проходячи за посиланнями, їм потрібні значні ресурси мережі. Крім того, існують методи, призначені для того, щоби заборонити роботам пошук по сайтах, власники яких не бажають, щоби вони були проіндексовані.
Агенти збирають та індексують різні види інформації. Деякі, наприклад, індексують кожне окреме слово у зустрінутому документі, в той час як інші індексують тільки 100 найбільш важливих слів в кожному документі, індексують розмір документу і кількість слів в ньому, назву, заголовки і підзаголовки і так далі. Вигляд побудованого індексу визначає, який пошук може бути проведений пошуковим механізмом і як отримана інформація буде інтерпретована.
Агенти можуть переміщуватись по Інтернет і знаходити інформацію, після чого розміщувати її в базі даних пошукового механізму. Адміністратори пошукових систем можуть визначити, які сайти або типи сайтів агенти повинні відвідати та проіндексувати. Проіндексована інформація відправляється базі даних пошукового механізму так само, як було описано вище.
Користувачі можуть розміщувати інформацію прямо в індексі, заповнюючи особливу форму для того розділу, в який вони хотіли б помістити свою інформацію. Ці дані передаються базі даних.
Коли користувач хоче знайти інформацію, доступну в Інтернет, він відвідує сторінку пошукової системи і заповнює форму, що деталізує потрібну йому інформацію. Тут можуть використовуватись ключові слова, дати та інші критерії. Критерії в формі пошуку повинні відповідати критеріям, які використовуються агентами при індексації інформації, яку вони знайшли при переміщені по мережі.
База даних відшукує предмет запиту, оснований на інформації, вказаній в заповненій формі, і виводить відповідні документи, підготовлені базою даних. Для того, що визначити порядок, в якому список документів буде показаний, база даних застосовує алгоритм ранжирування. В ідеальному випадку, документи, найбільш релевантні запиту користувача, будуть розташовані першими в списку. Різні пошукові системи використовують різні алгоритми ранжирування, однак основні принципи визначення релевантності наступні:
Кількість слів запиту в текстовому вмісті документу (тобто в html-коді).
Теги, в яких ці слова розташовуються.
Місцеположення шуканих слів у документі.
Питома вага слів, відносно яких визначається релевантність, в загальній кількості слів документу.
Ці принципи застосовуються всіма пошуковими системами. А наведені нижче використовуються деякими, але достатньо відомими (наприклад, AltaVista).
Час - як довго сторінка знаходиться в базі пошукового сервера. Спочатку може здатись, що це досить безглуздий принцип. Але в Інтернет існує багато сайтів, час життя яких складає близько місяця. Якщо ж сайт існує досить довго, це значить, що його власник досить досвідчений за даною темою і користувачу більше підійде сайт, що існує вже кілька років, ніж той, який з'явився тиждень тому за цією ж темою.
Індекс цитованості - як багато посилань на дану сторінку веде з інших сторінок, зареєстрованих в базі пошуковика.
База даних виводить ранжирований таким чином список документів з HTML і повертає його користувачу, який зробив запит. Різні пошукові механізми також вибирають різні способи показу отриманого списку - деякі показують тільки посилання, інші виводять посилання з декількома першими реченнями, що містяться в документі або заголовок документу разом з посиланням. Коли користувач звертається до посилання на один з документів, що його інтересують, цей документ запитується у сервера, на якому він знаходиться.
Основні пошукові сайти Інтернет
Yahoo (www.yahoo.com)
Дана система з'явилась в Інтернет однією з перших і сьогодні Yahoo співробітничає з багатьма виробниками засобів інформаційного пошуку, а на різних її серверах використовується різне програмне забезпечення. Мова Yahoo досить проста: всі слова слід вводити через пробіл, вони з'єднуються зв'язкою AND або OR. При видачі не вказується ступінь відповідності документа запиту, а тільки підкреслюються слова із запиту, що зустрілись в документі. При цьому не відбувається нормалізація лексики і не проводиться аналіз на "загальні" слова. Високі результати пошуку отримуються тільки тоді, коли користувач знає, що в базі даних Yahoo інформація є напевно. Ранжирування проводиться за числом термінів запиту в документі. Yahoo відноситься до класу простих традиційних систем з обмеженими можливостями пошуку.
Rambler (www.rambler.ru)
Це досить потужний російськомовний пошуковий сервер.
Він підтримує різні варіанти задання пошуку інформації - як в режимі командного рядка, так і за допогою спеціальних меню і вікон пошукового шаблону.
Yandex (www.yandex.ru)
Це ще один досить потужний російськомовний пошуковий сервер.
Він підтримує різні варіанти задання пошуку інформації - як в режимі командного рядка, так і за допогою спеціальних меню і вікон пошукового шаблону.
Порядок роботи
В ОС Windows запустити програму eXceed (Start -> Programs -> eXceed -> eXceed).
Зареєструватись в X-терміналі eXceed (логін ОС UNIX)
Ознайомитись з довідковою інформацією по KDE (K -> KDE Help).
Ознайомитись з файловим менеджером KDE (K -> Home directory).
Ознайомитись з центром керування KDE (K -> Control Center).
Запустити Web-броузер Netscape (K -> non-KDE Applications -> Internet -> Netscape) і ознайомитись з його конфігураційними настройками (Edit -> Preferences).
За допомогою Web-броузера Netscape відвідати наступні Інтернет-сайти та ознайомитись з їх вмістом:
www.lp.edu.ua - сайт Національного університета "Львівська політехніка",
www.netscape.com - сайт фірми Netscape,
www.microsoft.com - сайт фірми Microsoft.
За допомогою Web-броузера Netscape відвідати пошукові сайти Yahoo, AltaVista, Rambler, Yandex, і провести за їх допомогою пошук по ключових фразах.
Ознайомитись з результатами пошуку.
Закрити Web-броузер Netscape та X-термінал eXceed, вийти з системи.
Висновки: в ході виконання цієї лабораторної роботи я ознайомився з призначенням і можливостями системи X Window та основними характеристиками середовища KDE, ознайомився із Xтерміналом The eXceed X Server, дослідив основні настройки конфігурації Webброузера Netscape, за допомогою нього ознайомився із основними пошуковими сервісами Інтернет.