Гіпертекстові інформаційно пошукові системи

Інформація про навчальний заклад

ВУЗ:
Національний університет Львівська політехніка
Інститут:
Не вказано
Факультет:
КН
Кафедра:
Кафедра САПР

Інформація про роботу

Рік:
2011
Тип роботи:
Курсова робота
Предмет:
Проблемно-орієнтовані методи та засоби комп’ютерних інформаційних технологій

Частина тексту файла (без зображень, графіків і формул):

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА» Кафедра інформаційних систем та мереж К У Р С О В А Р О Б О Т А з дисципліни " МЕТОДИ ТА ЗАСОБИ КОМП’ЮТЕРНИХ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ" на тему: «Гіпертекстові інформаційно пошукові системи» З А В Д А Н Н Я на курсову роботу з дисципліни "Методи та засоби комп’ютерних інформаційних технологій" Т е м а: Гіпертекстові інформаційно пошукові системи № з/п Зміст завдання   Здійснити аналiтичний огляд лiтератури за заданою темою та .   Обґрунтувати вибір інструментальних засобів проектування   Розробити алгоритм функціонування   Розробити програму тестування по обраній темі   Оформити записку до курсового роботи згiдно з вимогами Мiжнародних стандартiв, дотримуючись такого змiсту:   вступ; теоретична частина; опис програмної реалізації (блок-схема програми, опис роботи, типи вхідних та вихідних даних); висновки; література; додатки.   Зміст Вступ……………………………………………………………………………….4 1.Теоретична частина:…………………………………………….………………6 1.1. Основні поняття………………………………………………………..6 1.2. Етапи користування інформаційно-пошуковими системами……..10 1.3. Пошукові системи Web-сторінок……………………………………12 1.4. Чим відрізняються різні інформаційно-пошукові системи………..19 2.Опис програмної реалізації(блок-схема програми, опис роботи, типи вхідних та вихідних даних)…………………………………………………......22 3.Інструкції користувачу………………………………………………………...26 Висновки…………………………………………………………………………27 Список використаних джерел…………………………………………………..28 Додатки…………………………………………………………………………...29 Вступ Поповнення інформаційних ресурсів Інтернету відбувається високими темпами, тому важливим у зв’язку з цим є розв’язання проблеми ефективного пошуку інформації в мережі. Надійним способом пошуку інформації в Інтернеті є використання спеціальних пошукових систем, які постійно відстежують зміни інформації в мережі. За час існування Інтернету робилися різні спроби організації пошукових засобів. Багато які з цих спроб виявилися невдалими, інші ж привели до створення зручних засобів пошуку інформації. Найбільш ефективні проекти з'явилися останніми п'ятьма роками. Відзначимо, що пошукові системи часто називають пошуковими механізмами, чи машинами пошуку. Пошуковий механізм в Інтернеті являє собою програму, розміщену на сервері, підіткнутому до Інтернету, яка регулярно зчитує певним чином інформацію з Інтернету і додає до своєї бази даних посилання на нові файли, котрі вона відшуковує. Більшість пошукових механізмів включають три основних компоненти: 1) пристрій автоматичного пошуку, що періодично здійснює автоматизований пошук по Інтернету; 2) базу даних, де зберігається ця інформація (включаючи посилання, заголовки, текст тощо) з можливістю пошуку; 3) загальнодоступний Web-вузол, котрий дозволяє «сторонній людині» відшукувати інформацію й одержувати до неї доступ. Пошукові механізми в залежності від використовуваного програмного забезпечення відрізняються один від одного розміром бази даних, частотою відновлення і легкістю використання для пошуку файлів з певних тем за допомогою заданих ключових слів чи фраз. Оскільки Інтернет поєднує нині мільйони файлів на тисячах серверів по всій земній кулі, для забезпечення можливості систематичного пошуку по всіх цих серверах файлів, що містять конкретні терміни чи зразки інформації, пошукові механізми повинні мати досить потужні ресурси. Пошукові механізми постійно удосконалюються, що дає користувачеві можливість обмежувати область пошуку для того, щоб віднайдені файли дійсно відповідали тематиці пошуку. Якщо задати надто широкі чи нащо загальні умови пошуку, то можна одержати внаслідок таку велику кількість файлів, що пошук не матиме сенсу. Крім того, деякі нові пошукові системи дозволяють тепер робиш пошук різними мовами (а не лише англійською). Багато пошукових систем дозволяють відшукувати інформацію не тільки у Web-сторінках, але й у групах новин і сховищах файлів. Таким чином, внаслідок пошуку можна знайти повідомлення в групі новин чи якийсь файл. Тому в деяких випадках замість терміну «сторінка» вживається більш загальний термін «документ». Під документом розуміється Web-сторінка, повідомлення чи файл що містить певну інформацію. 1.Теоретична частина 1.1. Основні поняття. WWW-noслуга (World Wide Web — Всесвітня павутина) – це гіпертекстова інформаційно-пошукова система в мережі Інтернет. Блоки даних розміщуються на окремих комп'ютерах, які називаються веб-серверами. Найчастіше посилання виділяється на фоні екрана монітора за допомогою зміни кольору та підкреслення. У цьому випадку його називають «гіперпосиланням». Це може бути слово, фраза або графічний елемент (якщо покажчик миші встановлено на цьому об'єкті, то таке зображення покажчика набуває вигляду вказівного пальця руки). Будь-яке гіперпосилання містить адресу іншого інформаційного ресурсу, який і викликається на екран у разі необхідності. У гіпертексті за допомогою гіперпосилань пов'язується між собою велика кількість документів. Таким чином, один об'єкт має багато зв'язків з іншими об'єктами. Кожний із таких об'єктів є звичайним текстом або гіпертекстом. Гіпертекст – текс із вставленими в нього словами (командами) розмітки, які посилаються на інші місця цього тексту, інші документи, картинки тощо Гіпертекстове посилання – елемент Web-сторінки, який за звичаєм виділений кольором та підкреслюванням. Використовується для швидкого переходу до іншого документу World Wide Web. З його допомогою Ви можете мандрувати по різним Web-серверам усього світу. Інформатизація – це сукупність взаємопов'язаних організаційних, правових, політичних, соціально-економічних, науково-технічних, виробничих процесів, що спрямовані на створення умов для задоволення інформаційних потреб, реалізації прав громадян і суспільства на основі створення, розвитку, використання інформаційних систем, мереж, ресурсів та інформаційних технологій, створених на основі застосування сучасної обчислювальної та комунікаційної техніки. Пошукова система – спеціальний Web-вузол, призначений для автоматизації пошуку в Internet необхідної інформації з використанням ключових слів. WWW — це служба для пошуку документів у різних базах даних, яка заснована на гіпертекстовій логіці перегляду документів. Гіпертекст — це багатовимірний текст, що може містити посилання різного напрямку або покажчики (адреси) на інші документи та посилання. За такими принципами, наприклад, побудований HELP Microsoft. Нова організація документів — гіпермедіа, дозволяє з’єднувати не тільки слова, а й рисунки, звуки або файли будь-якого типу даних. Для створення гіпертекстових або гіпермедіа-документів існує спеціальна мова гіпертекстової розмітки HTML. Гіпермедіа-посилання, що присутні на сторінці WWW, описують місцезнаходження документа (URL), який програма-браузер повинна відобразити на екрані. URL (UNIFORM RESOURS LOCATOR) — уніфікований покажчик ресурсів, який дозволяє браузеру перейти безпосередньо до файла, що знаходиться на будь-якому сервері мережі. Фактично, URL — це адреса сторінки WWW. Усі URL мають однаковий формат:  Наприклад:  У табл. 1 наведені основні типи даних, що застосовуються у WWW. Сучасні локальні мережі дозволяють створювати WWW — подібні системи всередині окремих корпорацій. Для цього необхідна тільки наявність внутрішньої локальної мережі з TCP/IP протоколом. Така технологія створення Internet — подібних локальних систем — має назву Intranet. Таблиця 1 Тип даних Розширення файла Опис  Звук *.wau Файл microsoft Windows із хвильовим образом звуку    *.mid Звуковий файл формату МIDI    *.snd Звуковий формат, що використовується в UNIX    *.au - // -  Зображення *.gif Графічний файл GIF    *.jpg Графічний файл JPEG    *.tif Графічний файл TIFF  Відео *.mpg Відеокліп    *.mov Відеокліп    *.avi Відеокліп  Для роботи з WWW використовуються спеціальні програми — WEB-броузери, які створюють команду, пересилають її на сервер та отримують відповідь. Обробка даних в http складається з чотирьох етапів: відкриття зв’язку, пересилання повідомлень запиту, пересилання даних відповіді та закриття зв’язку. Найбільш поширені Web-броузери: Microsoft Internet Explorer та Netscape Navigator.  Рис. 1. Вікно MS Internet Explorer Для завантаження потрібної Web-сторінки необхідно ввести її адресу. За допомогою меню Файл цю сторінку можна зберегти на своєму диску або вивести на принтер. Для організації пошуку інформації в мережі Iнтернет призначено пошукові сервери(пошукові системи). Використовуючи такі сервери, можна подати запит на пошук потрібної інформації, а сервер(система) видасть вам список посилань(адрес) на електронні джерела, при цьому кожна адреса відіграє роль гіперпосилання, активізуючи яке, можна одразу ж відкрити відповідну сторінку. За принципом дії пошукові сервери поділяються на пошукові каталоги і пошукові індекси. Пошукові каталоги дозволяють здійснювати тематичний пошук. Початкова сторінка таких серверів є тематичним рубрикатором верхнього рівня. Вибравши рубрику, підрубрику і т.д., можна поступово опускатися до переліку матеріалів, які присвячені досить вузькій темі. Пошукові індекси працюють як алфавітні вказівники. У них запит робиться в полі пошуку у вигляді послідовності ключових слів, які відповідають змісту шуканої інформації. У відповідь на такий запит буде видано список Web-сторінок, в яких зустрічаються вказані слова. Багато інформаційно-пошукових систем є одночасно і пошуковими каталогами, і пошуковими індексами. Відмітимо, що пошукові системи часто називають пошуковими машинами або машинами пошуку. Всього в світі існують сотні пошукових систем, і вибір якоїсь із них залежить від ваших власних уподобань. Відомими пошуковими серверами є: Google, AltaVista, Yahoo, Rambler, Yandex, Aport, Мета Україна. Деякі з пошукових систем дозволяють шукати інформацію не тільки на Web-сторінках, але й у групах новин і в місцях, де зберігаються файли. Тому надалі будемо вживати замість терміна сторінка більш загальний термін - документ. 1.2. Етапи користування інформаційно-пошуковими системами Процес пошуку доволі простий: задавши ключові слова, характерні для шуканої інформації, знаходимо потрібний нам документ. Незалежно від того, яка система пошуку використовується, загальний алгоритм пошуку виглядає наступним чином: Перейдіть на початкову сторінку пошукової системи або на будь-яку іншу сторінку, на якій знаходяться поля для вводу запитів і кнопка для початку пошуку. В останньому випадку після клацання на кнопці відбувається перехід на сторінку пошукової системи. Принципової різниці між власне пошуковою системою і сторінкою з полями вводу запиту, який передається пошуковій системі, немає. Якщо система дозволяє послідовно уточнювати межі для пошуку, то здійснюється перехід на розділи, які визначаються цими межами, наприклад, пошук лише в галузі наук. В таких системах запит в головному розділі здійснює пошук серед усіх вузлів Iнтернета. Якщо ж ви, наприклад, перейдете в розділ "Новини", то пошук за запитом проводиться лише серед вузлів, присвячених новинам. Уведіть запит на пошук у відповідності з правилами, прийнятими у вибраній системі пошуку. У найпростішому випадку це одне або декілька слів, але можливі і складні запити з логічними операціями "AND", "OR", "NOT". Якщо система пошуку дозволяє, то уточнюються деякі параметри запиту за допомогою додаткових полів, списків, прапорців і перемикачів, які можуть знаходитися на сторінці поряд з полем запиту. Клацніть на кнопці для початку пошуку, і після деякої паузи відбудеться автоматичний перехід на сторінку із списком документів, що задовольняють вашому запиту. Час паузи залежить від складності запиту, швидкості роботи пошукової системи і якості зв'язку з даною системою. Якщо посилань так багато, що вони не вміщаються на одну сторінку, то після перегляду першої сторінки з результатами пошуку можна перейти до наступної. Знайшовши потрібне посилання, клацніть на ньому мишею і переходьте на сторінку, яку ви розшукували. Якщо потрібно переглянути після цього інші знайдені документи, то поверніться назад до сторінки з посиланнями і здійсніть перехід на новий документ за іншим посиланням. В багатьох пошукових системах поле запиту залишається на сторінці під час перегляду результатів, там можна швидко уточнити запит і організувати новий пошук. В більшості систем список включає в себе, крім посилань, декілька рядків кожного зі знайдених документів. В деяких системах списки посилань відсортовані таким чином, що на початку списку виписані посилання на документи, що найточніше задовольняють ваш запит. Наприклад, якщо в документі часто зустрічаються слова запиту і декілька слів, включених в запит, розміщені в документі поряд, то такий документ, на думку пошукової системи, найповніше задовольняє запиту. Відмітимо, що ступінь відповідності знайденого документа запиту, визначений пошуковою системою, не завжди співпадає з вашим розумінням цієї відповідності. Зазначимо також, що при виконанні запиту пошукова система не шукає документи безпосередньо в Iнтернеті. Вона звертається до своєї бази даних, де в компактному вигляді зібрані дані про інформацію в Інтернеті. 1.3. Пошукові системи Web-сторінок Пошукові системи поділяються на тематичні (класифікатори) та індексні системи пошуку. Тематичні системи пропонують користувачам список категорій, в якому Web-сторінки впорядковуються за ієрархічною схемою. Переміщуючись по дереву каталогів, можна послідовно обмежити область пошуку й у результаті отримати список посилань на WEB-вузли, що пов’язані з потрібною темою. Для використання класифікаторів щодо пошуку інформації необхідно точно знати, до якої категорії належить ця інформація. Крім того, необхідно мати на увазі, що класифікація ресурсів виконується людиною і тому може бути суб’єктивною. До тематичних пошукових систем належать: www.mckinley.com, www.yahoo.com, www.list.ru (рис.2) та інші.  Рис.2. Пошукова система LIST.RU Індексні системи виконують пошук сторінок, що містять задані ключові слова. По закінченні пошуку система виводить список сайтів, які задовольняють заданим критеріям. Критерієм може бути слово, набір слів або логічний вираз. Індексні системи для підвищення ефективності своєї роботи містять такі компоненти: програму (індексатор), яка періодично сканує Internet для збирання даних про стан інформаційних ресурсів; індекс — масив даних, який використовується для пошуку адресів інформаційних ресурсів. Індекс складається з прямого та інвертованого списків, які встановлюють відповідність між пошуковими термінами та документами, що їх містять; засоби пошуку: інформаційно-пошукова мова системи, інтерфейс користувача та методи виконання запитів в індексній базі. Для ефективної організації словників та індексів використовується поняття «вага терміна». Воно визначається в процесі індексування і залежить від методу індексування, який використовується даною пошуковою системою. Методи індексування поділяють на статистичні, теоретико-інформаційні та ймовірні. Статистичні методи розглядають документи як точки в інформаційному просторі. Чим ближче групи термінів, що складають документи, тим ближче знаходяться точки, що їх відображують. Як терміни індексації обираються ті, що знижують щільність простору документів.  Рис. 3. Пошукова система ALTAVISTA Теоретико-інформаційні методи застосовують твердження, що найбільшу цінність мають слова, які зустрічаються щонайменшу кількість разів. Для оцінки терміна використовуються методи теорії інформації. Імовірні методи використовують множину документів, що навчають оцінювати релевантність результатів обробки запитів. Множина, що навчає, застосовується для обчислення вагових коефіцієнтів, які отримуються шляхом оцінки умовної ймовірності присутності терміна в даному документі у випадку його релевантності. На основі цих коефіцієнтів визначається вага терміна. Формальну релевантність обчислює система, та на цій основі ранжується вибірка знайдених документів. Реальна релевантність — це оцінювання користувачем цінності знайдених документів. До індексних пошукових систем відносяться: www.excite.com, www.altavista.com (рис. 6.3), www.infoseek.com, www.lycos.com, www.rambler.ru (рис.4), www.yandex.ru, www.search.avanport.com.  Рис.4. Пошукова система RAMBLER Останнім часом більшість пошукових систем поєднують в собі можливості як класифікаторів, так і індексів. Пошукова система Alta Vista Новітньою модифікацію програми Alta Vista http://www.comptek.ru/alta.html - русифікована програма) - однієї з найбільш популярних пошукових механізмів – розроблено співробітниками компанії «Digital Eqиipment» й відкрито для вільного використання наприкінці 1995 року. Програма працює незалежно від основного вузла «Alta Vista» і забезпечує умови пошуку російською мовою. ця система є досить популярною, хоча останнім часом інші системи становлять їй значну конкуренцію. Серед пошукових систем Alta Vista на сьогодні має одну з найбільших баз інформації і найшвидший механізм пошуку. Інші системи поки що поступаються їй у потужності, хоча деякі з них останнім часом надто швидко розвиваються. На рис. 5. наведено початкову сторінку пошукової системи Alta Vista. У верхній частині сторінки розташовано фірмовий заголовок системи Alta Vista, під яким міститься поле введення запиту. Для формування простого запиту слід в поле введення запиту ввести ключове слово і натиснути кнопку <Sеаrсh>(Пошук). Після введення ключових слів користувач одержує інформацію про кількість знайдених документів і їхні короткі реферати з посиланнями на інформацію в Інтернеті. Розширений пошук дозволяє використовувати логічні оператори для формування складних запитів.  На рис. 5. початкова сторінка пошукової системи Alta Vista. Система також дозволяє обрати мову шуканих документів: аnу language (будь-яка мова). Щоб перевірити роботу на прикладах: введіть у поле введення запиту слово Интернет; натисніть кнопку <Sеаrсh>, розташовану нижче поля введення. У цьому випадку було знайдено 1763 входжень; введіть у поле введення запиту слово ИНТЕРНЕТ. натисніть кнопку <Sеаrсh>, розташовану нижче поля введення. У цьому випадку було знайдено всього 222 входження, тобто значно менше, ніж у першому випадку. Зручною можливістю є використання в запитах знаків "+" та "-". Знак "+" перед словом вказує на те, що дане слово обов'язково має бути присутнім у знайденому документі. Символ же "-" вказує на те, що наступне за ним слово не має бути присутнім. Знак “*” означає перемінну частину слова. Наприклад, на запит «интернет*» означає що в документі мають бути знайдені слова Интернет, интернета тощо. Для сформування складного запиту використовуються логічні оператори і синтаксичні вирази. Синтаксичні вирази - це будь-які слова і словосполучення, аналогічні розглянутим в простих запитах. Логічні оператори слугують для виконання операцій «І», «ЧИ:», «НІ» та «БІЛЯ» над синтаксичними виразами. Часто синтаксичні вирази, над якими здійснюються логічні операції, називаються аргументами, У синтаксичних виразах також можна використовувати окремі слова чи фрази, беручи кілька слів у подвійних лапки. Правила використання великих і малих літер у складних запитах не відрізняється від даних правил у простих запитах. Головне, що відрізняє складний запит – це використання логічних операторів і круглих дужок. За допомогою операторів і дужок створюється з окремих синтаксичних виразів необхідний запит: 1 Оператор AND для логічної операції «І» гарантує, що в документі наявні обидва аргументи. Наприклад: провайдер AND «очень дешево». 2 Оператор OR для логічної операції «НІ» гарантує, що в документі наявні обидва аргументи. Наприклад, запит телевизор OR радио OR видео знайде документи, у яких є хоча б одне із зазначених слів 3 Оператор NEAR для логічної операції «БІЛЯ» гарантує, що аргументи розміщено один ВІД одного в тексті не дальше ніж на десть символів 4 Оператор NOT для логічної операції «НІ» гарантує, що аргумент не присутній у документі. Наприклад: (NOT описание) чи (NOT телевизор). Пошукова система Yahoo Пошукова система Yahoo (http://www.yahoo.com) є найпопулярнішою системою в США, тому що не вимагає спеціальної підготовки для пошуку інформації. Не треба знати правила формування запитів, досить просто можна переходити за посиланнями у потрібні розділи. Однак для російськомовного пошуку дана система не надто зручна, тому що поділ на розділи проводився з урахуванням американської специфіки. Крім того, у довіднику Yahoo міститься набагато менше посилань на російськомовні документи, аніж у базі даних Alta Vista. Однак для пошуку в Інтернеті за конкретною тематикою дана система може виявитися корисною. Крім поля, призначеного для введення запитів, на сторінці є безліч посилань на різні розділи інформації. як приклад, спробуємо віднайти інформацію за допомогою запиту. для нього: 1) введіть у поле введення запиту слово Интернет; 2) натисніть кнопку <Search>, яка розташована праворуч від поля введення. 3'явиться сторінка з відповіддю системи, з якої видно, що система пошуку Yahoo практично не відрізняється від Alta Vista.  Рис 6. Початкова сторінка пошукової системи Yahoo. Всі описані вище прийоми, характерні при роботі з Alta Vista, застосовні й до Yahoo. Таким чином, можна використовувати пошук у Yahoo цілком так само, як і в системі Alta Vista. Однак Yahoo пропонує й деякі додаткові можливості. Виконаємо пошук інформації без використання запитів. Для цього повернемося на сторінку, що містить перелік підрозділів: натисніть кнопку Назад (Васk), щоб повернутися до початкової сторінки системи Yahoo; клацніть мишею на посиланні Internet, що розташоване нижче за посилання computers and Internet. Після цього буде завантажена сторінка з посиланнями на сторінки, присвячені Інтернету. Як і інші світові пошукові системи, Yahoo краще підходить для пошуку ресурсів, розташованих за межами країн СНД. 1.4. Чим відрізняються різні інформаційно-пошукові системи Пошукові системи використовують для індексування сайтів так званих "пошукових роботів", спайдерів (від англійського слова "spider", що значить "павук"). Робот - це невелика програма, що ходить по посиланнях на сайті й індексує (збирає і запам'ятовує) зустрінуту на шляху інформацію. Принцип роботи пошукових роботів приблизно наступний: ви надаєте пошуковій системі точна адреса сторінки, який потрібно зареєструвати. Пошукова система перевіряє, чи існує по цій адресі сторінка, і якщо так, те сторінка вноситься в "графік відвідування". Між часом, коли ви зареєстрували сторінку в пошуковій системі і часом, коли вашу сторінку відвідає пошуковий робот може пройти від декількох хвилин до декількох тижнів. Так що не поспішаєте відразу ж перевіряти наявність вашої чи сторінки сайту в пошуковій системі. Коли приходить "година Х", на вашу сторінку посилається пошуковий робот. Як правило, схема роботи робота наступна: 1) робот шукає файл robots.txt. 2) робот читає сторінку, для індексування якої він був посланий (глибина індексування, тобто читання сторінки міняється від робота до робота. Деякі зупиняються тільки на читанні заголовка сторінки і вмісту мета-тегів, інші можуть прочитати, скажемо перші 6000 символів на сторінці, а деякі індексують весь зміст веб-сторінки) 3) потім робот може або видалитися або продовжити індексування сайта. 4) через якийсь час робот знову може відвідати цю сторінку, якщо існує тег "revisit" чи відповідно до політики, яка проводиться пошуковою системою. Відмінність каталогів від пошукових систем полягає в тому, що каталоги не посилають ніяких роботів, щоб індексувати вашу чи сторінку веб-сайту. Найбільш відомим каталогом є Yahoo.com. Для реєстрації в каталозі вам необхідно знайти розділ, у який ви хочете помістити свою сторінку, послати короткий опис сайта і список ключових слів для пошуку вашої сторінки в каталозі. Потім ця інформація проглядається й оцінюється людьми, що вирішують, чи варто включати ваш інформацію в чи каталог ні. Варто знати, що вам можуть відмовити в реєстрації, ваш сайт можуть помістити в інший розділ, можуть бути змінені опис сайта і/чи список його ключових слів. Усі залежить від модераторів. Тому що реєстрація виробляється людиною, а не програмою, то пошук по каталогах дає більш релевантні результати, ніж пошук по пошукових системах. Корінною відмінністю каталогів від розвідувачів також є те, що пошук у них виробляється не по текстової складової всіх сторінок сайта, а тільки по короткому описі сервера й обраним при реєстрації ключовим словам. Так само, як різні кухарі готують різні блюда з тих самих інгредієнтів, так і пошукові системи одержують різні результати, ґрунтуючись на тих самих вихідних даних. Усі залежить від алгоритмів обробки цих даних, закладених творцями пошукових систем. Одні системи приділяють більшу увагу "індексу цитування", інші наявності всіх мета-тегов, треті взагалі не приділяють увагу мета-тегам. Rambler, наприклад, цілком ігнорує зміст мета-тегов (крім мета-тега robots). Якщо ви подивитеся на рейтинг вашого сайта в різних пошукових системах, він скрізь виявиться різним. Тому й існують так називані вхідні сторінки, оптимізовування під роботу окремих пошукових систем. Як правило, пошукові системи тримають у секреті точні рецепти, свої алгоритми ранжирування, відповідно до яких формуються їхні рейтинги. Цим переслідуються дві мети: захист від конкурентів і захист від спрямованого спама. Крім того, пошукові системи відрізняються обсягом проіндексованих сторінок і періодом відновлення свого індексу. В даний час пошукові обсяг індексації пошукових систем оцінюється по двох параметрах: по кількості веб-сторінок, що пошукові системи відвідали для створення своєї бази даних і кількості веб-сторінок проіндексованих у базі даних. AltaVista, наприклад, затверджує, що її база даних нараховує 250 млн. сторінок, а число посещенних для індексації сторінок склало 400 млн. У пошукової системи FAST цей показник складає 400 млн. проти 700 млн., Excite - 250/920 млн., Inktomi - 110 млн./1 млрд. Крім того, пошукові системи розрізняються періодом відновлення свого індексу, тобто часом, за який відбувається повне відновлення бази даних пошукової системи. Ніж коротше цей період, тим більше релевантні результати ви будете одержувати на свій запит і меншу кількість "мертвих посилань". Саме тому ваш рейтинг в одній і тій же пошуковій системі може змінюватися: чи з'являються зникають якісь сайти, уводяться зміни в алгоритм роботи пошукових систем, міняється структура інформації на вашому сайте. Період відновлення індексу генератора в трьох основних російськомовних пошукових машин - Яndех, Rambler і "Апорт" - тиждень. Тому, зареєструвавши свій ресурс у пошуковій машині, не варто відразу ж шукати посилання на нього в результатах пошуку - він стане доступним тільки тоді, коли буде обновлена база даних пошукової системи. Другий показник дуже важливий для правильної оцінки "індексу цитування", тому що чим більше число веб-сторінок відвідав пошуковий робот, тим більша кількість перехресних посилань він проіндексував. 2.Опис програмної реалізації Згідно завдання мені треба було розробити програму тестування з Гіпертекстових ІПС. Дану програму я реалізував у середовищі C++Builder 6. На створену форму я додав такі графічні елементи: RadioGroup1 – об’єкт в який будуть завантажуватися запитання та варіантів відповідей, а також вибору користувачем одного з наведених. Memo1 – текстовий об’єкт в якому міститься інформація про програму та завантажується результат тестування. Button1 – клавіша «Назад» яка дає доступ до попереднього питання. Button2 – клавіша «Далі» яка дає доступ до наступного питання. Button3 – клавіша «Готово» що з’являється на останньому питанні і при натисненні оцінює відповіді. Button4 – клавіша «Вихід» завершує програму. MainMenu1 Заново – дає змогу повторити тест спочатку. Вихід – завершення програми. Вхідними даними є вибрані користувачем варіанти відповіді. Вихідними даними слугує підсумований результат оцінювання. У програмі створені такі дані: res – вихідні дані (результат оцінювання); k – кількість тестових запинань; i – лічильник; an[5] – масив правильних відповідей; a0[5] – вхідні дані (масив відповідей); q[5][100] – масив тестових запитань; s1[5][100],s2[5][100],s3[5][100] – масиви варіантів відповідей; Алгоритм роботи програми при натисненні клавіші Button1(Назад)  Алгоритм роботи програми при натисненні клавіші Button2(Далі) Алгоритм роботи програми при натисненні клавіші Button3(Готово)  3.Інструкція користувачу Для роботи з програмою користувачу необхідно: Відкрити папку «Тест». Запустити програму відкривши файл «Project1.exe». Перед користувачем буде виведене питання з трьома варіантами відповіді. Вибрати одну відповідь яку ви вважаєте правильною. За допомогою кнопок «Далі->» «<-Назад» здійснювати перехід між питаннями. Після відповідей на всі питання натиснути клавішу «Готово» на останньому тесті. Результат виведеться у текстове поле. Для повторення тесту натиснути «Заново» вверху вікна. Для завершення натисніть на «Вихід». Висновки В сучасному світі суспільство стало залежати від інформації, так як вона стала невід’ємною складовою будь якого виду діяльності. У зв’язку з тим що Інтернет з кожним днем росте з геометричною прогресією і вже є переповненим інформацією, вічним питаннями стали: пошук цієї інформації, створення та вдосконалення методів пошуку. Хоча на даний момент в мережі вже є вибір між Гіпертекстовими інформаційно-пошуковими машинами пошук інформації не є дуже легким завданням, адже кожна ІПС працює краще в конкретному просторі мережі(країна, мова, типи документації і т. д.), саме тому вони співіснують і доповнюють одна одну. Список використаних джерел: ПОНЯТТЯ ТА ВИКОРИСТАННЯ ІНФОРМАЦІЙНО-ПОШУКОВИХ СИСТЕМ” [Електронний ресурс] http://www.ukrreferat.comindex.phpreferat=31456&pg=0 «Глосарій» [Електронний ресурс] http://goruo.konstantinovka.info/sites/default/files/%20поняття%20з%20ДН(укр.).doc «World Wide Web — Всесвітня павутина» [Електронний ресурс] http://galanet.at.ua/blog/2008-04-24-29 В.В.Корчинський, Л.А.Нікітюк, О.О.Скопа. «Практичне введення в Інтернет» навчальний посібник – Одеса УДАЗ ім. О.С.Попова, 2001р Глобальна мережа Internet [Електронний ресурс] http://ubooks.com.ua Додаток Код програми: //--------------------------------------------------------------------------- #include <vcl.h> #include <string.h> #pragma hdrstop #include "Unit1.h" //--------------------------------------------------------------------------- #pragma package(smart_init) #pragma resource "*.dfm" TForm1 *Form1; int res,k=10,i,an[10],a0[10]; char q[10][100],s1[10][100],s2[10][100],s3[10][100]; //--------------------------------------------------------------------------- __fastcall TForm1::TForm1(TComponent* Owner) : TForm(Owner) { } //--------------------------------------------------------------------------- void __fastcall TForm1::FormActivate(TObject *Sender) { i=0; StrCopy(q[0],"Гіперпосилання це-..."); StrCopy(s1[0],"WWW"); StrCopy(s2[0],"Web-сторінка"); StrCopy(s3[0],"елемент Web-сторінки"); an[0]=2; a0[0]=-1; StrCopy(q[1],"Пошукова система це-..."); StrCopy(s1[1],"спеціальний Web-вузол, призначений для автоматизації пошуку"); StrCopy(s2[1],"елемент Web-сторінки, який за звичаєм виділений кольором та підкреслюванням."); StrCopy(s3[1],"апаратний набір призначений для ручного пошуку"); an[1]=0; a0[1]=-1; StrCopy(q[2],"Для роботи з WWW використовують-"); StrCopy(s1[2],"Мову HTML"); StrCopy(s2[2],"Web-браузери"); StrCopy(s3[2],"MicrosoftWord"); an[2]=1; a0[2]=-1; StrCopy(q[3],"Найбільш поширена ІПС у США"); StrCopy(s1[3],"Alta Vista"); StrCopy(s2[3],"Yahoo"); StrCopy(s3[3],"InfoSeek"); an[3]=1; a0[3]=-1; StrCopy(q[4],"Що треба прописати щоб запустити Google"); StrCopy(s1[4],"httq//www.Google.com"); StrCopy(s2[4],"http\\www.Google.com"); StrCopy(s3[4],"http//www.Google.com"); an[4]=2; a0[4]=-1; StrCopy(q[5],"ІПС поділяються на:"); StrCopy(s1[5],"тематичні та індексні"); StrCopy(s2[5],"прямі та непрямі"); StrCopy(s3[5],"внутрішні та зовнішні"); an[5]=0; a0[5]=-1; StrCopy(q[6],"Індексні системи для підвищення ефективності своєї роботи містять такі компоненти:"); StrCopy(s1[6],"ПЗ"); StrCopy(s2[6],"програму, індекс та засоби пошуку"); StrCopy(s3[6],"текст та апаратне забезпечення"); an[6]=1; a0[6]=-1; StrCopy(q[7],"Методи індексування поділяють на:"); StrCopy(s1[7],"програму, індекс та засоби пошуку"); StrCopy(s2[7],"прямі та непрямі"); StrCopy(s3[7],"статистичні, теоретико-інформаційні та ймовірні."); an[7]=2; a0[7]=-1; StrCopy(q[8],"Реальна релевантність - це"); StrCopy(s1[8],"оцінення ефективності ІПС"); StrCopy(s2[8],"оцінювання користувачем цінності знайдених документів."); StrCopy(s3[8],"внутрішні ефективність пошуку"); an[8]=1; a0[8]=-1; StrCopy(q[9],"Відмінність каталогів від пошукових систем полягає в тому, що "); StrCopy(s1[9],"відмінності немає"); StrCopy(s2[9],"ІПС не посилають ніяких роботів, щоб індексувати вашу чи сторінку веб-сайту"); StrCopy(s3[9],"каталоги не посилають ніяких роботів, щоб індексувати вашу чи сторінку веб-сайту"); an[9]=2; a0[9]=-1; RadioGroup1->Caption=q[0]; RadioGroup1->Items->Clear(); RadioGroup1->Items->Add(s1[0]); RadioGroup1->Items->Add(s2[0]); RadioGroup1->Items->Add(s3[0]); RadioGroup1->ItemIndex=a0[0]; Memo1->Lines->Clear(); Memo1->Lines->Add("Програму написав"); Memo1->Lines->Add("студент групи КНз-31"); Memo1->Lines->Add("Гусак Василь Васильович"); Memo1->Lines->Add(" "); Memo1->Lines->Add("Тестування складається з декількох питань"); Memo1->Lines->Add("відмічайте правельні на ваш варіант відповіді"); Memo1->Lines->Add("правильна відповідь на питання лише одна"); Button3->Visible=false; Button1->Visible=false; } //--------------------------------------------------------------------------- void __
Антиботан аватар за замовчуванням

26.01.2013 21:01-

Коментарі

Ви не можете залишити коментар. Для цього, будь ласка, увійдіть або зареєструйтесь.

Ділись своїми роботами та отримуй миттєві бонуси!

Маєш корисні навчальні матеріали, які припадають пилом на твоєму комп'ютері? Розрахункові, лабораторні, практичні чи контрольні роботи — завантажуй їх прямо зараз і одразу отримуй бали на свій рахунок! Заархівуй всі файли в один .zip (до 100 МБ) або завантажуй кожен файл окремо. Внесок у спільноту – це легкий спосіб допомогти іншим та отримати додаткові можливості на сайті. Твої старі роботи можуть приносити тобі нові нагороди!
Нічого не вибрано
0%

Оголошення від адміністратора

Антиботан аватар за замовчуванням

Подякувати Студентському архіву довільною сумою

Admin

26.02.2023 12:38

Дякуємо, що користуєтесь нашим архівом!