Міністерство освіти і науки, молоді та спорту України
НУ “Львівська політехніка”
Навчально-науковий інститут новітніх технологій та управління
імені В.Чорновола
Кафедра захисту інформації
Звіт
про виконання лабораторної роботи №3
“Вивчення пошукових систем і програм для знаходження інформації в інтернеті”
з дисципліни: інтернет технології та ресурси
Тема: вивчення пошукових систем і програм для знаходження інформації в інтернеті.
Мета: ознайомлення з пошуковими системами і програмами для пошуку інформації в Інтернеті, вивчення проблем пошуку та здійснення пошуку по ключовим словам й каталогам, пошук у зонах і елементах web-сторінки.
Теоретичні відомості
Пошукові системи (пошукові каталоги, пошукові сервери) виконані у виді Web-сторінок, але на цих сторінках розташовується не інформація як така, а анотовані посилання на інші ресурси (сторінки, сайти).
Найменування
Адреса
Яндекс (рос.)
http://www.yandex.ru
Rambler (рос.)
http://www.rambler.ru
Апорт (рос.)
http://www.aport.ru
Google (укр.)
http://www.google.com.ua
Meta (укр.)
http://www.meta.ua
Yahoo!(англ.)
http://www.yahoo.com
AltaVista (англ.)
http://www.altavista.com
InfoSeek (англ.)
http://www.infoseek.com
Перший етап роботи пошукової системи – це індексування інформації, що знаходиться в Internet. Мережевний робот пошукової системи переглядає величезну кількість сторінок і заносить адреси і короткий зміст цих сторінок до себе в базу даних, точніше в пошуковий індекс.Процес занесення адреси й описи сторінки в пошукову систему називається індексація.
Другий етап роботи пошукової системи – це видача накопиченої і відібраної, відсортованої і класифікованої інформації згідно запитів користувачів.
Найбільш простим і результативним пошуком є пошук по ключових словах.
Головна сторінка пошукової системи Яндекс.
Основний алгоритм пошуку наступний:
введіть ключові слова в поле запиту,
натисніть кнопку Знайти.
Після натискання кнопки Знайти, Яндекс виведе список посилань на документи, що найбільше точно відповідають запитові, і Ви побачите наступне:
Результат виконання запиту.
Пошукова форма. Головний її елемент – поле запиту.
Статистика пошуку: кількість знайдених документів.
Сортування по спаданні дат чи по ревалентності. Спочатку список сортується по ревалентності, тобто по ступені відповідності результату запитові.
Результати пошуку – список знайдених посилань.
Перехід на наступні сторінки результату.
Статистика запитів іншими користувачами за місяць по кожному ключовому слову.
Рубрики каталогу.
Пошук в інших пошукових системах.
Мітками R1-R2 на малюнку позначені різні рекламні блоки.
Пошукова форма системи Яндекс.
Прапорець «у знайденому» дозволяє шукати в результатах попереднього запиту.
Обмежуючи область пошуку, ми тим самим відкидаємо частину свідомо непотрібної нам інформації. Але часто буває необхідність вести пошук у всій базі, але для відкидання непотрібної інформації доводиться вводити різні додаткові відомості. Для цього служить Розширений пошук. Він вмикається натисненням по посиланню «розширений пошук», або по значку «+».
Сторінка введення умов розширеного пошуку.
Поле запиту – введіть слова, що обов'язково повинні бути в знайдених документах.
Розташування слів відносно один одного.
Розташування слів на сторінці.
Форма вживання слів.
Мова сторінки.
Дата сторінки.
Формат документа.
Сторінки містять посилання.
Сторінки знаходяться на сайті.
Сторінки схожі на сторінку.
Поради при пошуці в системі Яндекс
1. Перевіряйте орфографію.
2. Використовуйте синоніми.
3. Шукайте більше, ніж по одному слову.
4. Не пишіть великими буквами.
5. Знайти схожі документи.
6. Використовуйте знаки «+» і «-«.
7. Спробуйте використовувати мову запитів.
8. Шукати без морфології.
9. Пошук картинок і фотографій.
Пошук картинок.
Картинки групуються по площі:
«Дрібні» до 1000 квадратних пікселів
«Маленькі» від 1000 до 10 000 квадратних пікселів
«Середні» від 10 000 до 100 000 квадратних пікселів
«Великі» від 100 000 до 1000 000 квадратних пікселів
«Величезні» понад 1000 000 квадратних пікселів
Синтаксис мови запитів
Пошуковий запит вводиться в пошукове поле, він може містити ключові слова і спеціальні символи, що дозволяють встановити взаємозв'язок між цими словами і ввести додаткові параметри.
Синтаксис мови запитів системи Яндекс.
Символ
Призначення
Приклад
" "
пошук фрази
"червона шапочка"(еквівалентно червона /+1 шапочка)
+
обов'язкова наявність слова в знайденому документі
+бути або +не бути
~~ або -
не повинно бути слова в межах документа (І НЕ)
путівник по парижеві ~~ (агентство | тур)
~
не повинно бути слова в межах одного словосполучення (І НЕ)
банки ~ закон
!
шукати лише зазначену форму слова
!Париж
пробіл або &
логічне І (у межах пропозиції)
фабрика зірок
&&
логічне І (у межах документа)
музика && (фабрика зірок)
|
логічне АБО
малюнок | картинка | фото | колаж
/(n m)
відстань між словами (-назад +вперед)
постачальники /2 кавамузичне /(-2 4) утвореннявакансії ~ /+1 студентів
&&/(n m)
відстань у кроках (-назад +вперед)
банк && /1 податки
( )
груповання слів
(технологія | виготовлення) (сиру | сиру)
Основні положення мови запитів:
Якщо ключові слова є стійким словосполученням або єдиною фразою, то пишіть їх у лапках.
Якщо слова не об'єднані лапками, то кожне слово буде саме по собі і перед кожним з них можна поставити знак плюс «+», якщо слово обов'язково повинно бути в знайдених документах, мінус «-», якщо слово не повинно бути в знайдених документах (пробіл ставиться перед знаком, але не після). Якщо перед словом поставити знак ~ тильда.
Яндекс враховує усі форми слова. Щоб цього не відбувалося, поставте знак оклику перед незмінним словом.
Усі слова, написані через пробіл або знак & (логічне І) повинні одночасно знаходитися в знайдених документах у межах одного словосполучення. Усі слова, написані через && повинні одночасно знаходитися в знайдених документах, але відстань між ними не враховується.
Слова, написані через символ | (логічне АБО) є заміняючими одне одного (синонімами).
Можна вказати відстань між словами.
Для груповання окремих частин запиту використовуйте круглі дужки.
Пошук у зонах і елементах web-сторінки.
Синтаксис пошуку в елементах і зонах
Синтаксис
Призначення
Приклад
$title (вираз)
пошук у заголовку
$title (Яндекс)
$anchor (вираз)
пошук у тексті посилань
$anchor (Яндекс | Апорт)
#keywords=(вираз)
пошук у ключових словах
#keywords=(пошукова система)
#abstract=(вираз)
пошук в описі
#abstract=(искалка | пошук)
#image="значення"
пошук файлу зображення
#image="tort*"
#hint=(вираз)
пошук у підписах до зображень
#hint=(lviv | львів)
#url="значення"
пошук на заданому сайті (сторінці)
#url="www.lp.edu.ua*"
#link="значення"
пошук посилань на заданий URL
#link="www.yandex.ru*"
#mime="значення"
пошук у документах даного (pdf або rtf) типу
#mime="pdf"
Сортування результатів запиту.
Ревалентність – це ступінь відповідності змісту документа пошуковому запитові. Користувач може вплинути на порядок сортування, використовуючи оператори ваги й уточнення запиту. Вага вказується для того, щоб збільшити ревалентність документів, що містять слово або вираз, вага якого зазначена.
Синтаксис: слово:число або (пошуковий_вираз):число Уточнююче слово або вираз застосовується для того, щоб збільшити релеватність документів, що їх містять.
Синтаксис: <- слово або <- (уточнюючий_вираз).
Каталог дозволяє класифікувати ресурси і згрупувати їх по тематиці. Тематичне дерево каталогу Яндекса зроблено максимально простим. На першому рівні в ньому всього сім тем:
Розваги,
Спорт і відпочинок,
Робота і навчання,
Технології
Бізнес,
Будинок і авто,
Сайти Львова
. Тематика каталогу системи Яндекс.
Програми для пошуку інформації в Інтернеті
Copernic 2000 представляє собою класичний приклад програми-робота. Ця програма проста в обігу і одночасно дуже могутня по своїх можливостях. Робот проглядає одноразово безліч пошукових серверів, розбитих на групи (що дозволяє заздалегідь обмежити область пошуку), причому посилання, що повторюються, віддаляються. Результати пошуку виводяться у вікні програми і можуть зберігатися у вигляді html-файлів. Copernic уміє також зберігати знайдені документи на диску для їх подальшого перегляду і проводити пошук серед них.
Search+ призначена для швидкого інтегрованого пошуку необхідної інформації в Інтернеті. Серед плюсів використання Search+ можна виділити мінімізацію завантажуваної інформації, одночасний пошук і проглядання результатів пошуку відразу по декількох серверах, можливість перевірки посилань, розділення пошукових серверів по регіонах, відкритий код визначення пошукових серверів – ви можете самі додавати пошукові машини, багатомовний інтерфейс (англійський – російський – український – німецький-французький). Як недоліки можна відзначити неповне використання всіх можливостей окремо взятого пошукового серверу.
Популярний менеджер завантаження файлів з Інтернету Net Vampire, дозволяє знайти альтернативні адреси для забезпечення виконання існуючого завдання. Він також має нагоду виконати пошук нового файла і, грунтуючись на результатах пошуку, створити нове завдання. Всього пошук здійснюється на 11 пошукових систем, в основному по протоколу FTP, але програма дозволяє знайти розташування файла і в HTTP, використовуючи такі пошукові машини, як Yahoo, Alta Vista або Excite. Вампір не тільки уміє відшукувати потрібні файли, але і може тестувати лінії зв’язку із знайденими архівами, видаючи різноманітну корисну інформацію, що дозволяє вибрати для закачування файла найбільш швидкий сервер.
Виконання лабораторної роботи
Завдання №1
Пошукові сервери Австралії:
1. About Australia - Каталог анотованих посилань на сайти про Австралію, згрупованих по штатах, з можливістю пошуку. Сервер на англійській мові.
2. AAA Matilda - автсралійська найбільша, популярна, міжнародна система. Може вести пошук відразу на декількох пошукових системах (неодночасно). В результаті пошуку подає назву посиланням на сайт, дуже короткий опис, деякі сайти повторюються. На англійській мові доступний сервер.
3. ALIWEB - Australia mirror. Австралійська пошукова система. Пошук може відбуватися по типу сайту, назві, категорії, система обробляє також інформацію телефонів, адрес і т.п. заданой команди. Сервер працює на англійській мові.
4. AltaVista Australia - дана пошукова система дуже тісно відноситися до Австралії, Нової Зеландії. Можна також вести пошук і на російській мові.
5. Anzwers - Австралійський каталог з можливістю пошуку по ключовому слову. Окрім стандартного каталога, на сервері зроблені, додатково, спеціальні пошукові машини для пошуку машин, запчастин, E-mail адрес, і мн.др. Каталог працює на англійській мові.
6. AusIndex - Австралійська пошукова система з невеликим каталогом і великим інформаційно-новинним змістом Australian News Headlines і World News Headlines. Система працює на англійській мові.
7. BabyOIL - resource discovery system - сервер провадить пошук серед популярних і відомих ресурсів Інтернет: www, люди, тeх репортeр, онлайн документи і ін. Сервер доступний на англійській мові.
Завдання №2
Знайти основні поняття і визначення факторного аналізу.
Факторний аналіз — статистичний метод аналізу впливу окремих факторів (чинників) на результативний показник.
Факторний аналіз використовується для комплексного аналізу господарської діяльності, пошуку і класифікації факторів, що впливають на економічні явища і процеси, з виявленням причинно-наслідкових зв'язків, що впливають на зміну конкретних показників господарської діяльності.
Завдання № 3.
Пошукові системи Німеччини:
AcoonAladin
Allesklar
AltaVista
AOL NetFind
Business-suchdienst
Columbus-Finder
CrawlerDasi
Eule
Ecxite
Fireball Hit-net
InfoSeek
Lycos
Netseek
Yahoo!
Spider Web-Archiv
Web.de
Flix
InterSearch
Schleswig-holstein
Branchenbuch Gelbe Seiten
Електронні перекладачі:
http://deshevshe.ua/translator.html
http://003.kiev.ua/list/5700_0.html
http://icity.lutsk.ua/index.php?categoryID=916
Завдання №4
Висновок:
На мою думку, пошукова система є кращим методом пошуку інформації в Інтернеті, я отримав бажаний результат за дуже короткий час. Використання пошукової системи під час роботи не склало для мене зайвих труднощів. Програми для пошуку інформації в Інтернеті потребують більше часу і, на мою думку, є складніші у експлуатації, отримати бажаний результат, а саме відповідь на питання, для мене було складніше і зайняло більше часу. Я вважаю хорошим методом пошуку інформації тоді, коли за малу тривалість часу я отримаю необхідну інформацію.