Міністерство Освіти і Науки України
Національний Університет «Львівська Політехніка»
Інститут комп’ютерних технологій автоматики та метрології
Кафедра Захисту інформації
Звіт
Про виконання лабораторної роботи № 3
ВИВЧЕННЯ ПОШУКОВИХ СИСТЕМ І ПРОГРАМ ДЛЯ ЗНАХОДЖЕННЯ ІНФОРМАЦІЇ В ІНТЕРНЕТІ
З курсу «Робота в Інтернеті»
Львів 2010
Мета: ознайомлення з пошуковими системами і програмами для пошуку інформації в Інтернеті, вивчення проблем пошуку та здійснення пошуку по ключовим словам й каталогам, пошук у зонах і елементах web-сторінки.
Короткі теоретичні відомості
У мережі Internet знаходяться мільярди Web-сторінок, терабайти інформації в різних файлах, але вся проблема в тому, що для одержання потрібної інформації необхідно вказати її точну адресу – URL. Саме цю адресу нам і потрібно знайти в першу чергу. Як Ви пам'ятаєте, адреса URL складається з доменного імені (або IP-адреси), шляху до файлу й імені файлу.
Якщо ми знайдемо такий URL, то без проблем введемо його в адресний рядок програми Internet Explorer і побачимо потрібну Web-сторінку, або скачаємо файл.
У мінімальному варіанті нам необхідно знати хоча б доменне ім'я ресурсу, а потім, переходячи по гіперпосиланнях, ми зможемо добратися до потрібної нам інформації.
Як знайти адресу (URL)? Існує декілька способів. Найпростіший спосіб – це побачити доменні імена в різних рекламних матеріалах. В даний час будь-яка поважаюча себе фірма, у тому числі будь-яке видавництво книг, журналів, редакції телеканалів мають свою адресу в Internet і звичайно вказують її на упаковках, у книгах, журналах, в ефірі телепрограм. Як правило, вказується коротка адреса, що складається лише з доменного імені, щось на зразок: http://www.ukr.net або ще коротше: www.ukr.net.
Але як бути, якщо адреса зовсім невідома? Наприклад, Вам необхідно знайти розклад потягів, але, швидше за все, Ви зовсім не знаєте по якій адресі його можна знайти. Так буває дуже часто і часом на пошук інформації іде до половини часу роботи в Internet. Отже, нам необхідно знайти URL або хоча б доменне ім'я ресурсу. Для цього звернемося до сховищ таких адрес, до спеціальних пошукових систем. Пошукові системи (пошукові каталоги, пошукові сервери) виконані у виді Web-сторінок, але на цих сторінках розташовується не інформація як така, а анотовані посилання на інші ресурси (сторінки, сайти).
Для виклику пошукової системи необхідно в адресному рядку програми Internet Explorer вказати її адресу. Пошукових систем у мережі Internet зараз досить багато. У таблиці 1 нижче перераховані лише найбільш популярні пошукові системи. Звичайно, у російськомовних системах міститься більше посилань на російськомовні ресурси, а в англомовних – на англомовні, тому пошук російськомовних ресурсів краще здійснювати в російськомовних пошукових системах.
Таблиця 1
Найменування
Адреса
Яндекс (рос.)
http://www.yandex.ru
Rambler (рос.)
http://www.rambler.ru
Апорт (рос.)
http://www.aport.ru
Google (укр.)
http://www.google.com.ua
Meta (укр.)
http://www.meta.ua
Yahoo!(англ.)
http://www.yahoo.com
AltaVista (англ.)
http://www.altavista.com
InfoSeek (англ.)
http://www.infoseek.com
Як працює пошукова система? Перший етап роботи пошукової системи – це індексування інформації, що знаходиться в Internet. Мережевний робот пошукової системи переглядає величезну кількість сторінок і заносить адреси і короткий зміст цих сторінок до себе в базу даних, точніше в пошуковий індекс. Власники сайтів будуть дуже раді, якщо їх сайт перегляне мережевий робот. Для того, щоб робот обов'язково переглянув сайт і вніс його в пошуковий індекс, власники самі реєструють свої сайти в пошуковій системі (як правило, у декількох пошукових системах). Процес занесення адреси й описи сторінки в пошукову систему називається індексація.
Таким чином, коли Ви запитаєте пошукову систему про те, де знаходиться розклад потягів, вона не буде шукати цю інформацію у величезній мережі Internet, а всього лиш шукатиме у своєму заздалегідь підготовленому пошуковому індексі, причому зробить це дуже швидко.
Зрозумілим є те, що другий етап роботи пошукової системи – це видача накопиченої і відібраної, відсортованої і класифікованої інформації згідно запитів користувачів. Далі буде детально розглянута робота одного з найбільш популярних пошукових систем – Яндекс.
Завдання
Завдання № 1. Знайти популярні пошукові сервери Польщі та Норвегії.
Завдання № 2. Знайти відповіді на наступні запитання:
Коли була створена і хто був першим президентом Національної Академії наук України.
Знайти маршрут руху трамваїв м. Львова.
Завдання № 3. Користуючись розширеним пошуком знайти пошукові системи, які знаходяться в доменах .com, .ru та .net.
Завдання № 4. Здійснити пошук відповіді на запитання, які подані в завданні № 2, але використовуючи програми для пошуку інформації в Інтернеті Copernic.
1. Польщі:
OnetІнформаційно-пошуковий сайт Польщі. Каталог ресурсів, пошук за ключовими словами. Окрім пошуку по змісту директорії можна скористатись базой даних E-mail, базой даних по фірмах. Маса додаткового інформаційного сервісу -- погода, курси валют, гороскоп тощо.
Czas na LinksКаталог польських інтернет-ресурсів. Розгорнута класифікація першого рівня, докладні описи, пошук за ключовими словами. Загалом понад 21.500 лінків.
Polish WorldДиректорія польських ресурсів, навігація по категоріях, пошук за ключовими словами, додаткові інтернет-сервіси, наприклад база даних польських інтернет-адрес. Корисне посилання до інших пошукових ресурсів Польщі тут.
Wirtualna PolskaБагаторівневий каталог ресурсів з можливістю швидкого пошуку по реферативних описах. Надає потужний додатковий пошуковий та інформаційний сервіс (програми телебачення, погода, курси валют, пошук фірми тощо).
WOW!Ще один каталог польських ресурсів, навігація по багаторівневому рубрикатору, пошук за ключовими словами.
Poland on the Net Приголомшуюча можливостями настройки пошуку повнотекстова пошукова машина. Це треба побачити! Підтримуються версії польською та німецькою мовами.
AltaVistaПольська AltaVista.
Katalog FirmКаталог польських фірм. Шукати можна по назві фірми, обмежуючи під час цього область пошуку категорією (областю діяльністі), продукцією, а також теріторіальним розташуванням - по містах. Пошук ведеться за ключовими словами польською мовою. Результати представляються у вигляді таблиці - назва фірми, географічна адреса, телефон, факс, якщо є - електронна пошта та URL, а також стисла анотація діяльності.
Polish Yellow PagesЖовті сторінки Польщі. Окрім довідника -- web-каталог та додаткова бізнес-інформація. Версія англійською мовою тут.
Норвегії:
KvasirБагаторівневий каталог ресурсів з можливістю пошуку за ключовими словами, а також повнотекстова пошукова машина (індекс містить 11.000.000 документів). Пошук по каталогу ведеться по 54.749 описах у 600 категоріях. Окрім пошуку у каталозі та в індексній базі пошуку можна перенаправити запит до Alta Vista або пошукати по URL. Підтримується рейтинг 30 найпопулярніших запитів.
LetiІнформаційно-пошуковий сервер Норвегії. Багаторівневий каталог інтернет-ресурсів, можливість пошуку по реферативних описах. Передбачена можливість обмежити область пошуку окремим регіоном та ще декількома параметрами. Корисний сервіс -- лінк-центр, посилання до провідних сайтів Нідерландів. Крім цього новини, форма перенаправлення запитів до провідних пошукових систем світу.
ManvitПошукова машина, декілька форм представлення результатів та параметрів пошуку. Англійська версія пошукового інтерфейсу тут.
OrigoЩе одна повнотекстова пошукова машина. Дві області пошуку: по всьому www Норвегії та по сайту. Можна також задати кількість посилань на сторінці результатів. На першій же сторінці наведено довідник щодо мови запитів.
Yahoo!Представництво порталу Yahoo! у Норвегії.
FASTНорвежська пошукова машина із світовим обсягом.
Gule Sider Жовті сторінки Нідерландів.
2.
(1) Назва Академії неодноразово зазнавала змін. У 1918—1921 рр. вона іменувалася Українська академія наук (УАН), з 1921 по 1936 р. — Всеукраїнська академія наук (ВУАН), у 1936—1991 рр. — Академія наук Української РСР, з 1991 по 1993 р. — Академія наук України, а з 1994 р. — Національна академія наук України.
Володимир Вернадський - перший президент УАН.
(2) Примітка. Першими та останніми вказані назви кінцевих зупинок.
№ 1 (маршрут тимчасово змінено) Головний залізничний вокзал – вул. Чернівецька (приміський залізничний вокзал) – вул. С. Бандери – вул. Коперника – вул. Дорошенка – пл. Ринок – вул. Руська – вул. Підвальна – вул. Винниченка – вул. І. Франка – вул. Вітовського – вул. Котляревського – вул. Київська – вул. С. Бандери – вул. Чернівецька (Приміський залізничний вокзал) – Головний залізничний вокзал.
Трамвай №1 зарах курсує так: Головний залізничний вокзал – вул. С. Бандери – вул. Дорошенка – вул. І. Франка – вул. Мушака та у зворотньому напрямку.
№ 2 (маршрут тимчасово не курсує) вул. Коновальця – вул. Чупринки – вул. Коперника – вул. Дорошенка – пл. Ринок – вул. Руська – вул. Підвальна – вул. Личаківська – вул. Личаківська.
На час ремонту вулиці. Генерала Чупринки запроваджено маршрут №2-А – вул. Личаківська – вул. Дорошенка – вул. Коперника – вул. С. Бандери – вул. Чернівецька (приміський залізничний вокзал) – головний залізничний вокзал.
№ 3 вул. Княгинi Ольги – вул. Сахарова – вул. Вітовського – вул. І. Франка – площа Соборна.
№ 4 вул. Ю. Мушака – вул. Свєнціцького – вул. І. Франка – вул. Винниченка – вул. Підвальна – вул. Гонти – вул. Замарстинівська.
№ 5 вул. Замарстинівська – вул. Гонти – вул. Підвальна – вул. Винниченка – вул. І. Франка – вул. Вітовського – вул. Сахарова – вул. Княгині Ольги.
№ 6 (маршрут тимчасово змінено) Головний залізничний вокзал – вул. Чернівецька – вул. Городоцька – площа Осмомисла – вул. Замарстинівська – вул. Гайдамацька – вул. Б. Хмельницького – вул. Промислова – вул. Липинського.
Трамвай № 6 тимчасово курсуватиме так: вул. Липинського – вул. Підвальна – вул. І. Франка – вул. Сахарова – вул. Кн. Ольги та у зворотньому напрямку.
№ 7 (маршрут тимчасово змінено) вул. Шевченка – вул. Городоцька – площа Осмомисла – вул. Гонти – вул. Підвальна – вул. Личаківська – вул. Мечникова – вул. Левицького – вул. А. Вахнянина.
На час ремонту площі Торгової трамвай №7 курсує так: вул. Замарстинівська – вул. Гонти – вул. Підвальна – вул. Личаківська – вул. Мечникова – вул. Левицького – вул. А. Вахнянина.
№ 8 (маршрут тимчасово не курсує) вул. А. Вахнянина – вул. Левицького – вул. Мечникова – вул. Личаківська – вул. Винниченка – вул. І. Франка – вул. Вітовського – вул. Сахарова – вул. Княгині Ольги.
№ 9 (маршрут тимчасово не курсує) Головний залізничний вокзал – вул. Чернівецька (приміський залізничний вокзал) – вул. С. Бандери – вул. Київська – вул. Котляревського – вул. Вітовського – вул. І. Франка – вул. Винниченка – вул. Підвальна – вул. Руська – площа Ринок – вул. Дорошенка – вул. Коперника – вул. С. Бандери – вул. Чернівецька (приміський залізничний вокзал) – головний залізничний вокзал.
№ 9А (маршрут тимчасово не курсує) Головний залізничний вокзал – вул. Чернівецька (приміський залізничний вокзал) – вул. С. Бандери – вул. Київська – вул. Котляревського – вул. Вітовського – вул. І. Франка – площа Соборна.
3.
www.yandex.ru www.aport.ru www.rambler.ru www.punto.ru www.filesearch.ru www.go.mail.ru www.lycos.ru www.adclick.ruwww.mnogosearch.ruwww.crack.ru www.radioweb.ru www.netoteka.ru archangelsk.ru www.lupa.ru www.sherlook.ruwww.subs.ru www.openweb.ru www.medialingua.ru/
www.altavista.com/www.excite.com/ www.infoseek.com/ www.lycos.com/www.search.interrussia.com/ www.uaportal.com www.ay.com.ua www.meta-ukraine.com www.topping.com.ua www.brama.com www.yahoo.com www.excite.com www.webcrawler.com
www.qp.dp.ua/ www.euroseek.net/windex.daci.net/el.visti.net/ holms.ukrnet.net/www.meta.kharkiv.net/www.bigmir.net
4. (1)
(2)
Висновок:
На даній лабораторній роботі я ознайомився з пошуковими системами і програмами для пошуку інформації в Інтернеті, вивчив проблем пошуку та здійснення пошуку по ключовим словам й каталогам, пошук у зонах і елементах web-сторінки.