Міністерство освіти та науки України
Національний університет «Львівська політехніка»
/
ЗВІТ
З лабораторної роботи №7
з дисципліни:«Глобальні інформаційні мережі»
на тему:
«Пошукові системи. Інтелектуальні сервіси»
Львів 2014
Порядок роботи
Ознайомитися з теоретичними засадами веб-пошуку.
Уважно ознайомитися з інтерфейсами пошукових систем.
Здійснити тестовий пошук в різних системах і проаналізувати отримані результати.
Здійснити пошук картинок в різні способи (за описом та за зображенням) і проаналізувати отримані результати.
Здійснити голосовий пошук і проаналізувати отримані результати.
Зробити висновки стосовно втілення інтелектуальних технологій в сучасний пошук.
Втілити на тестову сторінку різні АРІ від пошукових систем. Оцінити їх зручність та можливості адаптації під дизайн сторінки.
Етапи виконання роботи:
Повнота - це відношення кількості знайдених за запитом документів до загальної кількості документів в Інтернет, що задовольняють даному запиту. Наприклад, якщо в Інтернеті є 100 сторінок, що містять словосполучення «Як вибрати автомобіль», а за відповідним запитом було знайдено всього 60 з них, то повнота пошуку буде 0,6. Очевидно, що чим повніше пошук, тим більше ймовірність, що користувач знайде потрібний документ.
Точність визначається ступенем відповідності знайдених документів до запиту користувача. Наприклад, якщо за запитом «Як вибрати автомобіль» знаходиться 100 документів, у 50 з них міститься словосполучення «Як вибрати автомобіль», а в інших просто наявні ці слова («як правильно вибрати магнітолу і встановити в автомобіль»), то точність пошуку вважається рівної 50/100 (= 0,5). Чим точніше пошук, тим швидше користувач знайде документи, що відповідають запиту і тим менше різного роду «сміття» серед них буде зустрічатися.
Актуальність характеризується часом з моменту публікації документів в Інтернет, до їх занесення до бази пошукової системи. Наприклад, на наступний день після появи цікавої новини, велика кількість користувачів звернеться до пошукових систем з відповідними запитами. Об'єктивно з моменту публікації новинної інформації на цю тему минуло менше доби, однак основні документи вже було проіндексовано і доступно для пошуку, завдяки існуванню у великих пошукових систем так званої «швидкої бази», яка оновлюється кілька разів на день.
Швидкість пошуку тісно пов'язана з стійкістю системи до навантажень. В робочі години до пошукових систем може надходити сотні запитів в секунду.
Наочність представлення результатів є важливим компонентом зручного пошуку. До популярних запитів пошукова машина знаходить сотні, а то й тисячі документів. Внаслідок нечіткості складання запитів або неточності пошуку, навіть перші сторінки видачі не завжди містять лише потрібну інформацію. Це означає, що користувачеві часто доводиться здійснювати додатковий пошук всередині знайденого списку. Орієнтуватися в результатах пошуку допомагають різні елементи сторінки видачі пошукової системи.
Ключові особливості пошуку Google
«Алгоритми пошуку Google постійно змінюються і удосконалюються для отримання результатів найвищої якості. Подаємо кілька найбільш знаменних розширень і поліпшень з появи індексування сторінок:
Backrub (вересень 1997) - пошукова машина, яка працювала на серверах Стенфордського університету майже два роки, що отримала назву Google. Її основа - ранжування сторінок в залежності від кількості та якості зовнішніх посилань - було великим технічним досягненням.
Новий алгоритм (серпень 2001) - пошуковий алгоритм був повністю реорганізований, щоб спростити додавання нових факторів ранжирування.
Аналіз взаємозв'язків (лютий 2003) - перша запатентована особливість Google, яка ранжирує понад високо ті сайти, на які посилаються більш авторитетні джерела.
Fritz (літо 2003) - це поліпшення дозволяє Google модернізувати індексацію в будь-який момент, а не тільки великими блоками оновлень.
Персоналізовані результати (червень 2005) - користувачі можуть дозволяти Google відслідковувати історію їхнього пошуку для забезпечення персоналізованих результатів.
Bigdaddy (грудень 2005) - оновлення машини дозволило більш повну індексацію мережі інтернет.
Універсальний пошук (травень 2007) - новий універсальний пошук, побудований на пошуку картинок, новинах Google і пошуку по книгам дозволив користувачам отримувати інформацію, представлену в різному вигляді на єдиній сторінці результатів пошуку.
Пошук в режимі реального часу (грудень 2009) - відображає результати з Twitter та блогів відразу після публікації.
Історія алгоритму Google починається з введення індексу цитування сторінок, системи, винайденої в 1997 році співзасновником Google Ларрі Пейджем під час навчання в Стенфорді. Що стало легендарним осяяння Пейджа полягало в ранжируванні сторінок в залежності від кількості та важливості посилань, ведучих на них. Таким чином використовувався колективний розум мережі інтернет для визначення релевантності сайтів. Ця концепція проста і володіє широкими можливостями, і, оскільки Google швидко став найуспішнішою пошуковою машиною в інтернеті, Пейдж і Сергій Брін, другий засновник Google, розцінюють індекс сторінок як фундаментальну інновацію їх компанії.
На даному етапі я ознайомився із інтерфейсом двох найбільш популярних пошукових систем. Додаткові налаштування дають можливість здійснити настройку пошуку для комфортної роботи в Інтернеті.
//
В даному пункті я здійснив пошук зображення за його описом. На відміну від Яндекс, Google автоматично дописує в рядок пошуку найбільш точне припущення щодо зображення, а також візуально подібні зображення. А Яндекс – тільки це зображення, з різним вибором розширення для картинки.
//
Одним із завдань – втілити різні API від пошукових систем. З Яндекс не було жодних проблем.
Я добавив на сайт кнопки «Поділитися»: а ось із API-додатками від Google були такі проблеми:
/ /
Код для вставки «Поділитися»:
<script type="text/javascript" src="//yastatic.net/share/share.js" charset="utf-8"></script><div class="yashare-auto-init" data-yashareL10n="ru" data-yashareQuickServices="vkontakte,facebook,twitter,odnoklassniki,moimir" data-yashareTheme="counter">
Висновок: Виконуючи дану лабораторну роботу я дізнався більше про дві провідні пошукові системи Яндекс та Google. Основною метою пошукової системи Google є забезпечення швидкого і якісного пошуку потрібної інформації. Пошуковик радикально відрізняється від більшості сайтів в мережі, успіх яких визначається тим, як довго користувачі залишаються на сайті. Розробники постійно контролюють якість внесених змін, проводиться велика кількість тестів, які доступні для невеликої спільноти користувачів, які оцінюють ефективність пошуку. Експериментальна методологія дозволяє досліджувати широкий спектр можливостей і впроваджувати лише оптимальні з них.
Яндекс — пошукова машина, яка здатна на запит відвідувача знайти найбільш відповідні веб-сторінки, новини, зображення, статті енциклопедій чи товари, відповісти на запитання про погоду чи культурні події.
Яндекс не вимагає знання спеціальних команд для пошуку. Правильний запит складається з кількох слів, оскільки за одним словом зазвичай важко зрозуміти, що хоче знайти відвідувач. Яндекс добре розуміє запити з кількох слів і здатний самостійно їх інтерпретувати.