Лабораторная работа №6
Тема: Поиск информации в глобальной сети Интернет.
Цель работы: Сформированность у учащихся умение находить информацию в гдобальной
сети интернет с использованием поисковых систем
Теоретическая часть
Поиск информации в Интернете осуществляется с помощью специальных программ,
обрабатывающих запросы — информационно-поисковых систем (ИПС). Существует
несколько моделей, на которых основана работа поисковых систем, но исторически две
модели приобрели наибольшую популярность — это поисковые каталоги и поисковые
указатели. Поисковые каталоги устроены по тому же принципу, что и тематические
каталоги крупных библиотек. Они обычно представляют собой иерархические
гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса
которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением
темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы
лично просматривают информационное пространство WWW, отбирают то, что по их
мнению представляет общественный интерес, и заносят в каталог Основной проблемой
поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW.
Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения
базы данных поисковой системы необходимо исключить человеческий фактор — работа
должна быть автоматизирована.
Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов
клиентов выполняют поисковые указатели. Работу поискового указателя можно
условно разделить на три этапа:
сбор первичной базы данных. Для сканирования информационного
пространства WWW используются специальные агентские программы — черви,
задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе
данных;
индексация базы данных — первичная обработка с целью оптимизации
поиска. На этапе индексации создаются специализированные документы —
собственно поисковые указатели;
рафинирование результирующего списка. На этом этапе создается список
ссылок, который будет передан пользователю в качестве результирующего.
Рафинирование результирующего списка заключается в фильтрации и ранжировании
результатов поиска. Под фильтрацией понимается отсев ссылок, которые
нецелесообразно выдавать пользователю (например, проверяется наличие
дубликатов). Ранжирование заключается в создании специального порядка
представления результирующего списка (по количеству ключевых слов,
сопутствующих слов и др.).
В России наиболее крупными и популярными поисковыми указателями являются:
«Яndex» (www.yandex.ru)
«Pамблер» (www.rambler.ru)
«Google» (www.google.ru)
«Апорт2016» (
www.aport.ru
)
Достарыңызбен бөлісу: |