Лекция 2 - ЭУМК по Информатике - UNREGISTERED VERSION

Перейти к контенту

Главное меню:

Лекция 2

Раздел 5. Телекоммуникационные технологии > Тема 5.2. Методы создания и сопровождения сайта

Лекция 2 (3 часа).
Пример поиска информации на государственных образовательных порталах. Программные поисковые сервисы.
Использование ключевых слов, фраз для поиска информации.

Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы информационно-поисковых систем (ИПС).
Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность
это поисковые каталоги и поисковые указатели.
Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог.
Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор
работа должна быть автоматизирована.
Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели. Работу поискового указателя можно условно разделить на три этапа:
1) сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы
черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;
2) индексация базы данных
первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы собственно поисковые указатели;
3) рафинирование результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска.


Парадокс интернета:
вероятность существования нужной информации возрастает, а возможность ее нахождения уменьшается;
гипертекстовая природа WWW обеспечивает нахождение любой информации в процессе целенаправленного продвижения по ссылкам;
период удвоения числа документов в интернете
не более 3 8 месяцев, и найти нужное в этом пространстве, продвигаясь просто от ссылки к ссылке, практически невозможно.
Информационный поиск
действия, методы и процедуры, позволяющие осуществлять отбор определенной информации из массива данных.
Пользователь информации
субъект информационных отношений, получающий, распространяющий и (или) предоставляющий информацию, реализующий право на пользование ею.
Потребитель (пользователь) информации
субъект, обращающийся кинформационной системе или к посреднику за получением необходимой емуинформации и пользующийся ею.
Поиск информации
одна из самых востребованных на практике задач, которую приходится решать любому пользователю интернета.
Способы поиска:
с помощью адреса Web-страницы;
с помощью поиска по гиперсвязям;
с помощью поисковых программ.
Типы поиска в интернете:
поиск «бытовой», «любительской» информации (это могут быть сведения о погоде, расписания движения самолетов, сведения о результатах спортивных состязаний, текущие политические новости и многое другое);
профессионально-ориентированный или широкий информационный поиск;
поиск справочной информации;
поиск текущей профессиональной информации;
поиск мест хранения информации;
поиск ресурса по неполным данным о нем.
Методы поиска в интернете:
Сплошной. При сплошном методе пользователь для осуществления поставленной задачи обследует сплошь и без пропусков все наличие имеющихся пособий и источников.
Индуктивный. Индуктивный метод в широком смысле слова
это форма мышления, посредством которой мысль наводится (от лат. inductio наведение) на какое-либо общее правило, общее положение, присущее всем единичным предметам какого-либо класса.
Дедуктивный. Содержанием дедукции, как метода познания, является использование общих положений при исследовании конкретных явлений.
Метод ассоциативной индексации определяется как «... механизм, благодаря которому любой элемент информации может служить отправной точкой для немедленного автоматического выбора (пользователем) любого другого элемента информации».
Метод навигации. Навигацией называется интерактивно управляемый пользователем процесс перемещения из одних узлов в другие, технически осуществляемый путем нажатия мышью на графически выделенные на экране компьютера объекты
«электронные» кнопки, идентифицирующие исходные точки дуг гипертекста.
Броузинг (browse)
процесс беглого просматривания гипертекстовых документов или гипертекстовой базы данных с целью поиска определенных сведений или просто чего-нибудь любопытного; в общем смысле действий, целью которых является изучение информации, но не ее изменение.
Поиск информации - задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку, были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Обширные возможности для работы с большими массивами информации дают поисковые сервисы Interner.
При наличии первичных сведений по теме поиска, документы можно разыскивать поисковых системах. При этом следует различать приемы простого, расширенного, контекстного и специального поиска.
Под простым поиском понимается поиск Web-ресурсов по одному или нескольким ключевым словам. Недостаток простого поиска заключается в том, что обычно он выдает слишком много документов, среди которых трудно выбрать наиболее подходящие.
При использовании расширенного поиска ключевые слова связывают между собой операторами логических отношений. Расширенный поиск применяют в тех случаях, когда приемы простого поиска дают слишком много результатов. С помощью логических отношений поисковое задание формируют так, чтобы более точно детализировать задание и ограничить область отбора, например по дате публикации или типу данных.
Контекстный поиск
это поиск по точной фразе. Он удобен для реферативного поиска информации, но доступен далеко не во всех поисковых системах. Прежде всего, чтобы обеспечивать такую возможность, система должна работать не только индексированными файлами, но и с полноценными образами Web-страниц. Эта операция достаточно медленная, и ее выполняют не все поисковые системы.
Специальный поиск применяют при розыске Web-страниц, содержащих ссылки на заданные адреса URL, содержащих заданные данные в служебных полях, например в поле заголовка и т. п.
Расширенный поиск. Кроме средства простого поиска обычно поисковые службы предоставляют средства расширенного поиска. Эти средства позволяют более точно формулировать поисковое задание, но требуют определенного опыта и работают заметно медленнее. В большинстве поисковых систем команды расширенного поиска формируются с помощью логических команд. Удобство использования логических команд в частности связано с тем, что команды простого поиска у многих поисковых систем реализованы по-разному. Каждая система стремится сделать средства простого поиска наиболее удобными, а средства расширенного поиска
наиболее стандартными. Тем не менее, для обозначения логических операторов в различных поисковых системах используются разные обозначения. Поэтому желательно перед осуществлением расширенного поиска желательно изучить синтаксис поисковых запросов выбранной поисковой системы.
Рассмотрим подробнее операторы логических отношений (логические команды).
Логическая оператор OR (ИЛИ) служит для формирования поискового запроса, если искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором. Этот оператор в различных поисковых системах может обозначаться одним из следующих способов: | ; OR; ИЛИ.
Например, результат запроса «Чёрное OR море» - будет представлен списком ссылок на документы, в которых есть слово «Чёрное», или слово «море», или оба этих слова вместе.
В некоторых поисковых системах, как отмечалось выше, по умолчанию ключевые слова в запросе связаны именно этим логическим отношением.
С помощью логического оператора AND (И) осуществляется поиск документов, содержащих все термины, соединенные данным оператором. Этот оператор может обозначаться одним из следующих способов: +; AND; &; И.
Например, по запросу
«Чёрное AND море» - будут найдены документы, в которых содержатся слова «черное» и «море».
Логической оператор NOT (HE) позволяет производить поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором. Этот оператор может обозначаться одним из следующих способов: not; !; ~; НЕ.
Например, по запросу
«Чёрное NOT море», результат - документы, в которых есть слово «Чёрное» и нет слова «море».
С помощью логических операций можно создавать достаточно сложные запросы. Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируется по операторам AND и NOT, и лишь потом по операторам OR. Например, по запросу «Чёрное AND море OR Крым» будут найдены документы, либо содержащие обязательно слова: «Чёрное» и «море», либо слово «Крым», либо все три слова.
Изменить порядок группировки можно использованием скобок. Оператор, стоящий в скобках, будет выполняться в первую очередь Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов. Так по запросу «Чёрное AND (море OR Крым)» будут найдены документы, в которых обязательно содержится слово «Чёрное» и одно из двух слов «море» или «Крым».
С помощью вложенных запросов можно значительно ограничивать область отбора, освобождая результирующий список от ненужных ссылок. Так, например, если нас интересует информация об отдыхе на юге на море, но исключительно на российском побережье, то можно попробовать использовать примерно такой запрос
«отдых AND ((Азовское OR Чёрное) AND море) NOT (Крым OR Турция OR Болгария)».
Использование круглых скобок для управления порядком исполнения задания на поиск разрешается большинством крупнейших поисковых систем.


 
 
Назад к содержимому | Назад к главному меню