Эффективный поиск информации реферат по

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ

МУНИЦИПАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ПЕТРЯКСИНСКАЯ СРЕДНЯЯ ОБЩЕОБРАЗОВАТЕЛЬНАЯ ШКОЛА

РЕФЕРАТ

по теме:

«Поиск информации в Интернете»

Выполнила: ученица 10 класса

Матвеева Д. А

Учитель: Айнетдинова Х. А

Петряксы

2015г.

Содержани

Введение 3

Поисковые системы общего назначения 4

Типология методов поиска 5

Специализированные поисковые системы 7

Заключение 10

Список литературы 11

Введение

Основная задача Интернет – предоставление необходимой информации. Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки, стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей – проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По различным данным, в 2004 г. количество пользователей глобальной системы Интернет составило от 600 до 900 миллионов человек. Это число продолжает стремительно расти и уже в 2014 г. оно достигло
3 миллиарда человек. Сегодня глобальная сеть превращается в важный социальный и политический фактор современного информационного общества. С развитием Интернет-технологий появился новый гигантский источник информационных ресурсов, доступ к которым является не только относительно дешевым, но и очень быстрым.

Поисковые системы общего назначения

Поисковые системы общего назначения являются базами данных, содержащим тематически сгруппированную информацию об информационных ресурсах Всемирной паутины. Такие поисковые системы позволяют находить Web-страницы по ключевым словам в базе данных или путем поиска в иерархической системе каталогов.

Интерфейс таких поисковых систем общего назначения содержит список разделов каталога и поле поиска. В поле поиска пользователь может ввести ключевые слова для поиска документа, а в каталоге выбрать определенный раздел, что сужает поле поиска и таким образом ускоряет его.

Заполнение баз данных осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web-серверы Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адреса документов.

Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются старые, меняются их URL-адреса и так далее), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отличаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не существующего или перемещённого документа.

В целях обеспечения большего соответствия между содержанием базы данных поисковой системы и реальным состоянием Интернета большинство поисковых систем разрешают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит URL-адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт. Сайты в базе данных ранжируются по количеству их посещений в день, неделю или месяц. Посещаемость сайтов определяется с помощью специальных счетчиков, которые могут быть установлены на сайте. Счетчики фиксирует каждое посещение сайта и передают информацию о количестве посещений на сервер поисковой системы.

Поиск по ключевым словам. Поиск документа в базе данных поисковой системы осуществляется с помощью введения запросов в поле поиска. Простой запрос содержит одно или несколько ключевых слов, которые являются главными для этого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и так далее. Через некоторое время после отправки запроса поисковая система вернет аннотированный список URL-адресов документов, в которых были найдены указанные ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на документ ссылку. Если ключевые слова были выбраны неудачно, то список URL-адресов документов может быть слишком большим (может содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы.

Наиболее мощными поисковыми системами общего назначения в русскоязычной части Интернета являются серверы Rambler (http://www.rambler.ru), Апорт (http://www.aport.ru), Яндекс (http://www.yandex.ru), Сервер Yahoo (http://www.yahoo.com).

Типология методов поиска

Более или менее серьезный подход к любой задаче начинается с анализа возможных методов ее решения. Поиск информации в Интернете может быть произведен по нескольким методам, значительно различающимся как по эффективности и качеству поиска, так и по типу извлекаемой информации. В ряде случаев приходится использовать весьма трудоемкие – результат того стоит. Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации друг с другом:

1. Непосредственный поиск с использованием гипертекстовых ссылок.

Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера. Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей более 60 млн. узлов, “ручной” просмотр Web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, когда механическое “копание” уступает место более глубокому анализу. Использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников также относится к этому виду поиска.

2. Использование поисковых машин. Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов сети, подлежащих детальному рассмотрению.
Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса.

3. Поиск с применением специальных средств. Этот полностью автоматизированный метод может оказаться весьма эффективным для проведения первичного поиска. Одна из технологий этого метода основана на применении специализированных программ-спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию. Фактически это автоматизированный вариант просмотра с помощью гипертекстовых ссылок, описанный выше (поисковые машины для построения своих индексных таблиц используют похожие методы). Нет нужды говорить, что результаты автоматического поиска обязательно требуют последующей обработки.
Применение данного метода целесообразно, если использование поисковых машин не может дать необходимых результатов (например, в силу нестандартности запроса, который не может быть адекватно задан существующими средствами поисковых машин). В ряде случаев этот метод может быть очень эффективен. Выбор между использованием спайдера или поисковых серверов являет собой вариант классического выбора между применением универсальных или специализированных средств.

Специализированные поисковые системы

С появлением cистем пользовательского поиска от Google (Google Custom Search Engine) специализированные поисковые системы стали появляться как грибы после дождя. В чем же их преимущества перед обычными поисковыми системами? По сути оно только одно, но весьма весомое – если искать информацию по какой-то узкой теме в специализированной поисковой системе, выдача, которая получается в результате запроса, будет гораздо более чистой – не придется отсеивать десятки, а то и сотни ссылок рекламного характера и прочего мусора.

Небольшой список специализированных поисковых систем:

beeMP3 – специализированный поисковые системы по музыке. Можно искать по альбому, исполнителю, песне или всему сразу. У beeMP3 достаточно интересна организована выдача — сразу получаются ссылки на конкретный файл (а не на страницу с ним). Кроме того, наведя курсор мышки на ссылку, можно узнать жанр песни, альбом, год выпуска, битрейт и др.

Tagoo – русскоязычная специализированная поисковая система по музыке

keeperweb.com – специализированная медиа поисковая системы по mp3 музыке, кино, клипам, мелодиям для мобильных телефонов и много другого.

FindSounds – поиск звуковых эффектов и музыкальных сэмплов. В отличие от других мультимедийных поисковых систем, которые ищут песни, радиопередачи и тому подобное, FindSounds ищет только простые звуки и короткие отрывки.

eBdb – поиск электронных книг.

poiskknig.ru – поиск электронных книг, свободно распространяемых в Интернете.

WikiPoisk – поиск по энциклопедиям.

Qwika – специализированныя поисковая система, предназначенная для работы с онлайновой энциклопедией Wikipedia. Является единственной в мире поисковой системой, индексирующей информацию, полученную посредством систем автоматического перевода.

Scirus – поисковая система для ученых, ищет web-страницы с научным содержанием (ищет и русскоязычные сайты): сайты университетов, библиотек и т.д.

ILIGENT – поиск информации на бизнес-сайтах. Для поиска доступны материалы по маркетингу, менеджменту, бухгалтерскому учету, финансам, управлению кадрами предприятия, законодательству. Результаты поиска разделены на 9 типов информации: материалы (статьи), новости, словари, сообщения на форумах, право, рефераты, книги в продаже, платные материалы и мероприятия.

PureVideo – поиск видеофайлов.

Киновед – поиск всего, что связанного с фильмами: отзывов, рецензий и описаний фильмов, информации об актерах кино, биографий, кадров из фильмов, фотографий актеров, постеров, обоев для рабочего стола.

DVD-поиск – специализированная поисковая система фильмов. В базе поиска содержатся базы фильмов самых известных Интернет-магазинов. В результатах поиска выводятся: название фильма, магазин, формат и цена. У некоторых позиций также присутствует небольшая аннотация.

PicSearch – поиск изображений.

Заключение

В сети Интернет хранится очень большой объем информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио и видеофайлов и многого другого. Путешествуя по Интернет, можно найти любую информацию, не выходя из дома или офиса, иначе говоря, если какие-либо данные вводились когда-либо в компьютер, то вероятнее всего их можно найти где-то на необозримых просторах Интернет. Для этого нужен только непосредственно сам компьютер, подключенный к Интернет с установленной специальной программой – браузером, предназначенной для просмотра содержимого Web-страниц.

С появлением World Wide Web (WWW) – гипертекстовой информационной системы, опутавшей весь мир, связавшей сотни и сотни компьютеров, тысячи и тысячи страниц гипертекстовых документов – без высокоэффективных средств поиска просто не обойтись. Благодаря разнообразию поисковых систем, специально разработанных для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.

Список литературы

  1. Угринович Н. Д. Информатика и ИКТ. Базовый уровень: учебник для
    10 класса.

  2. Интернет глазами пользователя. Режим доступа: http://yandex.ru/

  3. Средства поиска информации в INTERNET // Афанасий-биржа (Тверь). – 28 марта 1997.

  4. Википедия – свободная энциклопедия http://ru.wikipedia.org/

Реферат

на тему: “Методы поиска информации в сети интернет.
Информационно-поисковые системы”

Выполнил:

Расулов Хайрула Рамазанович

Поиск информации в
Интернете может быть произведен по нескольким методам, значительно
различающимся как по эффективности и качеству поиска, так и по типу извлекаемой
информации.

Введение
Глава 1. Основные методы поиска информации в Интернете
1.1. Непосредственный поиск с использованием гипертекстовых ссылок
1.2. Использование поисковых машин
1.3. Поиск с применением специальных средств
1.4. Анализ новых ресурсов
Глава 2. Поисковые системы
2.1. Использование поисковых систем на Западе
2.2. История поисковых систем
Глава 3. Русскоязычные поисковые системы
Заключение
Список использованных источников

Введение

В
наш ХХI век, владение информацией, говорит о том, что человек образован и
респектабелен.

Более
или менее серьезный подход к любой задаче начинается с анализа возможных
методов ее решения.

Поиск
информации в Интернете может быть произведен по нескольким методам, значительно
различающимся как по эффективности и качеству поиска, так и по типу извлекаемой
информации.

В
ряде случаев приходится использовать весьма трудоемкие методы – результат того
стоит.

Поисковая
система —
 программно-аппаратный комплекс с веб-интерфейсом,
предоставляющий возможность поиска информации в Интернете.

В
просторечии под поисковой системой –
 подразумевают
веб-сайт, на которой размещён интерфейс (фронт-энд) системы.

Программной
частью поисковой системы –
 является поисковая
машина (поисковый движок) — комплекс программ, обеспечивающий функциональность
поисковой системы и являющийся коммерческой тайной компании-разработчика
поисковой системы.

Глава
1. Основные методы поиска информации в Интернете

Можно
выделить следующие основные методы поиска информации в Интернете, которые, в
зависимости от целей и задач ищущего, используются по отдельности или в
комбинации друг с другом:

  • Непосредственный
    поиск с использованием гипертекстовых ссылок.
  • Использование
    поисковых машин.
  • Поиск
    с применением специальных средств.
  • Анализ
    новых ресурсов.

1.1.
Непосредственный поиск с использованием гипертекстовых ссылок

Поскольку
все сайты в пространстве WWW фактически оказываются связанными между собой,
поиск информации может быть произведен путем последовательного просмотра
связанных страниц с помощью браузера.

Хотя
этот полностью ручной метод поиска выглядит полным анахронизмом в Сети,
содержащей более 60 млн. узлов, “ручной” просмотр Web-страниц часто оказывается
единственно возможным на заключительных этапах информационного поиска, когда
механическое “копание” уступает место более глубокому анализу.

Использование
каталогов, классифицированных и тематических списков и всевозможных небольших
справочников также относится к этому виду поиска.

1.2.
Использование поисковых машин

Сегодня
этот метод является одним из основных и фактически единственным при проведении
предварительного поиска. Результатом последнего может являться список ресурсов
Cети, подлежащих детальному рассмотрению.

Как
правило, применение поисковых машин основано на использовании ключевых слов,
которые передаются поисковым серверам в качестве аргументов поиска: что искать.

Если
делать все правильно, то формирование списка ключевых слов требует
предварительной работы по составлению тезауруса.

1.3.
Поиск с применением специальных средств

Этот
полностью автоматизированный метод может оказаться весьма эффективным для
проведения первичного поиска.

Одна
из технологий этого метода основана на применении специализированных программ –
 спайдеров,
которые в автоматическом режиме просматривают Web-страницы, отыскивая на них
искомую информацию.

Фактически
это автоматизированный вариант просмотра с помощью гипертекстовых ссылок,
описанный выше (поисковые машины для построения своих индексных таблиц используют
похожие методы).

Нет
нужды говорить, что результаты автоматического поиска обязательно требуют
последующей обработки.

Применение
данного метода целесообразно, если использование поисковых машин не может дать
необходимых результатов (например, в силу нестандартности запроса, который не
может быть адекватно задан существующими средствами поисковых машин).

В
ряде случаев этот метод может быть очень эффективен.

Выбор
между использованием спайдера или поисковых серверов являет собой вариант
классического выбора между применением универсальных или специализированных
средств.

1.4.
Анализ новых ресурсов

Поиск
по новообразованным ресурсам может оказаться необходимым при проведении
повторных циклов поиска, поиска наиболее свежей информации или для анализа
тенденций развития объекта исследования в динамике.

Другой
возможной причиной может явиться то, что большинство поисковых машин обновляет
свои индексы со значительной задержкой, вызванной гигантскими объемами
обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна
интересующая тема.

Это
соображение может оказаться весьма существенным при проведении поиска в
узкоспециальной предметной области.

Глава
2. Поисковые системы

Большинство
поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют
также системы, способные искать файлы на ftp-серверах, товары в
интернет-магазинах, а также информацию в группах новостей Usenet.

Основными
критериями качества работы поисковой машины –
 являются
релевантность (степень соответствия запроса и найденного, то есть уместность
результата), полнота базы, учёт морфологии языка.

Индексация
информации осуществляется специальными поисковыми роботами.

В
последнее время появился новый тип поисковых движков, основанных на технологии
RSS, а также среди XML – данных разного типа.

Улучшение
поиска —
 это одна из приоритетных задач сегодняшнего Интернета.

2.1.
Использование поисковых систем на Западе

По
данным компании Net Applications в декабре 2007 года использование поисковых
систем на Западе распределялось следующим образом:

  • Google
    — 77,04 %
  • Yahoo
    — 12,46 %
  • MSN —
    3,33 %
  • Microsoft
    Live Search — 2,57 %
  • AOL —
    2,12 %
  • Ask —
    1,38 %
  • AltaVista
    — 0,13 %
  • Excite
    — 0,07 %
  • Lycos
    — 0,02 %
  • All
    the Web — 0,02 %

В
вышеприведенный отчёт не входят российские поисковики, такие как, например,
Яндекс, Рамблер или Nigma.

По
данным аналитической компании comScore все поисковые сайты в декабре 2007 года
обработали 66 млрд 221 млн поисковых запросов.

Яндекс
попал в статистику и находится на 9-ом месте.

2.2.
История поисковых систем

Одним
из первых инструментов поиска в интернете (до WWW) был Archie.

Первой
поисковой системой для Всемирной паутины был «Wandex», уже не существующий
индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью
Грэем (англ. Matthew Gray) из Массачусетского технологического института в
1993.

Также
в 1993 году появилась поисковая система «Aliweb», работающая до сих пор.

Первой
полнотекстовой, то есть индексирующей ресурсы при помощи робота, поисковой
системой стала «WebCrawler», запущенная в 1994.

В
отличие от своих предшественников, она позволяла пользователям искать по любым
ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех
основных поисковых системах.

Кроме
того, это был первый поисковик, о котором было известно в широких кругах.

В
1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.

Вскоре
появилось множество других конкурирующих поисковых машин, таких как «Excite»,
«Infoseek», «Inktomi», «Northern Light» и «AltaVista».

В
некотором смысле они конкурировали с популярными интернет-каталогами, такими,
как «Yahoo!».

Позже
каталоги соединились или добавили к себе поисковые машины, чтобы увеличить
функциональность.

В
1996 году русскоязычным пользователям интернета стало доступно морфологическое
расширение к поисковой машине Altavista и оригинальные российские поисковые
машины Rambler и Aport.

23
сентября 1997 была открыта поисковая машина Яндекс.

В
последнее время завоёвывает всё большую популярность практика применения
методов кластерного анализа и метапоиска.

Из
международных машин такого плана наибольшую известность получила «Clusty»
компании Vivísimo.

В
2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma,
поддерживающий автоматическую кластеризацию.

В
2006 году открылась российская метамашина Quintura, предлагающая визуальную
кластеризацию в виде облака ключевых слов.

Nigma
тоже экспериментировала с визуальной кластеризацией.

Глава
3. Русскоязычные поисковые системы

Большинство
«русскоязычных» поисковых систем индексируют и ищут тексты на многих языках:

  • украинском;
  • белорусском;
  • английском
    и др.

Отличаются
же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в
основном индексируют ресурсы, расположенные в доменных зонах, где доминирует
русский язык или другими способами ограничивают своих роботов русскоязычными
сайтами:

  • Яндекс
    (46,3 % Рунета);
  • Mail.ru
    (8,9 % Рунета);
  • Rambler
    (3,3 % Рунета);
  • Nigma
    (0,5 % Рунета);
  • Генон
    (0,1 % Рунета);
  • Gogo.ru
    (<0,1 % Рунета);
  • Aport
    (<0,1 % Рунета).

Из
перечисленных поисковых систем не все имеют собственный поисковый алгоритм —
так QIP.ru используют поисковый механизм Яндекса, Mail.ru использует Google, а
Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других
поисковиков.

Заключение

Поиск,
с применением поисковых машин –
 является самым
распространенным и эффективным методом поиска чего-то конкретного в сети
Интернет.

Хотя
остальные методы ничем не хуже, только они применяются очень редко и только в
том случае, если при помощи поисковой машины ничего нельзя найти.

Пользоваться
поисковыми машинами удобно и легко.

Список
использованных источников

1.
http://www.ucheba.ru – Учёба.RU
2. http://textbook.vadimstepanov.ru/index.html – интернет в
профессиональной информационной деятельности
3. http://www.proweb.ru/articles/oglavlenie/glava4/poisk – Группа компаний
“Вебдом”
4. http://newsmir.ucoz.ru/load/1-1-0-9 – Лента новостей
5. http://simbiont-club.webzone.ru/search.htm – поисковые системы
6. http://www.seoded.ru/ssilki/poiskoviki.html – seoded.ru

        
Содержание
:                            стр

Введение.                                        
– 4

1.
Информационно-поисковая система.               – 5

 1.1.
Документографическая ИПС.                   – 6

 1.2. Фактографическая
ИПС.                       – 8

2.  Поисковая система
глобальной сети “Интернет”. – 9

 2.1. Как работают
механизмы поиска.              – 9

 2.2. Технология
поиска.                          – 14  

3. Поисковые машины
глобальной сети “Интернет”.   – 18

 3.1.
Как искать в Интернете                      – 18     

 3.2. Поисковые
каталоги.                         – 21

 3.3. Поисковые
указатели.                        – 23

4.
Сравнительная характеристика двух поисковых   

  
систем на базе  Rаmbler.ru
и Yandex.ru.       
– 29

 4.1.
Rаmbler.ru                                 
– 29

 4.2.
Yandex.ru.                                  – 35

Заключение.                                      

40

Литература.                                      
– 42

Приложение.                        
              – 43

Введение

         Интернет
во многом упростил жизнь современного общества, глобализовал его, увеличил
возможности одних людей и уменьшил возможности других. Сегодня гораздо удобнее
и выгоднее пользоваться почтовыми услугами через Интернет (к примеру, письмо из
Тобольска в Лондон дойдет за 5 секунд).

         По
моим наблюдениям Интернет стал источником бизнеса,
источником мировой культуры, источником обучения, средством массовой
информации.

Сегодня
любой пользователь в Интернете может за пару секунд получить доступ ко всем
мировым биржам, музеям.  Любой пользователь может получить образование через
Интернет, ознакомится с ведущими мировыми электронными газетами.

         Информация
стала виртуальным золотом наших дней, и тот добьется быстрого и большего
успеха, кто сможет быстрее ее раздобыть. И не важно кто вы, бизнесмен, ищущий
новый рынок сбыта или студент, ищущий материал к курсовой работе, обоим нужна
информация и Интернет может дать ее им если они будут обладать достаточными
знаниями чтобы взять ее.

         Мне
долго
бы пришлось перечислять выгоды Интернета для граждан Земли, но боюсь что
нескоро бы закончил.

Я
хочу отметить главное в Интернете, некий его “краеугольный
камень”,
это – информация и главные ее свойства:

          
1)
Широкая доступность 

          
2)
Быстрота

У
неопытных пользователей есть миф о том, что в Интернете есть все. На самом
деле, мой опыт работы в Интернете доказал, что это не так. Материалы для
размещения в Сети готовят живые люди, и потому там можно найти лишь то, что они
сочли нужным (в смысле полезным или выгодным для себя) опубликовать. Впрочем,
река питается ручьями, и благодаря их творчеству сегодня в Интернете уже
образовалось около двух миллиардов Web-страниц. В результате каталогизация
имеющихся в Сети ресурсов стала серьезной проблемой. Несмотря на то, что ею
занимаются тысячи организаций, проблема не только не приближается к разрешению,
но и становится острее. Процент каталогизированных (или индексированных)
ресурсов неуклонно падает. В последние два года это падение стало катастрофическим.
Так, если в 2000 г. процент индексированных ресурсов приближался к 40%, то
всего лишь за один следующий год он опустился до 25% [2]. Вывод простой: пространство
Web быстрее наполняется, чем систематизируется. К сожалению, у
Internet-специалистов нет оснований предполагать, что в ближайшее время
что-нибудь может измениться к лучшему. В итоге поиск информации в World Wide
Web можно считать самой трудной задачей в Интернете.

         В
связи с вышесказанным, качественный поиск информации в Интернете одна из самых
актуальнейших тем в наше время, эта проблема не раз затрагивала и меня.

Тема
моей курсовой заинтересовала меня своей нестандартностью и новизной и я хочу
постараться раскрыть ее. Моей задачей  будет качественная организация поиска информации
в сети Интернет.

1.
Информационно-поисковая система

         Прежде
чем дойти до конкретных механизмов поиска в глобальной сети
“Интернет” необходимо разобрать теоретическую основу таких вопросы,
как “что такое информация?”, “Информационные процессы?”,
“Информационно-поисковая система и ее типы ?”.

         Однозначного
ответа что такое информация нет, можно лишь привести часть свойств
характеризующий данный термин:

         ”
Информация – это сведения, являющиеся объектом хранения; это содержание
сообщения, сигнала, памяти, а также сведения, содержащиеся в сообщении,
сигнале, памяти.”  [4.с.23]

         Процессы
передачи, хранения и переработки информации, всегда играли важную роль в жизни
общества. Люди обмениваются устными сообщениями, записками, посланиями. Они
передают друг другу просьбы, приказы, отчеты о проделанной работе, описи
имущества; публикуют рекламные объявления и научные статьи; хранят старые
письма и документы; долго размышляют над полученными известиями или немедленно
кидаются выполнять указания начальства. Все это – информационные процессы.
Информация всегда связана с материальным носителем, а ее передача – с затратами
энергии. Однако одну и ту же информацию можно хранить в различном материальном
виде (на бумаге, в виде фотонегатива, на магнитной ленте, …) и передавать с
различными энергетическими затратами (по почте, по телефону, с курьером и
т.д.), причем последствия – в том числе и материальные – переданной информации
совершенно не зависят от физических затрат на ее передачу. Например, легкое
нажатие кнопки опускает тяжелый театральный занавес или взрывает большое
здание, красный свет светофора останавливает поезд, а неожиданное неприятное известие
может вызвать инфаркт. Поэтому информационные процессы не сводимы к физическим,
и информация, наряду с материей и энергией, является одной из фундаментальных
сущностей окружающего нас мира. В 20 в. с развитием техники появились новые устройства:
средства связи, устройства автоматики, а с 40-х гг. – вычислительной техники.
Выяснилось, что эффективность их работы с помощью физических понятий описать невозможно
и что существенные характеристики таких устройств нужно описывать совсем
другими способами. В результате впервые возникли точное понятие информации и
математическая теория информации. Стало ясно, что средства связи, какие бы физические
процессы они ни использовали, – это средства передачи информации. Объединение
понятий “информация” и “управление” привело Н.Винера в 40-х
гг. к созданию кибернетики, которая, в частности, впервые указала на общность
информационных процессов в технике, обществе и живых организмах.

Использование
понятия информации оказало существенное влияние на развитие современной
биологии, особенно таких ее разделов, как нейрофизиология и генетика. И
наконец, в связи с развитием вычислительной техники, стимулировавшей
информатизацию всего общества, возник комплекс наук о различных аспектах работы
с информацией – информатика.

         ”
Информационно-поисковая система – это система, где хранится информационный
массив, из которого по требованиям пользователей выдается нужная информация.”  
[4.с.75]

 Поиск
информации по требованию пользователя осуществляется либо автоматически, либо
вручную (как в библиотеках, когда с запросом к работнику справочного фонда
обращается читатель, а работник пользуется системой каталогов). Во втором
случае используются ЭВМ, снабженные специальными программными средствами,
анализирующими процессы запросов, поиска и выдачи нужных документов. Таким
образом, информационно-поисковые системы (ИПС) реализуют вопросно-ответное
отношение, что сближает задачи, стоящие перед создателями таких систем, с теми
задачами, которые решают создатели человеко-машинных систем.

 Информационно-поисковые
системы делятся на два типа:

         1.
Документографическая ИПС.

         2.
Фактографическая ИПС.

 1.1
Документографическая ИПС

         В
такой ИПС все хранимые документы индексируются некоторым специальным образом.
Каждому документу (статье, отчету, протоколу и т.п.) присваивается индивидуальный
код, составляющий поисковый образ документа. Поиск идет не по самим документам,
а по их поисковым образам, которые содержат информацию (адрес) о
местонахождении документа. Именно так ищут книги по заказам читателя в больших
библиотеках (в маленьких библиотеках библиотекарь обычно ищет книги сам). По
требованию читателя сначала находят карточку в каталоге, а потом по шифру,
указанному на ней, отыскивается и сама книга.

         Различия
документографических ИПС определяются тем, как устроен поисковый образ
документа. В простейшем случае это просто его индивидуальное название
(например, название, автор, год издания книги). В более сложных случаях нет
однозначного соответствия между поисковым образом документа и самим документом.
Вполне возможен случай, когда поисковый образ документа соответствует
нескольким различным документам и, наоборот, один и тот же документ
соответствует не одному, а нескольким поисковым образам.

 

         Такой
неоднозначностью обладают, например, поисковые образы документов в дескрипторных
системах. “Дескриптор – слово или словосочетание, которое тесно связано с
содержанием документа. Совокупность дескрипторов определяет группу документов
со сходным содержанием.”[4.с.75] В последнее время журналы, публикующие
научные статьи, требуют от своих авторов, чтобы для каждой статьи они указывали
список ключевых слов, которые и играют роль дескрипторов. Если, например,
описать статью, которую вы читаете с помощью ключевых слов, то один из
возможных списков будет следующим:  информационный поиск,
информационно-поисковая система, дескриптор, тезаурус, поисковый образ
документа.

         По
набору этих ключевых слов (набору дескрипторов) можно найти данную статью среди
всех статей книги, если ввести ее постатейное содержание в какую-либо ИПС дескрипторного
типа.

Общая
блок-схема ИПС дескрипторного типа показана на  рис-1. Эта схема имеет два входа.
По одному происходит пополнение хранящегося в системе информационного массива
документов, а по второму поступают запросы пользователей.

 1.2
Фактографическая ИПС

 В
отличие от документо-графических ИПС в ИПС такого типа хранятся не документы, а
факты, относящиеся к какой-либо предметной области. Хранимые факты могут быть извлечены
из различных документов. К примеру необходимо переработав историю восемнадцатого
века в базе фактов они связываются между собой системой разнообразных отношений.
Такая сеть в ИПС носит название тезауруса предметной области. Запросы поступающие
в фактографические ИПС, используют тезаурус для поиска ответов на запросы.
Поиск осуществляется методом поиска, по образцу широко применяющемуся в базах
знаний систем искусственного интеллекта. 

К
примеру необходимо переработав историю восемнадцатого века, собрать все
сведения о Екатерине-II.

         ИПС
фактографического типа постепенно приближаются по своей организации и
функционированию к развитым базам данных и знаний.[4.с.76]

2.
Поисковая система глобальной сети “Интернет”.

         Я
не хочу влезать в дебри внутренней работы поисковой системы (на электронном
уровне), т.к. это не отвечает целям моей работы, и на мой взгляд эта работа
программистов высшего уровня к которому я сейчас стремлюсь.

Я
хочу разобрать и разложить по “полочкам”, то как мне стала понята
технология поиска информации, и сам механизм поиска информации.

 2.1
Технология поиска информации в Интернете

Сама
технология поиска становится более понятной на рис-2.

1)
Для начала пользователь решает такую задачу, что он хочет найти , и где это
может находится.

         2)
Затем заходит в Интернет, в обыкновенное Internet Exploer окно(Браузер).(Рис-3).
Если пользователь знает имя сайта на котором находится интересующая его
информация, то он просто сообщает его имя и заходит в его.

 Пример.
Пользователь желает узнать кинопрокат на  сегодняшний день и заходит на сайт
film.ru.(рис-3).

Это
самый примитивный способ поиска информации в Интернете, на этом поиск может и
закончится.

Существуют
и внутри сайтовые(локальные) системы поиска.

 Пример.
В том же film.ru есть возможность просмотреть 

информацию
о фильме давно вышедшем из проката, к примеру найти фильм “Брат-2” ,
достаточно в окне

 поиска
набрать слово Брат-2 .(рис-3)

         3)
Если пользователь не знает имя сайта где он может найти интересующую его информацию,
то он прибегает к помощи какой-нибудь поисковой системы. В сети работает
значительное число справочных систем. Зайдя на указанный сервер, он получит на
экране форму запроса, в которую надо ввести информацию для поиска. Обычно в
форме существует возможность ограничения зоны поиска (например, по тематике).
Он можете ввести нужный термин, определить область поиска и попытаться получить
ответ.

 

Поиск
производится автоматически на базе учета количества найденных слов на сервере.
На его компьютер будет передана первая группа найденных ссылок с лучшими показателями
по числу найденных вхождений искомых слов.

Часто
вместе с ссылкой может быть выведена краткая информация по документу. Если
среди найденных документов нет нужных, то можно вывести следующую группу –
общее число документов обычно исчисляется тысячами. Для того, чтобы перейти на
сервер, на котором находится найденная информация, достаточно просто щелкнуть
по ссылке в результате поиска.

 Это
самый примитивный способ поиска информации в интернете, на этом поиск может и
закончится.

Существуют
и внутри сайтовые(локальные) системы поиска.

 Пример.
В том же film.ru есть возможность просмотреть 

информацию
о фильме давно вышедшем из проката, к

примеру
найти фильм “Брат-2” , достаточно в окне

поиска
набрать слово Брат-2 .(рис-3)

         3)
Если пользователь не знает имя сайта где он может найти интересующую его информацию,
то он прибегает к помощи какой-нибудь поисковой системы. В сети работает
значительное число справочных систем. Зайдя на указанный сервер, он получит на
экране форму запроса, в которую надо ввести информацию для поиска. Обычно в
форме существует возможность ограничения зоны поиска (например, по тематике).
Он можете ввести нужный термин, определить область поиска и попытаться получить
ответ.

         Поиск
производится автоматически на базе учета количества найденных слов на сервере.
На его компьютер будет передана первая группа найденных ссылок с лучшими показателями
по числу найденных вхождений искомых слов. Часто вместе с ссылкой может быть
выведена краткая информация по документу. Если среди найденных документов нет
нужных, то можно вывести следующую группу – общее число документов обычно исчисляется
тысячами. Для того, чтобы перейти на сервер, на котором находится найденная информация,
достаточно просто щелкнуть по ссылке в результате поиска.

         Обычно
поиск по паре ключевых слов приводит к получению десятков тысяч ссылок на документы,
содержащие эти термины. Такой объем результатов редко позволяет эффективно
отыскать “жемчужину” среди не имеющих отношения к теме поиска
материалов. Что можно посоветовать?

         Во-первых,
пользователю необходимо сузить зону поиска. Попытаться определить на серверах
какого профиля, в какой стране и т.п. наиболее вероятно можно встретить интересуемые
материалы. Подумать, какие другие ключевые слова могут характеризовать объекты
поиска, использовать несколько ключевых слов.

         Если
объектом поиска указаны несколько терминов, то поисковая система ищет вхождение
каждого слова в документ независимо. То есть, можно результатом поиска получить
документ, который содержит только одно слово, но несколько раз. Поэтому при определении
терминов, по которым производится поиск, можно и нужно использовать логические
операции.  

 Например,
ввод слово_1&слово_2 заставит искать те страницы, где употреблен как первый,
так и второй термин.    

         Во-вторых,
необходимо провести поиск по всем известным поисковым системам. В каждой из них
используется своя, несколько отличающаяся от других технология поиска. Поэтому
абсолютно аналогичные поиски могут привести к различающимся результатам.
Большинство поисковых систем бесплатны, поэтому ничто не мешает проводить
столько операций поиска, сколько нужно.

         В-третьих,
очень часто результат может принести поиск документов на основе возможных
ссылок на них.

Пользователь
должен пытаться определить, какие известные документы могут содержать
упоминание его тем. И уже через гипертекстовые связи в документах выйти на
желаемый источник. Часто этот путь эффективен. Попытайтесь найти организации
(WWW-сервера), имеющие профиль, сходный с темой поиска. Иногда, через ссылки в
документах этих серверов можно выйти на нужные материалы.

         В-четвертых,
попытаться найти конференцию по сходной тематике т.е. просто зайти в
какой-нибудь CHAT. Например в www.anekdotov.net.ru. Часто вопрос,
“брошенный” в телеконференцию, позволяет получить достаточно
справочной информации.

         И,
наконец, не забывать спросить своих знакомых. Они могут  подсказать неожиданное
решение.

         В
любом случае нужно настроиться на то, что поиск может занять достаточно длительный
период времени и потребовать от, него немалых усилий.

 Пример.
Пользователь заходит в поисковую систему   Yandex.ru , и в поисковом окне набирает
слово Брат-2,  дальше происходит поиск всего что может хоть как- нибудь связано
с данным словом. Yandex порекомендует  обратится ко многим сайтам и в том числе
и к film.ru и  непосредственно к сайту о самом фильме. (рис-4)

 2.2
Как работают механизмы поиска

         Поисковая
система обычно ищет нужную информацию с помощью трех этапов :

 
I) Этап: Робот (агент, паук или кроулер) перемещается по Сети и
собирает информацию.

 II)
Этап:
Вся информация, собираемая роботами поступает в базу данных в
виде ссылок – индексируется. 

III)
Этап:
Запускается поисковый механизм, который
пользователи используют как интерфейс для взаимодействия с базой данных. т.е.
произошла выдача базой данных гиперссылок и дальше идет обыкновенный перебор
нужных ссылок пользователем.

Эти
этапы ярко выражены в работе блок-схемы (рис-2)

Два
первых являются подготовительными и незаметны для пользователя.[5.с.139]

Рассмотрим
более подробно этапы поиска информации в

Поисковой
системе:

         I)
Этап.
Поисковая система собирает информацию из World Wide
Web. Для этого используют специальные программы, аналогичные браузерам. Они
способны скопировать заданную Web-страницу на сервер поискового указателя,
просмотреть ее, найти все гиперссылки, которые на ней имеются, перейти по
указанным в них URL-адресам, скопировать те ресурсы, которые найдены там, снова
разыскать имеющиеся в них гиперссылки и т.д. Это специальные программы, типа
агентов, пауков, кроулеров и роботов, которые занимаются поиском страниц в
Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически
индексируют информацию, которую они находят для построения базы данных. Каждый
поисковый механизм имеет собственный набор правил, определяющих, как собирать
документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и
затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и
так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым
файлам, файлам мультипликации;  другие проинструктированы, что нужно
просматривать прежде всего наиболее популярные страницы.

 
Агенты – самые “интеллектуальные” из поисковых средств.
Они могут делать больше, чем просто искать: они могут оставлять сообщение о
вашем посещении сайта. Уже сейчас они могут искать cайты специфической тематики
и возвращать списки cайтов, отсортированных по их посещаемости. Агенты могут
обрабатывать содержание документов, находить и индексировать другие виды
ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения
информации из уже существующих баз данных. Независимо от информации, которую
агенты индексируют, они передают ее обратно базе данных поискового механизма.

 
Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки
сообщают о содержании найденного документа, индексируют его и извлекают
итоговую информацию. Также они просматривают заголовки, некоторые ссылки и
посылают проиндексированную информацию базе данных поискового механизма.

 
Кроулеры просматривают заголовки и возвращают только первую
ссылку.

 
Роботы могут быть запрограммированы так, чтобы переходить по различным cсылкам
различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе.
Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им
нужны значительные ресурсы Сети. Однако, имеются методы,   предназначенные для
того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают,
чтобы они были проиндексированы.

 
Роботы извлекают и индексируют различные виды информации.
Некоторые, например, индексируют каждое отдельное слово во встречающемся
документе, в то время как другие индексируют только наиболее важных 100 слов в
каждом, индексируют размер документа и число слов в нем, название, заголовки и
подзаголовки и так далее.

Вид
построенного индекса определяет, какой поиск может быть сделан поисковым механизмом
и как полученная информация будет интерпретирована.

         Люди
желающие предоставить информацию широкой общественности, или желающие большей
посещаемости своего сайта, помещают краткие выдержки о чем этот сайт прямо в
индекс, заполняя особую форму для того раздела, в который по их предположению
обратится поисковый робот и вытащит в базу данных этот сайт и предоставит ее какому-нибудь
пользователю.

         Когда
кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу
поисковой системы и заполняет форму, детализирующую информацию, которая ему
необходима. Здесь могут использоваться ключевые слова, даты и другие критерии.
Критерии в форме поиска должны соответствовать критериям, используемым роботами
при индексации информации, которую они нашли при перемещении по Сети.

 Проиндексированная
информация отсылается базе данных поискового механизма так же, как было описано
выше.

         II)
Этап:
После копирования разысканных Web-ресурсов на
сервер поисковой системы начинается второй этап работы – индексация. В ходе
индексации создаются специальные базы данных, с помощью которых можно установить,
где и когда в Интернете встречалось то или иное слово.  Индексированная база
данных – это своего рода словарь. Она необходима для того, чтобы поисковая
система могла очень быстро отвечать на запросы пользователей.

База
данных отыскивает предмет запроса, основанный на информации, указанной в заполненной
форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы
определить порядок, в котором список документов будет показан, база данных
применяет алгоритм ранжирования. В идеальном случае, документы, наиболее
релевантные пользовательскому запросу будут помещены первыми в списке.

“Операция
сортировки полученных результатов называется ранжированием.”[3]

Различные
поисковые системы используют различные алгоритмы ранжирования, однако основные
принципы определения релевантности следующие:

         –
Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).

         –
Тэги, в которых эти слова располагаются.

         –
Местоположение искомых слов в документе.


Удельный вес слов, относительно которых определяется релевантность, в общем
количестве слов документа.

  Эти
принципы применяются всеми поисковыми системами. А представленные ниже используются
некоторыми, но достаточно известными (вроде AltaVista, HotBot).

 
        – Время – как долго страница находится в базе поискового сервера. Поначалу
кажется, что это довольно бессмысленный принцип. Но, если задуматься, как много
существует в Интернете сайтов, которые живут максимум месяц! Если же сайт
существует довольно долго, это означает, что владелец весьма опытен в данной
теме и пользователю больше подойдет сайт, который пару лет вещает миру о
правилах поведения за столом, чем тот, который появился неделю назад с этой  же
темой.

         –
Индекс цитируемости – как много ссылок на данную страницу ведет с других страниц,
зарегистрированных в базе поисковика. База данных выводит ранжированный подобным
образом список документов с HTML и возвращает его пользователю, сделавшему запрос.
Различные поисковые механизмы также выбирают различные способы показа полученного
списка – некоторые показывают только ссылки; другие выводят ссылки с первыми
несколькими предложениями, содержащимися в документе или заголовок документа вместе
с ссылкой.

         III)
Этап.
Происходит обработка запроса пользователя и выдача
ему результатов поиска в виде списка гиперссылок. Затем идет работа
пользователя по переработке ссылок, предоставленной базой данных. Когда он
щелкает на ссылку к одному из документов, который его интересует, этот документ
запрашивается у того сервера, на котором он находится, если информация пользователя
на данном сайте его не удовлетворила, он щелкает на другую ссылку. Этот этап
может затянутся и оказаться самым сложным для пользователя.  [1]

3.
Поисковые машины

В
Интернете великое множество поисковых машин(поисковых систем),  они имеют
разные виды, у каждой свои возможности преимущества и недостатки. Пользователя
всегда будут одолевать такие вопросы: как  искать в Интернете,
какая машина лучше. Так что постараюсь ответить на эти вопросы.    

3.1
Как искать в Интернете

          При
поиске в Интернет важны две составляющие – полнота (ничего не потеряно) и
точность (не найдено ничего лишнего). Обычно это все называют одним словом –
релевантность, то есть соответствие ответа  вопросу.

         1.
Охват и глубина.
Под охватом имеется в виду объем базы
поисковой машины: который  измеряется тремя показателями – общим объемом проиндексированной
информации, количеством уникальных серверов и количеством уникальных
документов. Под глубиной понимается – существует ли ограничение на

количество
страниц или на глубину вложенности директорий на одном сервере.

         Как
проверить:
Некоторые машины пишут на своем сайте статистику робота.
Но можно проверить и самому – надо задать несколько поисковых запросов,
состоящих из одного слова (чтобы исключить влияние языка запросов, в том числе
– различного трактования пробела), и при этом смотреть на  статистику
результатов, выдаваемую машиной – обычно в начале списка указано, сколько всего
было найдено документов. Помимо того, что слова должны быть из разных областей,
хорошо еще взять слова разных “весов” – редкие, “средние” и
“тяжелые” (частотные), и сравнить количество найденного. Тяжелые слова,
в частности, тестируют полнотекстовость (индексацию всех слов документа) поисковой
машины.

 Глубину
хождения робота проверить сложнее – для этого надо взять какие-то сайты, например,
с разветвленной структурой архивов, и проверить, проиндексированы ли документы,
на которые можно попасть только, например, за 6 переходов по ссылкам.

         2.
Скорость обхода и актуальность ссылок.

 Скорость
обхода Сети показывает, насколько быстро происходит индексация
свеже-добавленного ресурса и насколько быстро обновляется информация в базе.
Важным показателем качества поисковой машины (ее робота) является не только
“захват” новых территорий: но и

отслеживание
состояния уже охваченных. Сервера исчезают и появляются, страницы на них
обновляются. Ссылки, которые выдает  поисковая машина в списке найденного,
должны, во-первых, существовать, и, во-вторых, их содержание должно
соответствовать запросу.

         Как
проверить:
Объективную информацию можно получить, проанализировав
логи серверов – робот поисковой машины представляется обычно именем своей
машины  (или похожим образом), так что можно увидеть, как часто он бывает на
сервере, сколько страниц просматривает и т.д. К сожалению, обычно для изучения
бывает доступен лог только своего сайта, поэтому остается экспериментальный
способ.

Для
определения скорости обхода надо создать где-нибудь страничку текста, добавить
ее в поисковики и посмотреть, как быстро она начнет находиться. Или изменить
уже имеющуюся страничку. Для определения  актуальности ссылок – проверить
документы хотя бы на первой странице списка найденного по нескольким запросам.
Сообщение “Not Found” свидетельствует о том, что документ более не
существует.

         3.
Качество поиска
(субъективный показатель).

 Каждая
поисковая машина имеет свои алгоритм сортировки результатов поиска. Чем ближе к
началу списка оказывается нужный вам документ, тем лучше работает
релевантность.

Как
проверить:
Только путем эксперимента. Рекомендуется
для сравнения делать запросы разной длины. Можно также использовать язык
запросов, при этом те, кому неохота читать описание, могут воспользоваться
развернутой страницей запроса (“расширенный поиск” в Апорте и
Яндексе, “детальный запрос” в Рэмблере – варианты перевода на русский
язык “advanced search”).

          Кроме
релевантности, существуют важные пользовательские  характеристики.

     
1. Скорость поиска. Если поисковая машина отвечает медленно, работать с
ней неэффективно. Стоит добавить, что видимая пользователю скорость зависит не
только от самой поисковой машины, но и от Интернет-каналов.

     
Как проверить: Путем эксперимента – надо поискать запросы разной длины,
разной “тяжести” слов и в разное время суток (загрузка серверов
существенно неравномерна по суткам, пик – около трех-четырех часов дня).

     
2. Поисковые возможности (работа с языком документа, язык запросов). Еще
один пункт сравнения – что именно и как поисковая машина вносит в индекс.
Полнотекстовая поисковая машина индексирует все слова видимого пользователю
текста. Наличие морфологии дает возможность находить искомые слова во всех
склонениях или спряжениях. Кроме этого, в языке HTML существуют тэги, которые
также могут обрабатываться поисковой машиной (заголовки, ссылки, подписи к
картинкам и т.д.). Язык запросов в виде стандартных логических операторов (И,
ИЛИ, НЕ) есть практически у всех машин. Некоторые умеют искать словосочетания
или слова на заданном расстоянии – это часто важно для получения разумного
результата. Дополнительной возможностью является поиск в зонах документа –
заголовках, ссылках, ключевых словах (META KEYWORDS) и т.д. Дополнительная
возможность языка запросов – естественно-языковый запрос, который не требует
знания операторов.

         Как
проверить:
Обычно эта информация публикуется на
сервере поисковой машины (в Help’е). Тем не менее, рекомендуется проверить на
реальных запросах, поскольку иногда желаемое выдается за действительное.

         3.
Дополнительные удобства.
Это – дополнительные возможности,
которые предоставляет пользователям поисковая машина. Сюда входит   всевозможные
варианты поиска (специализированные страницы, поиск похожих документов,
ограничение области поиска), и список найденных серверов, и поиск по датам и
серверам, и удобный интерфейс поисковой машины, и возможность его
персонализации.

         Как
проверить:
 Информация может быть частично
опубликована на сервере поисковой машины, но лучше всего попробовать самому
поработать с этими возможностями.

         Поисковые
машины состоят из поисковых каталогов и поисковых указателей, многие
поисковые указатели содержат в себе и каталоги. Рассмотрим их. [6]

 3.1
Поисковые каталоги

         Любая
книга начинается с содержания и заканчивается Алфавитным указателем. Несмотря
на то, что они расположены в разных местах книги и выглядят совершенно
по-разному, задача у них одна: помочь найти в книге именно тот раздел, который
в данный момент нужен. Содержание – это пример каталогизации.

Когда
человек выбирает тему, которая ему интересна, по ней он находит номер страницы,
где эта тема раскрывается. Алфавитный указатель – пример индексации
(по-английски, index – это и есть указатель). Человек находит в указателе
нужный термин и получает номер страницы, на которой он встречается.

         Каталоги
(directories) и отличаются от поисковых систем. Каталоги представляют собой
совокупность сайтов, собранных в тематические рубрики. Эти рубрики в свою очередь
могут быть разбиты на подрубрики, которые тоже могут иметь еще более мелкие подкаталоги
и т.д.

Каталоги
с точки зрения пользователя – те же поисковики. Но вот заполняются эти каталоги
не “роботами”, как на указателях, а самыми что ни на есть живыми
людьми. Это очень хорошо для пользователей, так как дает более релевантные
результаты по сравнению с поисковыми серверами. От части в поисковом указателе
тоже содержится каталог, он представлен в виде оглавлений(гиперссылок) по самым
популярным темам.

(рис-5)
[2]

         При
каталогизации ресурса опытный редактор внимательно просматривает его, определяет,
к какой области знаний относится данный ресурс, устанавливает его категорию в
этой отрасли и вносит ресурс в каталог. Самый крупный каталог Интернета – Yahoo
(www.yahoo.com). В нем работают более 150 квалифицированных редакторов. Это
большая организация, но и ее усилий хватает лишь на то, чтобы поддерживать
каталог на уровне примерно 1 миллиона ресурсов. Дальнейшее расширение
сдерживается необходимостью

 

поддерживать
уровень актуальности. Сегодня редакторы Yahoo! заняты не столько наполнением
каталога новыми ресурсами, сколько проверкой актуальности ресурсов, каталогизированных
ранее.

Приведу
пример самых используемых каталогов

Рис-6.  Крупнейший поисковый каталог России Mail.ru

 в
российской части Интернета в таблице-1.[приложение]

 3.3
Поисковые указатели

Поисковые
указатели – это автоматизированные системы. Они способны функционировать без
участия человека, и потому их знание о подлинных ресурсах Сети намного (на
несколько порядков) больше, чем у каталогов. Количество проиндексированных
Web-страниц может измеряться сотнями миллионов.

Работа
поискового указателя происходит в три этапа, которые указаны в пункте 2.2.

Конкретные
рекомендации по выбору поискового указателя очень быстро стареют. Ситуация в
Интернете меняется буквально на глазах. Не проходит и полугода, чтобы
что-нибудь не изменилось и в поисковых системах. Та система, которая была
наилучшей вчера, может быть не самой лучшей сегодня и очень плохой завтра. В
тоже время, популярность – вещь хитрая. Она трудно зарабатывается, но потом и
долго живет. В итоге мы очень часто встречаемся с ситуацией, когда самой
популярной является далеко не лучшая система. Мы поможем читателю научиться
самостоятельно проверять разные поисковые системы и выбирать для работы те,
которые дают лучшие результаты. При проверке размер поискового указателя не
имеет решающего значения. Нам ведь нужны не миллионы ссылок, а всего две-три,
но желательно самые лучшие. Поэтому важно не только то, как много Web-страниц
проиндексировала поисковая система, но и то, когда она это делала в последний
раз, как часто потом проверяла актуальность ссылок и насколько корректно
представляет результаты поиска.

 Сравнительный
обзор поисковых систем.

         Подробно
рассказывать о том, как пользоваться поисковыми каталогами, нет никакой
необходимости. Так как надо просто зайти на сайт выбрать категорию, которая интересует,
в ней выбрать раздел, и так далее, пока не откроется список конкретных ссылок.

         Значительно
интереснее рассмотреть приемы использования поисковых указателей, тем более что
для разных указателей эти приемы разные. Но прежде чем приступать к изучению
конкретной системы, необходимо рассмотреть общие концепции, равно относящиеся
ко всем поисковым указателям, в качестве примера я буду рассматривать такие популярные,
и на мой взгляд самые удобные, поисковые уазатели как Yandex и Rambler .

И
начну с рассмотрения основных видов поиска. В основном всего четыре вида
поиска.

Все
поисковые указатели реализуют несколько алгоритмов поиска. К ним относятся: простой
поиск, расширенный поиск, контекстный поиск и специальный поиск.

         Простой
поиск.
При простом поиске в поле запроса вводится одно или несколько слов, которые
могут характеризовать содержание документа. Если это слово одно, то, как
правило, в ответ выдается такое большое количество ссылок, с которым непонятно
что делать. Если вводится несколько слов, то результат зависит от того, как эти
слова введены, а это, в свою очередь, зависит от конкретной используемой
системы. Приемы простого поиска в разных поисковых системах, как правило, свои,
и прежде чем ими пользоваться, желательно почитать инструкцию. Простой поиск в
Rambler представлен на

рис-8.
При введении фразы: Все смешалось в доме Облонских, поисковые указатели выдают
следующие результаты: Rambler
9(документов)

           
Yandex  2400(документов)

         Расширенный
поиск.
Расширенный поиск всегда подразумевает запрос из группы слов. При
расширенном поиске в большинстве случаев разрешается связывать ключевые слова
логическими операторами AND (И), OR(ИЛИ), NOT(НЕ) и другими. Основное достоинство
расширенного поиска состоит в том, что как правила записи ключевых слов и логических
операторов в разных системах либо одинаковы, либо очень похожи. Поэтому, усвоив
один раз приемы расширенного поиска, можно ими пользоваться где угодно. Надо
только предварительно переключить систему в нужный режим (рис-9.)

 При
введении фразы: Все смешалось в доме Облонских, в расширенном поиске, поисковые
указатели выдают следующие результаты: Rambler
9(документов)

                     
Yandex  2400(документов)

         
Рис-8  Простой поиск в Rambler

    
Рис-9 Переключение системы в режим расширенного поиска.

         Контекстный
поиск.
Это очень полезный вид поиска, который, к сожалению,
реализован не во всех поисковых указателях. Системы, которые его поддерживают,
следует ценить особо. При контекстном поиске требуется точное совпадение фразы
или группы слов, например “Все

смешалось
в доме Облонских”. В большинстве поисковых систем, включающих этот метод,
ключевая фраза должна быть заключена в кавычки: “Все смешалось в доме Облонских”.(Рис-10)

 При
введении фразы: ”Все смешалось в доме Облонских”, поисковые указатели выдают
следующие результаты:  

           
Rambler 0(документов)

           
Yandex 
8(документов)

Рис-10. Контекстный поиск в RAMDLER.RU

    

         Специальный
поиск.
С помощью команд специального поиска разыскивают дополнительную
информацию. Например, такие команды позволяют определить, как часто в Сети
встречаются гиперссылки, указывающие на какой-либо ресурс, с их помощью можно
найти ключевые слова,

входящие
в заголовки Web-страниц и т.п. Как правило, команды специального поиска в
различных поисковых системах свои.

Также
необходимо рассмотреть общие правила записи команд поиска.

 Общие
правила записи команд поиска:

         Слова
разделенные пробелами

Допустим,
пользователю необходимо разыскать Web-страницу, на которых что-то говорится об
операционной системе Microsoft Windows. Логично ввести в поле поиска слова
Microsoft Windows и ждать результата. Но результат может быть обескураживающим.
Одни поисковые системы понимают такую запись как Microsoft И Windows – они
дадут то, что пользователь ищет. Другие могут понимать эту запись как Microsoft
ИЛИ Windows – тогда будут разысканы все Web-страницы, на которых встречается
либо первое слово, либо второе, либо оба вместе. Пользователя, конечно,
интересуют только те страницы, на которых оба слова встречаются вместе, но они
будут буквально похоронены среди прочих, не нужных ему страниц.

Приступая
к работе с незнакомой системой, нужно начинать с проверки, как она обрабатывает
группы ключевых слов. Сначала вводится одно слово: Microsoft. Просматривается,
сколько результатов выдаст система.

 При
введении фразы: Microsoft,
поисковые указатели выдают следующие результаты:

           
Rambler 28184(документов)

           
Yandex  1048379(документов)

Затем
вводится второе слово: Windows. Опять проверяется количество. Вводятся оба
слова: Microsoft Windows.

 При
введении фразы: Microsoft,
поисковые указатели выдают следующие результаты:

           
Rambler 6641(документов)

           
Yandex  259276(документов)

Если
количество найденных Web-страниц будет больше, чем в первом и во втором случае,
значит, система считает, что ключевые слова связаны соотношением ИЛИ (множества
объединяются). Если результат будет меньше, чем в каждом из первых испытаний,
то система использует соотношение И (множества пересекаются). И в том, и в
другом случае  придется ознакомиться со справочной информацией, чтобы узнать,
как получить противоположный результат.  Например, все основные российские
поисковые системы по умолчанию между словами ставят оператор И, хотя у системы
“Яндекс” есть свои особенности (см. таблицу-2). Там считается, что
эти два слова должны одновременно присутствовать не в документе, а в одном
предложении. Если достаточно, чтобы они присутствовали в документе, перед
каждым словом надо поставить знак <+>. Одновременно возникает обратная
задача: как сделать, чтобы разыскивались документы, содержащие одно из заданных
–   ключевых слов, то есть, как задать соотношение ИЛИ?

 “Рамблер”:
Microsoft OR Windows; (50986 документов)

 “Яндекс”:
Microsoft | Windows;
(2034641 документов)

         Роль
прописных букв

В
большинстве поисковых систем “хлеб” не равен “ХЛЕБ”, но “ХЛЕБ”*“хлеб”. Общее правило
такое: если клиент ввел строчные символы, то разыскиваются как строчные, так и
прописные символы, но если клиент использовал прописные буквы, то ищется точное
совпадение только с прописными буквами. Классический пример – Красная Шапочка.
Если их ввести именно так, с использованием прописных букв, то будут разысканы
только документы, в которых встречается

сочетание
Красная Шапочка. Однако если ключевые слова записать как красная шапочка, то
будет разыскано больше документов. Через сито отбора пройдут все документы, в которых
встречаются сочетания: красная шапочка, Красная шапочка, красная Шапочка и
Красная Шапочка. Поэтому  не надо злоупотреблять применением прописных букв в запросе
и использовать их лишь тогда, когда есть абсолютная уверенность в результате.

Однако
некоторые поисковые системы имеют отличия. Так, например, в системе
“Рамблер” при индексации все прописные буквы принудительно “понижаются”
до строчных. Это означает, что использовать в запросе прописные буквы в этой
системе бесполезно.

 При
введении фразы: Красная Шапочка, поисковые указатели выдают следующие результаты:

           
Rambler 2921(документов)

           
Yandex  16458(документов)

         Роль
зарезервированных слов

Зарезервированные
слова – это слова, которые не учитываются при обработке запроса. Во время
индексации Web-Страниц программа выбрасывает их из текста, что значительно
уменьшает размеры указателей и сокращает время поиска. К зарезервированным
словам обычно

относятся
неинформативные слова: предлоги, союзы, местоимения, артикли и другие слова
малого размера. Так, например, если в системе “Яндекс” задать поиск
фразы “Все смешалось в доме Облонских”, то будут также разысканы
документы, содержащие Что смешалось в доме Облонских? – и Где смешалось? В доме
у Облонских? В некоторых системах могут быть зарезервированы слова, которые
встречаются исключительно часто и потому не являются информативными. Если,
например, система ориентирована на поиск книг, то слово книга для нее не
информативное. Слово авто неинформативно для поисковой системы, занимающейся
делами автомобильными, а слова компьютер и Интернет неинформативны для систем,
ориентированных на поиск информации по вычислительной технике. Особенно важно
учитывать роль зарезервированных слов при проведении контекстного поиска т.к.
при контекстном поиске необходимо точное соответствие между тем, что заказал
пользователь, и тем, что встречается в Web-документах. Если поисковая система
на этапе индексации “зачистила” Web-документы от зарезервированных
слов, то с контекстным поиском она справиться не может, разве что только
“заглянув” в копии Web-страниц, если таковые у нее хранятся, но на
это уходит много времени. Поэтому честный контекстный поиск в поисковых системах
редкость. В России, например, и Яндекс, и Рамблер только делают вид, что
предоставляют возможность контекстного поиска, для этого искомую фразу надо
заключить в кавычки. Однако после нехитрых испытаний легко убедиться, что это
на самом деле не контекстный поиск, а поиск с точностью до зарезервированных
слов. Пример, когда на запрос “Все смешалось в доме Облонских”
выдается результат Что смешалось в доме Облонских. В таблице-2 я привожу
сравнительную характеристику основных поисковых машин(поисковых систем).[приложение][6] 

4.
Сравнительная характеристика двух поисковых систем на базе 
Rаmbler.ru
и
Yandex.ru

 4.1
RAMBLER

         Rambler.ru
– исторически (до появления Yandex)
наиболее популярная поисковая система в России. Она начала работать раньше
других и долгое время лидировала по размеру поискового указателя и качеству
услуг поиска. Увы, сегодня эти достижения в прошлом. Несмотря на то, что размер
поискового указателя “Рамблер” примерно равен 12 миллионам
Web-страниц, он давно толком не обновлялся и выдает устаревшие результаты.
Сегодня “Рамблер” – это популярный портал, лучшая в России
классификационно-рейтинговая система плюс рекламная площадка. (Рис-10) [3]

Приемы
поиска в системе Рамблер:

          Язык
поисковых запросов

 Поисковый
запрос может состоять из одного или нескольких слов, в нем могут присутствовать
знаки препинания. Составлять простые запросы можно и не вдаваясь в тонкости
языка запросов. Так, если ввести в поисковую строку несколько слов без знаков
препинания и логических операторов, будут найдены документы, содержащие все эти
слова (причем на ограниченном расстоянии друг от друга).

Однако
знание и правильное применение языка запросов поисковой машины поможет сделать
поиск на Рамблере быстрым и эффективным.

 Регистр

 В
общем случае, регистр написания поисковых слов и операторов значения не имеет,
то есть дом и ДОМ, Not и nOt воспринимаются одинаково. И лишь иногда, в целях
повышения качества поиска, регистр слов поискового запроса принимается во
внимание.

 Например,
если запрос состоит из двух, трех или четырех слов, каждое из которых написано
с большой буквы, то предполагается поиск по имени собственному, и автоматически
производится изменение ограничения расстояния между словами запроса со значения
по умолчанию на величину (n-1)*2, где n – количество слов запроса. Это
позволяет находить группу слов запроса, внутри которой есть не более одного
“лишнего” слова или знака препинания, например
“Баден-Баден”, “А. Пушкин”, “Федор Михайлович
Достоевский”.

         Операторы

 
Запрос, состоящий из нескольких слов, может содержать операторы. Поиск
операторов в документе не производится, они служат лишь инструкцией поисковой
машине. Все операторы поисковой машины бинарные, то есть имеют левую и правую
часть, каждая из которых также является запросом (по умолчанию состоящим из
одного слова). Для изменения сферы действия операторов (группировки нескольких
слов запроса в аргумент оператора) применяются скобки и кавычки. Два запроса,
соединенные оператором AND (логическое И) образуют сложный запрос, которому
удовлетворяют только те документы, которые одновременно удовлетворяют обоим
этим запросам. Иными словами, по запросу ‘собака AND кошка’ найдутся только те
документы, которые содержат и слово ‘собака’, и слово ‘кошка’.

Сложному
запросу, состоящему из двух запросов, соединенных оператором OR (логическое
ИЛИ) удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух
запросов. По запросу ‘собака OR кошка’ найдутся документы, в которых есть хотя
бы одно из слов ‘собака’ или ‘кошка’ (либо оба эти слова вместе). Оператор NOT
(логическое И-НЕ) образует запрос, которому отвечают документы, удовлетворяющие
левой части запроса и не удовлетворяющие правой. Так, результатом поиска по
запросу ‘собака NOT кошка’ будут все документы, в которых есть слово ‘собака’ и
нет слова ‘кошка’.  Если оператор явно не указан, используется оператор по
умолчанию AND: находятся только документы, содержащие все слова запроса. Так,
запрос ‘информация технологии кредит’ будет истолкован как ‘информация AND
технологии AND кредит’. На странице Расширенного поиска оператор по умолчанию
можно заменить на OR (Искать слова запроса: хотя бы одно).

 
Каждый из операторов имеет сокращенное обозначение:

       
Оператор сокращенное обозначение

       
AND    &

        
OR    |

       
NOT    !

 Запрос
из нескольких слов, перемежающихся операторами, будет истолкован в соответствии
с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет,
поэтому запрос из нескольких слов при обработке сначала группируется по операторам
AND и NOT, и лишь потом по операторам OR. Изменить порядок группировки можно
использованием скобок.

         Кавычки

 
Для поиска цитат можно использовать двойные кавычки. Слова запроса, заключенного
в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в
которых они встретились в запросе. Таким образом, двойные кавычки можно
использовать и просто для поиска слова в заданной форме (по умолчанию слова
находятся во всех формах). Например, запросу ‘самолет “заправился”
посадка’ удовлетворяет документ, содержащий текст ‘… самолет совершил посадку
и заправился …’, и не удовлетворяет документ, содержащий ‘.. самолет совершил
посадку, чтобы заправиться …’.

         Скобки

 При
построении запросов иногда возникает необходимость объединения слов запроса в
группы, которые будут аргументами некоторого оператора. Такие группы
заключаются в скобки. Часть запроса, заключенная в скобки, сама является
запросом, и на нее распространяются правила языка построения запросов.
Использование скобок

позволяет
строить вложенные запросы и передавать их операторам в качестве аргументов, а
также перекрывать приоритеты операторов, принятые по умолчанию. Если запрос без
скобок ‘машина самолет | аэродром’ эквивалентен запросу ‘машина AND самолет OR
аэродром’ и, в соответствии с приоритетами операторов,  означает “найти
документы, содержащие либо слова ‘машина’ и ‘самолет’, либо слово аэродром, то
запрос со скобками ‘машина (самолет | аэродром)’ равносилен запросу ‘машина AND
(самолет OR аэродром)’, что означает “найти документы, содержащие слово
‘машина’ и одно из слов ‘самолет’ или ‘аэродром'”.

          Метасимволы

 
Рамблер пока не поддерживает поиск строк с использованием метасимволов (‘*’,
‘?’), которые обычно используются в значении “любая подстрока” и
“произвольный одиночный символ” соответственно. Тем не менее, эти
операторы зарезервированы  для подобного использования в будущем.

         Применение
языка запросов

 
Каждый запрос, адресованный поисковой машине Рамблера, обрабатывается в
соответствии с правилами языка запросов. Некоторые слова и символы трактуются 
как операторы языка запросов и обрабатываются специальным образом. Фактически,
языком запросов описывается некая формула, которая используется при поиске – 
каждый из документов “сопоставляется” с ней, и результатом поиска
являются только те документы, которые ей удовлетворяют. Например, запросу
‘самолет’ удовлетворяют все документы, в которых хотя бы раз встретилось слово
‘самолет’ в любой форме. Запросу, состоящему из нескольких слов, удовлетворяют
документы, содержащие каждое из этих слов в любой форме (при некоторых
условиях). Вопрос соответствия документа более сложному запросу определяется
логикой операторов и конструкций языка запросов.

         Морфология

 
По каждому слову запроса поиск ведется с учетом правил словоизменения соответствующего
языка. Рамблер понимает и различает слова русского и  английского языков – по
умолчанию, поиск ведется по всем формам слова. Например, при поиске по слову
‘человек’ будут также найдены документы,  содержащие слова ‘человеку’,
‘человеком’, ‘человека’ и даже ‘люди’. Чтобы  провести поиск только по одной
определенной форме слова, нужно взять его в двойные кавычки или воспользоваться
поиском точной фразы в расширенном поиске.

 Стоп-слова

 
Некоторые слова и символы по умолчанию исключаются из запроса в связи с их
малой информативностью. Это так называемые стоп-слова – самые частотные слова 
русского и английского языков, например, предлоги, частицы и артикли.
Присутствие этих слов может замедлить поиск и негативно повлиять на полноту
результатов. Есть возможность обозначить необходимость этих слов в запросе,
взяв запрос в двойные кавычки или воспользовавшись поиском точной фразы в
расширенном поиске.

          Ограничение
расстояния

 Если
запрос составлен из одного или нескольких слов без применения операторов и конструкций
языка запросов, то будут найдены документы, в которых встречаются все слова
запроса. При этом для каждого запроса всегда существует так называемое
ограничение контекста – положительное число, по умолчанию  равное расстоянию в
40 слов. Документ, в котором встретились все слова  запроса, будет выдан только
в том случае, если расстояние в словах между вхождениями слов запроса будет
меньше этого числа. Например, по запросу ‘красная армия’ будут найдены те
документы, в которых слова ‘красная’ и ‘армия’ хотя бы один раз встретятся
менее чем в 40 словах друг от друга. Значение ограничения контекста можно
изменять конструкцией ‘(число, запрос)’, где число – любое положительное число,
запрос – любой корректный с точки зрения поисковой машины запрос, состоящий
более чем из одного слова (очевидно, ограничение расстояния между словами в случае
однословного запроса не имеет смысла). Таким образом, по запросу ‘(2, красная армия)’
найдутся только те документы, в которых между словами ‘красная’ и ‘армия’ хотя
бы раз не стоит ни одного слова (поскольку лишь в случае их непосредственного соседства
разница  в  порядковых  номерах  слов  меньше  2, т.е.равна 1)

          Ненайденные
слова

 
Если запрос состоит из нескольких слов, и при этом некоторые из них вообще не
удалось найти в Интернете, то выдаются результаты поиска по частичному 
запросу, из которого отсутствующие в Интернете слова исключены. При этом на
странице результатов поиска выдается соответствующая диагностика.

         Сортировка
результатов

 
По умолчанию найденные документы сортируются по релевантности (соответствию запросу).
Однако Вы можете потребовать, чтобы вместо этого в начало списка были помещены
самые свежие (или, наоборот, самые старые документы). Для этого надо выбрать соответствующую
установку в меню “Сортировать по…” на странице детального запроса.
Можно также ограничить поиск документами, созданными в определенный период времени:
для этого необходимо на странице детального запроса указать “От даты …
до даты …”.

         Расстояние
между словами

 Можно
потребовать, чтобы Рамблер возвращал только те документы, где слова из запроса
находятся на минимальном расстоянии друг от друга. Режим “Ограничить
расстояние между словами” может быть включен в детальном запросе. Все
перечисленные выше правила могут быть использованы совместно друг с другом в
необходимой последовательности.

         Выдача
результатов

 
По умолчанию результаты поиска выдаются порциями по 15 документов. Меню
“Выдавать по…” на странице детального запроса позволяет увеличить
это число до 30 или 50. Меню “Форма вывода…” позволяет получать
описания документов с увеличенной или уменьшенной подробностью.

 4.2
YANDEX

Yandex.ru
–  поисковая машина, способная по запросу найти наиболее подходящие
web-страницы в русской части Интернета. Яндекс ежедневно просматривает сотни
тысяч Web-страниц в поисках изменений или новых ссылок. Коллекция ссылок
постоянно растет.  Яндекс не требует   знания специальных команд для поиска.
Яндекс отыщет всех, кто сослался на  страницу, файлы с нужной картинкой,
последние новости или товары в электронных магазинах. В основе системы
“Яндекс” самый большой указатель  – примерно 27 миллионов
Web-страниц, но дело не только в размере. Это не просто указатель на ресурсы, а
указатель на самые актуальные ресурсы. По уровню актуальности “Яндекс”
сегодня безусловный лидер (рис.4)[3]

         Приемы
поиска в системе Яндекс

Прежде
чем приступать к описанию языка запросов системы Яндекс, отмечу, что он заметно
мощнее и сложнее языков запросов других отечественных поисковых систем. Впрочем,
обыкновенному пользователю не надо пугаться. Даже если он очень не любите
читать и, тем более, изучать инструкции, то он может работать с системой
интуитивно.

 В
принципе, система Яндекс использует в работе эвристические алгоритмы, которые
не совсем строгие математической точки зрения. В результате пользователь может
получить разные результаты, например, если будет искать документы со словами
Буш Гор выборы и выборы Буш Гор. Зато благодаря этим алгоритмам интуитивный
подход к созданию запросов (без чтения инструкций) дает очень хороший
результат, к тому же за очень краткое время.

Поиск
по одному слову

Когда
пользователь вводит искомое слово в поле поиска и нажимает кнопку Найти, то слова
разыскиваются с учетом всех возможных словоформ, что особенно важно для
русского языка. Например, если введено слово снег, то будут найдены документы,
в состав которых входят слова снега, снегов и т. п., но не снежный, заснеженный
и т. п. Если же поиск словоформ не требуется, то его можно отменить с помощью
восклицательного знака, например !снегом.

         Поиск
по группе слов

 Если
слова разделены пробелом, то разыскиваются документы, в которых в одном предложении
встречаются все введенные слова. Так, по запросу Буш Гор выборы

система
выдает документы с фразами типа … Накануне выборов хакеры взломали сайты Буша
и Гора. Среди результатов такого поиска возможны нестрогие соответствия – поисковая
система проявляет свой интеллект. Чтобы строго обеспечить появление слов в предложении,
надо перед ними поставить знак +, например так: +Буш +Гор +выборы. Знак +
должен записываться слитно с тем словом, к которому относится (без пробела).
Пробел выполняет роль оператора И, который также можно ввести явно (символ
&), например так: +Буш& +Гор& +выборы. Справа и слева от
логического оператора должны быть пробелы.

Если
же требуется одновременное присутствие слов не только в предложении, но и во
всем документе, применяется оператор &&, например: +Буш&&
+Гор&& +выборы.

Теперь
рассмотрю приемы исключения слов из поиска. Для этого применяются: знак –
(строгое исключение из предложения), знак ~ (нестрогое исключение из
предложения) и знак ~~ (исключение из всего документа). Так, например, запрос
+Буш +Гор ~~выборы позволит

отобрать
документы, в которых в одном предложении встречаются слова Буш и Гор, но во
всем документе нет слова выборы и его производных (выбор, на выборах, после
выборов и т. п.).

В
тех случаях, когда надо объединить ключевые слова с помощью оператора ИЛИ,
используется символ | (вертикальная черта). Так, например, запрос Буш |
Гор&& +выборы отберет документы, в которых упоминается либо Джордж Буш,
либо Алъберт Гор, но обязательно

встречается
слово выборы.

         Поиск
с указанием расстояния

 Давным-давно
в поисковых Системах появился оператор NEAR, позволяющий находить документы, в
которых два слова расположены близко друг к другу. Правда, что такое
“близко” каждая система понимает по-разному. В поисковой системе
Яндекс можно конкретно указать, на каком расстоянии друг от друга эти слова
должны находиться.

В
документе у каждого слова есть свой номер позиции. Номера позиций двух соседних
слов различаются на единицу (номер позиции слова, находящегося справа, больше).
Оператор расстояния записывается как /+n, где n – число, соответствующее
расстоянию. Например, оператор /+1 соответствует двум словам, идущим подряд, то
есть Microsoft/+1 Windows – это то же самое, что и “Microsoft
Windows”.

Оператор
расстояния может иметь и отрицательное значение. Это означает, что второе
слово, указанное в запросе, должно в документе располагаться раньше первого. Например
запрос Microsoft/-5 Windows может дать ссылку на документ, содержащий фразу об
операционных системах, которые заменят Windows, рассказал ответственный
представитель компании Microsoft.

При
проведении поиска с указанием расстояния можно задавать не точное расстояние
между словами, а диапазон, например /(-5 +5). В этом случае будут отобраны
документы, в которых слова, указанные в запросе в качестве ключевых, попадают в
заданный диапазон. На самом деле, если знак параметра не указан, то это тоже
поиск в диапазоне. Так, оператор /5 надо рассматривать на самом деле как
диапазон /(-5 +5). Запрос Буш/ 5 Гор разыщет предложения типа: Женщины
симпатизировали Бушу, а мужчины – Гору или Гор Буша не слаще.

 Система
– Яндекс имеет довольно сложные правила языка запросов (по сравнению с
Рамблером), но зато у нее обширные возможности. К примеру, расстояния можно измерять
не только между словами, но и между предложениями. Эта единица измерения используется,
когда в запросе применен двойной знак && или ~~. Так, запрос
Буш/+1&&Гор выдаст документы, в которых слова Буш и Гор встречаются
либо в одном предложении, либо в соседних.

         Использование
скобок

 Задание
на поиск – это, по сути дела, логическое выражение, которое работает как фильтр
при просмотре документов, входящих в базу данных поисковой системы. В

логическом
выражении точно так же, как и в арифметическом, можно применять круглые скобки.
Они служат для управления порядком действий. Характерный пример:
Буш&Гор&(выборы | голосование). Такой запрос вернет ссылки на Web-страницы,
содержащие предложения, в составе которых есть слова Буш, Гор, выборы или Буш,
Гор, голосование.

         Управление
ранжированием

 Цель
ранжирования – сделать так, чтобы Web-страницы,

наиболее
оптимально соответствующие запросу, отображались в списке результатов как можно
раньше. Какие алгоритмы при ранжировании применяет поисковая система, это ее
дело. Пользователи либо довольны их работой, либо обращаются к другой поисковой
системе. В системе Яндекс есть возможность самостоятельно изменить алгоритм
механизма ранжирования с помощью весовых коэффициентов. Такой коэффициент можно
присвоить любому ключевому слову или целому выражению, если оно заключено в
скобки: Весовые коэффициенты вводятся через двоеточие, например Буш:5 Гор
выборы. При таком запросе документы, в которых слово Буш встречается чаще,
получают преимущество и отображаются в результирующем списке на более высоких
позициях.

 Еще
один прием управления ранжированием связан с уточняющим словом. Это такое слово,
которое не обязательно должно содержаться в отбираемых документах, но если оно
там есть, то этот документ получает преимущество при ранжировании. Уточняющее
слово вводится после знаков <_. Например, при поиске по ключевым словам Гор
Буш<_младший выборы получат преимущество Web-страницы, в которых речь идет
не просто о Джордже Буше, а о Джордже Буше-младшем.

         Специальный
поиск

 Особняком
стоят приемы поиска информации, содержащейся в специальных полях заголовков
Web-страниц (каждая Web-страница имеет служебные поля в своем заголовке) или
поиск специальных элементов, входящих в Web-страницы, например гиперссылок. В
системе Яндекс команды специального поиска в полях заголовка начинаются

с
символа $, а команды поиска отдельных элементов Web-страниц – со знака #. Все
средства специального поиска работают заметно медленнее по сравнению с
обычными.[6]

 Команда

Описание

Пример

Пояснение

$title (выражение)

Поиск ключевых
слов, указанных в выражении, выполняется только в заголовках Web-страниц

$title (Космос)

Разыскиваются
только Web-страницы, в заголовках которых имеется слово Космос (рис. 7.10)

$anchor

Поиск ключевых
слов, указанных в выражении, выполняется только в якорях внутренних ссылок
Web-страниц

$anchor (вступление)

Внутренние (выражение)

гиперссылки
(ссылки внутри документа) используют для создания внутренней структуры
документа (аналог содержания). Эта команда разыщет Web-страницы, в которых имеется
якорь “Вступление”

#keywords = (выражение)

Поиск среди
ключевых слов, заданных автором Web-страницы

#keywords – (новости)

Автор Web-страницы
может сам задать ключевые слова, описывающие его материал. При просмотре в броузере
мы их не видим, но они учитываются поисковыми системами при индексации

#abstract = (выражение)

Поиск в аннотации
Web-страницы

#abstract
= (Буш | Гор)

Автор WеЬ-страницы
может дать ей краткую аннотацию, которая на экране не отображается, но
учитывается поисковыми системами при индексации и представлении

#image
= “имя ‘файла”

Поиск файлов
иллюстраций по их имени

#image -“Bush.*”

Если заранее
неизвестно, какое расширение может иметь имя файла, применяют подстановочный
символ “*”, который замещает любое количество произвольных символов

#hint –(выражение)

Поиск слов в
альтернативном тексте иллюстраций

#hint =

(Буш | Гор)

Автор может
связать с иллюстрацией текст, называемый альтернативным. Он воспроизводится,
если графика в броузере отключена или при наведении указателя мыши на рисунок.Считайте
его подрисуночной подписью

#url = URL-адрес”

Поиск сайта или
Web-страницы

#uri.=
“www.anysite.ru”

Обычно используется
для локализации поиска. Например,чтобы ограничить круг поиска одним сайтом
или, наоборот, исключить его из области поиска

#link –адрес”

Поиск
Web-страниц, содержащих гиперссылки на заданный URL-адрес сайта или
Web-страницы

#url
=

“www.mysite.ru”

Обычно
используется URLдля
выявления Web-страниц, на которых имеются гиперссылки, ведущие к собственной
странице

Заключение

Мне
удалось полностью раскрыть поставленные вопросы и разобрался в данной теме(как
осуществить эффективный поиск в Интернете?). Я убедился на своем опыте, что в
наш век высоких технологий эффективный поиск информации не разрешим и остался одной
из главнейших проблем. Это я могу объяснить следующим.

Во-первых, 
это не совершенство самих поисковых машин, ставящих под сомнение вообще какой
либо поиск.

Поисковым
машинам не хватает упорядоченности, структуры, структурности, структуризации, а
также системы, систематизации, систематизированности, роботы большинства поисковых
машин приносят огромное число бесполезных гиперссылок,  

         Во-вторых,
неопытность пользователей т.к. искать и находить нужное в ворохе текстов в
Интернете – умение не только поисковой системы, но и пользователя, задающего
вопрос.

         В-третих,
алчность пограмистов, и рекламных агенств их нанимающих, желающих чтобы их
сайты запрашивались как можно чаще. Эти “алчные” програмисты
обманывают роботов и выдают в Интернет сайт в котором якобы есть нужная для
пользователя информация, а там рекламные буклеты или автоматическая гиперссылка
запрашивающая рекламный сайт или еще хуже платный сайт. Хотя специалисты
обслуживающие поисковые машины и борются с таким явлением, оно все равно с
каждым днем приобретает все масштабные размеры.

         На
сегодня, Интернетом используются как справочником 23% пользователей, инструментом
исследования 15%, развлечением 14%, и только как источником новостей 12%.[6]

Не
мнение оптимистично звучит что 10% пользователей всегда, а 73% часто удается
найти нужную информацию.[3]

         На
такой вопрос какая поисковая машина лучшая и какой я предпочту пользоваться,
отвечу таким образом: пользоваться надо той машиной какой удобнее, и мне
удобнее пользоваться Яндексом.

         Интернет
облегчил поиск, и потребовал специфических знаний о поиске, на сегодня он не
всегда эффективен, мы находимся только на заре его развития. И поэтому не стоит
забывать о старом не менее эффективном поиске информации это книги и
библиотеки, этот источник информации оправдывал себя со времен
“Александрийской библиотеки”,  а Интернет только в скором будущем
будет более эффективен и станет почти незаменим. 

Список
использованной литературы

1.Андрей
Аликберов “Несколько слов о том, как работают роботы поисковых
машин”.

#”#”>Используется язык поисковой машины
Яndex

Используется язык поисковой машины
Апорт

Используется язык поисковой машины
Яndex

Используется язык поисковой машины
Rambler

Нет

Нет

Поиск
по фразе

” “

” “

Префиксы

+,

+,

Итеративный
поиск (в результатах)

Есть
поиск внутри категории

После
входа щелкните More…

замена
части слова

*

*
(не всегда корректно)

Таблица-2
[6]

Сводная
таблица по ведущим поисковым машинам

Яндекс

Rambler

Апорт!

AltaVista

Google

Зона
поиска, объем базы данных

Русская
часть Интернета. Поиск по страницам сайтов из раздела каталога, по регионам.
Специальный поиск по новостям, товарам, картинкам.

Русская
часть Интернета.

Русская
часть Интернета. Специализи-рованный поиск по новостям, товарам, картинкам,
MP3

Специализи-рованный
поиск по новостям, товарам, развлечениям, аудио (MP3) и видео.

Специализи-рованный
поиск по университе-там США, Apple, Linux, BSD

Объем
базы на начало 2001 года

Более
31 миллионов документов

Более
12 миллионов документов

Более
14 миллионов документов

Более
250 миллионов документов

1,25
миллиарда страниц

Тип
индексации

полнотекстовая
индексация

полнотекстовая
индексация

полнотекстовая
индексация и индексация по ссылкам

полнотекстовая
индексация

полнотекстовая
индексация и индексация по ссылкам

Наличие
дополнительных сервисов

Система
объединяет поисковую машину и каталог, а также ряд дополнительных проектов (Закладки.Ру,
Народ.Ру, система интеллектуального выбора товаров, CY и пр.).

Система
объединяет поисковую машину и рейтинг-классификатор Top100

Система
объединяет поисковую машину, каталог и дополнительные сервисы (интернет-покупки
и др.)

Система
объединяет поисковую машину, каталог и ряд дополнительных сервисов (хостинг,
регистрация доменного имени, перевод и др.)

Система
объединяет поисковую машину и каталог, содержащий 15 разделов и 1,5 миллиона
Web-страниц.

Синтаксис
языка поиска

логическое
И

пробел
или & (в пределах предложения)&&(в пределах документа)

AND,
&, пробел между словами по умолчанию

И,
AND, &,+, пробел между словами по умолчанию

AND,
& (только при сложном поиске)

по
умолчанию для всех слов поиска

логическое
ИЛИ

|

OR,
|

ИЛИ,
OR, |

OR
(по умолчанию при простом поиске), | (только при сложном поиске)

OR

бинарный
оператор И-НЕ

~
(в пределах предложения)

~
~ (в пределах документа)

не
используется

заменяется
префиксным оператором “-” (AND – пробел по умолчанию)

AND
NOT, ! (только при сложном поиске)

заменяется
префиксным оператором “-“

префиксы
обязательных (+) и запрещенных (-) слов

+,

не
используются

+,

+,
– (только при простом поиске)

+,

группирование
слов

(
)

(
)

(
)

(
)

не
используется

расстояние
между ключевыми словами при поиске

/(n
m) – в словах, &&/(n m) – в предложениях (- назад, + вперед)

при
расширенном поиске – выдача документов только с минимальным расстоянием между
словами

сл2(…),
с2(…), w2(…), [2,…] (- назад, + вперед)

NEAR
(в пределах10 слов, только при сложном поиске)

не
используется

поиск
фразы

” “

нет

” “,
‘ ‘

” “

” “,
‘ ‘, -..-

символы
замены части слова

нет

*,
? (замена любого символа)

*
(только в конце слова)

*

нет

ограничение
по языку документа

выбор:
любой, кириллица, латиница

выбор:
любой, русский, английский

выбор:
русский, английский

выбор
из 25 языков

выбор
из 25 языков

морфология

все
склонения и спряжения по умолчанию, ! (поиск точной словоформы)

#
(все формы слов), @ (однокоренные слова)

!
(указание нормальной формы)

нет

нет

поиск
по датам

есть

есть

есть

есть

нет

ограничение
поиска по полям

Поиск
в заголовках, ссылках, мета-тэгах, файлах и подписях картинок, в текстах ссылок,
в названиях скриптов, объектов и апплетов. Поиск похожих документов. Сужение
поиска на выбранные сайты.

Поиск
в заголовках, адресах, названиях документов (только при расширенном поиске).
Поиск похожих документов.

Поиск
в заголовках, ссылках, мета-тэгах, файлах и подписях картинок, в адресах, в
текстах ссылок. Сужение поиска на выбранные сайты.

Поиск
в заголовках, ссылках, мета-тэгах, файлах и подписях картинок, в адресах, в
текстах ссылок, в названиях скриптов, объектов и апплетов

Поиск
в ссылках и Поиск похожих документов. Сужение поиска на выбранные сайты.

Возможности
расширенной формы, качество помощи

настройка
расширенной формы

настройка
словарного фильтра , настройки по дате, по сайту, ссылке, изображению, специальному
объекту

по
документу, дате, режимам AND, OR, расстоянию между словами, усечению слова

по
документу, заголовку, изображению дате, 5 разделам (сайты, МР3, картинки, товары,
новости)

по
булевскому вопроснику, дате, по сайту, ссылке, изображению, тексту и пр.

ограничения
по сайту, языку, ссылкам

настройка
вывода результатов

задание
числа результатов на странице, всех элементов формы вывода

задание
числа результатов на странице, формы вывода

задание
формы выдачи

задание
числа результатов на странице, всех элементов формы вывода

задание
числа результатов на странице, всех элементов формы вывода

ранжирование
результатов поиска

сортировка
по релевантности или дате

сортировка
по релевантности или дате

по
популярности сайта

по
терминам, указанным в SORT

по
цитируемости (ссылок на страницу с других страниц)

итеративный
поиск (в результатах поиска)

Да.
Выполняется с помощью установки флажка

Да.
Выполняется с помощью переключателя области поиска

Да.

 Выполняется
с помощью установки флажка

Да.

Выполняется
с помощью

SORT
BY

нет

качество
раздела помощи

имеется
детальное описание языка запросов, таблица синтаксиса и раздел по поиску в категориях

краткий
раздел HELP

подробный
справочник по языку запросов, есть много русских синонимов для основных
операторов

самый
большой из рассмотренных в этой таблице учебник on-line по языку запросов

очень
ограниченный раздел HELP

семейный
фильтр

есть

нет

нет

есть

нет


Введение

Основная
задача Интернет – предоставление
необходимой информации. Интернет –
это информационное пространство, в
котором можно отыскать ответ практически
на любой интересующий пользователя
вопрос. Это огромная глобальная сеть,
в которую как информационные ручейки
стекаются потоки более мелких сетей.
Любой пользователь, располагающий ПК
и соответствующими программами, сможет
подключиться к сети, используя её
возможности для самых разных целей –
проведения досуга, обучения, чтения
научных работ, отправки электронной
почты и т.д. По различным данным, в 2004
г. количество пользователей глобальной
системы Интернет составило от 600 до 900
миллионов человек. Это число продолжает
стремительно расти и уже в 2006 г. оно
достигло миллиарда человек. Сегодня
глобальная сеть превращается в важный
социальный и политический фактор
современного информационного общества.
С развитием Интернет-технологий появился
новый гигантский источник информационных
ресурсов, доступ к которым является не
только относительно дешевым, но и очень
быстрым.


Информационные
ресурсы сети Интернет

Благодаря
повсеместному развитию и применению
компьютерных технологий в настоящее
время в той или иной электронной форме
находится информация всех областей
человеческой деятельности: наука,
производство, коммерция, литература,
развлечения и т.д. Сеть Интернет имеет
совместимость с различными электронными
сетями и базами данных и позволяет
получить удобный доступ практически
к любому виду информации. Для миллионов
людей разных профессий Интернет стал
необходимым инструментом в работе и
универсальным средством развлечения
в часы досуга. В связи с этим возникает
потребность в программных средствах,
эффективно решающих проблемы поиска
необходимой пользователю сети Интернет
информации.

Информационные
ресурсы, доступные через Интернет,
огромны. Это десятки миллионов документов,
представленных различными способами,
число которых постоянно увеличивается.
В зависимости от способа представления,
вида и характера информации разнятся
и методы доступа к ней, поэтому, прежде
чем рассматривать методы поиска,
рассмотрим классификацию информационных
ресурсов.

По
принципу организации и использования
средства поиска можно разделить на
каталоги (справочники, директории) и
поисковые машины.

Каталоги

Каталоги
являются справочниками, содержащими
списки адресов Интернет, сгруппированные
по определенным признакам. Как правило,
они объединяются по тематике (наука,
искусство, новости и т.д.), где каждая
тема разветвляется на несколько
подуровней.

Особенность
этих средств поиска информации состоит
в том, что создание структуры, базы
данных и их постоянное обновление
осуществляется “вручную”, коллективом
редакторов и программистов, и сам
процесс поиска требует непосредственного
участия пользователя, самостоятельно
переходящего от ссылки к ссылке.

Поисковые
машины

Действие
поисковых машин заключается в постоянном
последовательном исследовании всех
узлов Интернет, доступных данной системе
поиска, со всеми их связями и ответвлениями.
В связи с постоянным обновлением
информации машина поиска регулярно
возвращается через определенный срок
(порядка месяца) к уже изученным узлам,
чтобы обнаружить и зарегистрировать
изменения. Вся прочитанная информация
индексируется, то есть создается
специализированная база данных, в
которой закодированы все исследованные
системой страницы Интернет.

При
поступлении запроса от пользователя
машина поиска рассматривает всю
индексированную информацию и выдает
список документов, соответствующих
задаче поиска. Найденные документы
ранжируются в зависимости от местоположения
ключевых слов (в заголовке, в начале
текста, в первых параграфах) и частоты
их появления в тексте.

Несмотря
на схожий принцип работы, машины поиска
различаются по языкам запроса, зонам
поиска, глубине поиска внутри документа,
методам ранжирования и приоритетов,
поэтому применение разных поисковых
машин дает различные результаты.


Типология
методов поиска

Более
или менее серьезный подход к любой
задаче начинается с анализа возможных
методов ее решения. Поиск информации
в Интернете может быть произведен по
нескольким методам, значительно
различающимся как по эффективности и
качеству поиска, так и по типу извлекаемой
информации. В ряде случаев приходится
использовать весьма трудоемкие методы
– результат того стоит.

Можно
выделить следующие основные методы
поиска информации в Интернете, которые,
в зависимости от целей и задач ищущего,
используются по отдельности или в
комбинации друг с другом:

1.
Непосредственный поиск с использованием
гипертекстовых ссылок.

Поскольку
все сайты в пространстве WWW фактически
оказываются связанными между собой,
поиск информации может быть произведен
путем последовательного просмотра
связанных страниц с помощью броузера.

Хотя
этот полностью ручной метод поиска
выглядит полным анахронизмом в Сети,
содержащей более 60 млн. узлов, “ручной”
просмотр Web-страниц часто оказывается
единственно возможным на заключительных
этапах информационного поиска, когда
механическое “копание” уступает
место более глубокому анализу.
Использование каталогов, классифицированных
и тематических списков и всевозможных
небольших справочников также относится
к этому виду поиска.

2.
Использование поисковых машин.

Сегодня
этот метод является одним из основных
и фактически единственным при проведении
предварительного поиска. Результатом
последнего может являться список
ресурсов Cети, подлежащих детальному
рассмотрению.

Как
правило, применение поисковых машин
основано на использовании ключевых
слов, которые передаются поисковым
серверам в качестве аргументов поиска:
что искать. Если делать все правильно,
то формирование списка ключевых слов
требует предварительной работы по
составлению тезауруса.

3.
Поиск с применением специальных средств.

Этот
полностью автоматизированный метод
может оказаться весьма эффективным
для проведения первичного поиска. Одна
из технологий этого метода основана
на применении специализированных
программ – спайдеров, которые в
автоматическом режиме просматривают
Web-страницы, отыскивая на них искомую
информацию. Фактически это автоматизированный
вариант просмотра с помощью гипертекстовых
ссылок, описанный выше (поисковые машины
для построения своих индексных таблиц
используют похожие методы). Нет нужды
говорить, что результаты автоматического
поиска обязательно требуют последующей
обработки.

Применение
данного метода целесообразно, если
использование поисковых машин не может
дать необходимых результатов (например,
в силу нестандартности запроса, который
не может быть адекватно задан существующими
средствами поисковых машин). В ряде
случаев этот метод может быть очень
эффективен.

Выбор
между использованием спайдера или
поисковых серверов являет собой вариант
классического выбора между применением
универсальных или специализированных
средств.

4.
Анализ новых ресурсов.

Поиск
по новообразованным ресурсам может
оказаться необходимым при проведении
повторных циклов поиска, поиска наиболее
свежей информации или для анализа
тенденций развития объекта исследования
в динамике.

Другой
возможной причиной может явиться то,
что большинство поисковых машин
обновляет свои индексы со значительной
задержкой, вызванной гигантскими
объемами обрабатываемых данных, и эта
задержка обычно тем больше, чем менее
популярна интересующая тема. Это
соображение может оказаться весьма
существенным при проведении поиска в
узкоспециальной предметной области.


Технология
поиска с использованием поисковых
машин

Определение
географических регионов поиска

Поскольку
проведение информационного поиска
преследует практические цели –
практическая ценность информационного
ресурса может зависеть от географического
расположения соответствующего источника.

Составление
тезауруса

Для
эффективного использования поисковых
серверов необходим список ключевых
слов, организованный с учетом семантических
отношений между ними, т.е. тезаурус. При
составлении тезауруса необходимо
предусмотреть обработку синонимов,
омонимов и морфологических вариаций
ключевых слов.

Использование
законов Зипфа

Число,
показывающее сколько раз встречается
слово в тексте, называется частотой
вхождения слова. Если расположить
частоты по мере убывания и пронумеровать,
то порядковый номер частоты называется
ранг частоты. Вероятность обнаружения
слова в тексте = частота вхождения слова
/ число слов в тексте. Зипф нашел, что
если умножить вероятность обнаружения
слова в тексте на ранг частоты, то
получившаяся величина приблизительно
постоянна для всех текстов на одном
языке:

С
= (частота вхождения слов X ранг частоты)
/ число слов

Это
значит, что график зависимости ранга
от частоты – равносторонняя гипербола.

Зипф
также установил, что зависимость
количества слов с данной частотой от
частоты – также гипербола и постоянная
для всех текстов в пределах одного
языка.

Что
можно извлечь из этих законов? Исследования
вышеуказанных зависимостей для различных
текстов показали, что наиболее значимые
слова текста лежат в средней части
диаграммы, так как слова с максимальной
частотой как правило являются предлогами,
частицами, местоимениями, в английском
языке – артиклями (так называемые
“стоп-слова”), а редко встречающиеся
слова в большинстве случаев не имеют
решающего значения. Основываясь на
этой закономерности, можно предложить
следующую методику.

Составление
списка ключевых слов

Для
составления оптимального набора
ключевых слов используют процедуру,
основанную на применении законов Зипфа,
которая заключается в следующем: берут
любой текст-источник, близкий к искомой
теме, т.е. “образец”, и анализируют
его, выделяя значимые слова. В качестве
текста-источника может служить книга,
статья, Web-страница, любой другой
документ. Анализ текста производится
таким образом:

  • Удаление
    из текста стоп-слов.

Вычисление
частоты вхождения каждого слова и
составление списка, в котором слова
расположены в порядке убывания их
частоты.

Выбор
диапазона частот, лежащего в середине
списка, и отбор из этого диапазона слов,
наиболее полно соответствующих смыслу
текста.

Составление
запроса к поисковой машине в форме
перечисления отобранных таким образом
ключевых слов, связанных логическим
оператором ИЛИ (OR). Запрос в таком виде
позволяет обнаружить тексты, в которых
встречается хотя бы одно из перечисленных
слов.

Число
документов, полученных в результате
поиска по этому запросу, может быть
огромно. Однако, благодаря ранжированию
документов (расположению их в порядке
убывания частоты вхождения слов запроса
в документ), применяемому в большинстве
поисковых машин, на первых страницах
списка практически все документы
окажутся релевантными, причем
документ-источник может находиться
далеко от начала.

Более
адекватной представляется структура
тезауруса в виде так называемых
семантических срезов, где для каждого
основного термина отдельно строится
таблица сопутствующих слов и слов
шумовых (которые не должны встречаться
в источнике), – некоторые поисковые
машины (AltaVista) позволяют это использовать.
Таким образом, вместо единой иерархической
структуры терминов мы получаем пакет
таблиц, которые могут расширяться и
модифицироваться отдельно.

Отбор
поисковых машин

Устанавливается
последовательность использования
поисковых машин в соответствии с
убыванием ожидаемой эффективности
поиска с применением каждой машины.

Всего
известно около 180 поисковых серверов,
различающихся по регионам охвата,
принципам проведения поиска (а
следовательно, по входному языку и
характеру воспринимаемых запросов),
объему индексной базы, скорости
обновления информации, способности
искать “нестандартную” информацию
и тому подобное. Основными критериями
выбора поисковых серверов являются
объем индексной базы сервера и степень
развитости самой поисковой машины, то
есть уровень сложности воспринимаемых
ею запросов.

Составление
и выполнение запросов к поисковым
машинам

Это
наиболее сложный и трудоемкий этап,
связанный с обработкой большого
количества информации (в основном
шумовой). На основе тезауруса формируются
запросы к выбранным поисковым серверам,
после чего возможно уточнение запроса
с целью отсечения очевидно нерелевантной
информации. Затем производится отбор
ресурсов, начиная с наиболее интересных,
с точки зрения целей поиска. Данные с
ресурсов, признанных релевантными,
собираются для последующего анализа.

Формирование
запросов

Как
формат, так и семантика запросов
варьируются в зависимости от применяемой
поисковой машины и конкретной предметной
области. Запросы составляются так,
чтобы область поиска была максимально
конкретизирована и сужена.

Предпочтение
отдается использованию нескольких
узких запросов по сравнению с одним
расширенным. В общем случае для каждого
основного понятия из тезауруса готовится
отдельный пакет запросов. Так же
производится пробная реализация
запросов – как для уточнения и пополнения
тезауруса, так и с целью отсечения
шумовой информации.

Результат
запроса (список ссылок) обрабатывается
в два этапа. На первом этапе производится
отсечение очевидно нерелевантных
источников, попавших в выборку в силу
несовершенства поисковой машины или
недостаточной “интеллектуальности”
запроса. Параллельно проводится
семантический анализ, имеющий целью
уточнение тезауруса для модификации
последующих запросов. Дальнейшая
обработка производится путем
последовательного обращения на каждый
из найденных ресурсов и анализа
находящейся там информации.

Анализ
ресурсов и сбор информации

Первичный
анализ ресурсов основывается на
аннотациях – в случае их наличия, и в
необходимых случаях – на ознакомлении
с информационным наполнением ресурса.
Информация с отобранных источников
извлекается с использованием
соответствующих конкретному источнику
методов, что может потребовать
значительных коммуникационных,
вычислительных и дисковых ресурсов.

В
русскоязычной части Интернета в
настоящее время доступен ряд ресурсов,
предоставляющих вторичную информацию,
как правило, в табулированной форме.
Предоставление информации для публикации
в подобных источниках является более
дешевым вариантом для компаний, не
имеющих собственного представительства
в Интернете.


Владение
пользовательскими инструментами и
техникой

Следует
не забывать о команде Find броузера. Если
ваш броузер имеет в меню Файл, Правка
или Вид команду Find (Найти), используйте
ее для обнаружения трудноуловимых
ключевых слов страницы. Чтобы отыскать
слово, которое вам нужно, воспользуйтесь
комбинацией клавиш CTRL+F в вашем броузере
и введите искомое ключевое слово.

Необходимо
так же фиксировать результаты ссылками
и закладками:

1.
Сохраняйте ссылки на важные и часто
посещаемые страницы, используя команду
Добавить в “Избранное”. Используйте
подобные механизмы для регистрации
предварительных результатов поиска в
процессе беглого отбора с целью
дальнейшего подробного изучения.

2.
Поддерживайте свою персональную
коллекцию ссылок в рабочем состоянии:
актуализируйте и систематизируйте ее,
удаляйте устаревшие и ненужные.

3.
Некоторые машины поиска, например
AltaVista, позволяют отмечать закладкой
успешный результат поиска. Благодаря
этому позднее можно вернуться к данной
подборке документов и просмотреть ее.

4.
Существуют специализированные
программные средства – интегрируемые
модули расширения для стандартных
броузеров, которые индексируют
информационные ресурсы ранее посещаемых
узлов. Они способны выполнять
полнотекстовый поиск документов на
любом узле, включая результаты обработки
запросов.

Сохраняйте
копии важных документов. Активно
используйте команды контекстного меню
Сохранить объект как… и Сохранить
рисунок как… и команду меню Файл –
Сохранить как… для создания копий
необходимой вам информации из сети
Интернет на локальном ресурсе вашего
ПК. Этим вы решите некоторые проблемы:

1)
изменчивости и недолговечности WWW
(когда со своих адресов со временем
исчезают страницы и целые сайты),

2)
концентрации внимания исключительно
на целях определенного этапа поиска
(например отбор адресов или предварительный
просмотр найденной информации),

3)
экономии времени on-line подключения и
перевод изучения отобранных материалов
в режим off-line.

Отключайте
вывод изображений. Если вы не желаете
видеть многочисленные рекламные
заставки и для вас важен не дизайн
сайтов, а их содержательная информация,
измените заданный режим просмотра в
броузере на режим вывода только текста
(исключив возможности мультимедиа).
Это значительно увеличит скорость
поиска. При этом, если возникнет
необходимость быстрого просмотра
важной графической информации,
воспользуйтесь пунктом контекстного
меню Показать рисунок, кликнув для его
вызова правой кнопкой мыши в место
невыведенного рисунка.


Заключение

В
сети Интернет хранится очень большой
объем информации по различной тематике
в виде статей в электронных газетах,
отчетов, справочников, графических
изображений, аудио- и видео-файлов и
многого другого. Путешествуя по Интернет,
можно найти любую информацию, не выходя
из дома или офиса, иначе говоря, если
какие-либо данные вводились когда-либо
в компьютер, то вероятнее всего их можно
найти где-то на необозримых просторах
Интернет. Для этого нужен только
непосредственно сам компьютер,
подключенный к Интернет с установленной
специальной программой – браузером,
предназначенной для просмотра содержимого
Web-страниц.

С
появлением World Wide Web (WWW) – гипертекстовой
информационной системы, опутавшей весь
мир, связавшей сотни и сотни компьютеров,
тысячи и тысячи страниц гипертекстовых
документов – без высокоэффективных
средств поиска просто не обойтись.
Благодаря разнообразию поисковых
систем, специально разработанным для
рядового пользователя, каждый может
без труда отсечь заведомо ненужный
поток информации, лишь правильно
сформулировав цель поиска.


Список
литературы

Гармашов
М. Ю., Коротков А. М. Подготовка учащихся
к продуктивной деятельности в
дидактической компьютерной среде. –
Волгоград, 2001.

Норенков
И.П. Управление знаниями в
информационно-образовательной среде.
– М.: МЭСИ, 2000.

Путилов Г.П.
Концепция построения
информационно-образовательной среды
технического вуза. – М.: МГИЭМ, 1999.

Средства
поиска информации в INTERNET // Афанасий-биржа
(Тверь). – 28 марта 1997.

Усков В.Л.
Дистанционное инженерное образование
на базе Internet / Библиотечка журнала
“Информационные технологии”, 2000,
№ 3.

Методика поиска информации

Введение

Данная работа представляет собой антиреферат – анализ публикаций научного характера, темой которого является «Методика поиска информации».

Актуальность темы: Тема на сегодняшний момент времени имеет огромное значение для жизни общества. Тенденции развития цивилизации позволяют говорить о возрастающей роли информации. Информационная революция, которую сейчас переживает общество ставит своею целью создание глобальной информационной структуры, поэтому разнообразие информационных материалов чрезвычайно стало велико. Но возникновение препятствий на пути удовлетворения информационной потребности связано с причиной неумения выстроить информационный поиск адекватной информационной задаче, в результате чего возникает информационный дефицит. Поэтому методы поиска информации позволяют как студенту и педагогу, так и простому потребителю информации быстро и эффективно найти необходимую информацию.

Цель работы заключается в том, чтобы автор курсовой работы научился анализировать текст публикаций научного характера; привил навыки структурирования текстов и выделения из них поставленных автором статей проблем, а также изучил формы заимствований и приемы их использования, и приемы формирования заключения по проанализированным документам.

Поставленная цель решается посредством следующих задач:

– изучение темы антиреферата;

– проведение структурного анализа документов;

– рассмотрение методики заимствования.

Для написания работы автор использовал статьи из профессиональных, научных журналов, таких как «Библиотека» (2003 год), «Библиография» (2002 и 2006 год), «Мир библиографии» (2006 год), «Научные и технические библиотеки» (2002 год), «Компьютер-Пресс» (2006 год), «Научно-техническая информация» (2001 и 2010 год), книги по тематике, а также ресурсы сети Интернет.

Для написания своей работы автор рассмотрел труды ведущих специалистов, таких как: Паршукова Галина Борисовна, Галеева Ирина Салиховна, Романенко Владимир Николаевич, Никитина Галина Васильевна.

При подготовке автор встретился с незначительными трудностями в сфере выявления ведущих специалистов по теме, и по поиску научных статей данной темы: несмотря на то, что тема актуальна в наше время, научных исследований в ней проводится не много.

1. Изучение темы

1.1 Обзор темы

Самостоятельный информационный поиск, ориентированный на получение нужной информации должен обеспечивать решение следующих задач:

) поиск релевантной информации;

) поиск аналоговой информации в системных областях;

) обобщение и уточнение полученной информации;

) анализ и оценка информации исходя из собственных реальных задач.

Сложность задачи самостоятельного информационного поиска основана на объективном характере закона рассеяния информации по ансамблю источников, невозможность в одном месте собрать все источники документальной информации необходимые потребителю, и других особенностях информационного потока современности. В какой-то степени эти проблемы решаются использованием современных информационно-коммуникационных технологий, информационных ресурсов интернет. Однако полностью решить проблему информационного дефицита Интернет не может (встает вопрос о достоверности и аутентичности найденного) [9, с. 63-68].

Галина Борисовна Паршукова определяет четыре вида информационного поиска, которые тесно взаимосвязаны между собой:

библиографический (процесс прохождения необходимой библиографической информации по формальным и / или содержательным признакам документа [3, с. 203]);

– документальный (информационный поиск, при котором объектом поиска являются документы [4]);

– фактографический (информационный поиск, осуществляемый на основании фактографических данных, т.е. поиск по существу запроса [5, с. 72]);

аналитический.

В первую очередь четко следует определить основные этапы информационного поиска и особенности каждого из них:

. Формулирование задачи поиска обусловлено соответствует информационным дефицитом. Это краткое определение темы поиска. Оно позволяет определить область и особенности использования литературы, облегчить составление программы поиска.

. Разработка алгоритма поиска – он должен максимально развернуть и конкретизировать поставленную задачу.

. Реализация поиска – просмотр источников с одновременной оценкой их качества и корректировка перечня источников.

. Оформление результатов поиска.

При конкретизации цели и задач поиска следует учитывать целый ряд критериев, обусловленных объективным многообразием информационного потока.

·Цель поиска – документальный поиск – разыскать основные документы и издания по нужной тематике.

·Предмет поиска – тематический поиск – только по сформулированной теме.

·Жанр (вид) литературы – видовой поиск – преимущественно только книжные издания (монографии, сборники, справочники, статьи).

·Метод поиска – диалектический – использована вся возможная совокупность существующих методов поиска.

·Хронологический охват – ретроспективный поиск за любой период времени.

·Географический охват – страноведческий и краеведческий поиск – информационные источники, изданные в нашей стране и посвященные российским регионам (не исключая изданий, переведенных с иностранных языков).

·Полнота поиска – избирательный поиск – необходимы наиболее полные издания, описывающие всю искомую тематику.

·Интенсивность поиска – разовый – предпринятый специально только для настоящей работы.

Такая конкретизация способствует большей целенаправленности, глубине, всесторонности, методической рационализации и эффективности информационного поиска в каждом конкретном случае его использования [9, с. 65].

Для самостоятельного поиска информации пользователь может воспользоваться библиотекой и теми услугами, которые она предоставляет, и ресурсами сети Интернет.

Для поиска нужных изданий в библиотеке можно воспользоваться как традиционными каталогами (алфавитный, систематический, предметный, краеведческий) так и электронным каталогом.

В современных условиях приобрела чрезвычайную актуальность проблема автоматизированного информационного поиска. Это объясняется двумя главными причинами: во-первых, традиционный поиск становится все более трудоемким из-за быстрого увеличения массивов информации, в которых он производится; во-вторых, непрерывно растет число специалистов, число и сложность решаемых ими задач и как вследствие этого неуклонно возрастает число, сложность и срочность поступающих от них запросов. Поэтому библиографы все чаще обращаются к автоматизированному поиску, т.е. к электронному каталогу.

В библиотеках используются автоматизированные информационно-библиотечные системы (АИБС), т.к. помогают применить ряд мер от предоставления корректного выбора ключевых слов специализированных словарях, до создания электронных тезаурусов. Они могут быть библиотечные (АБС), информационно-библиотечные и библиотечно-информационные (АБИС), научно-техническая информация (АСНТИ). [3, с. 32-34]

Для того, чтобы найти нужную информацию в сети Интернет необходимо воспользоваться специальными поисковыми системами. Количество поисковых систем, поисковых машин и каталогов представляемые интернетом огромно, но по мере развития интернета обостряется парадокс – вероятность существования нужной информации возрастает, а возможность её нахождения уменьшается. В принципе гипертекстовая природа WWW обеспечивает нахождение любой информации в процессе целенаправленного продвижения по ссылкам. Однако найти нужное в этом пространстве, передвигаться от ссылки к ссылке, практически невозможно.

Поисковые системы (поиск входящим в узлы словам, являющимся расширенным алфавитного каталога) не всегда удобны. Во многих случаях трудно или невозможно сформулировать ключевые слова, но если тематика точно известна, наиболее подходящим инструментом поиска оказываются каталоги. Разные поисковые системы отличаются друг от друга деталями, но не общими принципами. Например:

● Google – это современный мощный поисковик, он остается исключительно поисковым узлом. Эта система быстро реагирует на запросы и снабжена привлекательным интерфейсом. (#”justify”>● Яndex самый лучший рубрицированный каталог русского интернета и поисковых роботов. (#”justify”>● АПОРТ – поисковая система по российским web-ресурсам с логической тематической структурой и развитой системой ссылок на наиболее интересные и острые материалы портала в целом.

Наиболее распространены в поисковых системах два вида поисковых ресурсов: каталоги и поисковые роботы. Каталоги Интернета составляются людьми – редакторами, просматривающими каждый новый сайт до его включения в индекс или самими составителями описаний. Каталоги обычно организованы в соответствии с предметной классификацией и содержат сведения о web-страницах. Количество каталогов выше, чем у поисковых машин, но люди не могут успеть за темпами расширения и изменение Интернета. Поисковые машины обходят всю сеть за несколько дней, при этом составляется весьма свежий и довольно подробный индекс – опись доступных ресурсов. Однако автоматизированный подход приводит к тому, что в индекс могут попасть дубликаты [9, с. 157-162].

Традиционно результаты поиска в информационных поисковых системах Интернета предъявляются пользователю в виде списка документов, упорядоченного по степени убывания релевантности найденных документов. Пожалуй, только Яndex дает возможность отсортировать найденные документы по дате последнего изменения документа.

Поиск информации через интернет можно условно разделить на три этапа:

1)Нормативные действия – искать, нужно используя две или более ИПС, формулировать запрос кратко или вводить ключевые слова, отражающие суть искомой информации по определенной теме;

2)Обязательные действия предпринимаются, если при первоначальном поиске не удалось сразу найти необходимую информацию. Предполагается уточнение или переформулирование запроса с учетом уже полученной информации;

)Вариативные действия предпринимаются, когда уточнение и / или изменение запроса не привело к должному результату. Здесь поиск ведется по выявлению специализированных ИПС баз данных и поиск в них [3, с. 122-136].

Таким образом, главной проблемой поиска информации является незнание и неиспользования методов, способов, планов поиска информации как традиционным способом (в библиотеке), так и в сети Интернет, выделение из найденной информации достоверной актуальной информации.

При появлении новых поисковых систем встает вопрос о том, как ими пользоваться и смогут ли они улучшить качество запрашиваемой информации.

1.2 Список авторов

интернет поиск робот информационный

Паршукова Галина Борисовна

Доктор культурологических наук, доцент. Заведующая кафедрой социально-массовых коммуникаций; преподает на факультете повышения квалификации преподавателей в Новосибирском Государственном Техническом Университете.

Публикации:

● Паршукова, Г.Б. Методика поиска профессиональной информации [Текст]: учеб. – метод. пособие / Г.Б. Паршукова. – Санкт – Петербург: Профессия, 2009. – 224 с. – (Библиотека).

● Паршукова, Г.Б. Профессиональная картина мира как цель современного высшего образования [Текст]: на примере в области с общественностью и рекламы / Г.Б. Паршукова // Философия образования. – 2010. – №3 (32). – С. 136-150.

● Паршукова, Г.Б. Информационные компетентности личности. Диагностика и формирование [Текст] / Г.Б. Паршукова. – Новосибирск: Изд-во НГТУ, 2006. – 244 с.

● Паршукова, Г.Б. Информационно-библиотечная среда образовательного пространства региона [Текст]: на примере Новосиб. обл. / Г.Б. Паршукова. – [Новосибирск]: ГПНТБ СО РАН, 2004. – 224 с.

Галеева Ирина Салиховна

Заведующая отделением цифровых технологий в Российской Научной библиотеке.

Направление деятельности – создание электронной библиотеки.

Публикации:

● Галеева, И.С. Интернет как инструмент библиографического поиска [Текст] / И.С. Галеева; науч. ред. М.И. Вершинин. – Санкт-Петербург: Профессия, 2007. – 248 с. – (Библиотека).

● Галеева, И.С. Справочник Информационные ресурсы Интернет [Текст]: опыт создания электронного путеводителя: (о первом опыте РНБ по каталогизации электронных ресурсов Интернет) / И.С. Галеева. – Санкт-Петербург, 2010. – 6 с.

● World wide web – стратегия эффективного поиска [Текст]: справ. для б-к / Рос. Нац. Библиотека; сост.: И.С. Галеева [и др.]; науч. ред. Е.Д. Жабко. – Санкт – Петербург: Рос. Нац. Б-ка, 2001. – 208 с.

Доктор технических наук, профессор. Научное направление – технические науки.

Публикации:

● Романенко, В.Н. Работа в Интернете: от бытового до профессионального поиска [Текст]: практ. пособие / В.Н. Романенко, Г.В. Никитина, В.С. Неверов. – Санкт-Петербург: Профессия, 2008. – 416 с. – (Библиотека).

● Романенко, В.Н. Сетевой информационный поиск [Текст]: практ. пособие / В.Н. Романенко. – Санкт-Петербург: Профессия, 2005. – 288 с.

1.3 Терминологический словарь

Актуальность информации – свойство информации сохранять свои свойства (ценность) для субъекта (пользователя) в течение определенного периода времени [9, с. 54].

База данных – совокупность связанных данных, организованных по определенным правилам, предусматривающими общие принципы описания, хранения и манипулирования, независимая от прикладных программ [4].

Библиографический поиск – процесс нахождения необходимой библиографической информации по формальным и / или содержательным признакам документа [3, с. 203].

Документ – (по законодательству РФ) – материальный объект с зафиксированной на нем информацией в виде текста, звукозаписи или изображения предназначенный для передачи во времени и пространстве в целях хранения и общественного использования [4].

Индексирование – индексирование предметного содержания документов [4].

Индексирование (в информационном поиске) – процесс описания документов и запросов в терминах информационно-поискового языка. По результатам индексирования каждому документу назначается набор ключевых слов, отражающих его смысловое содержание [4].

Информация – это форма существования знания, отчужденного от автора и ставшего общественным достоянием [9, с. 14].

Информационное общество – концепция постиндустриального общества; новая историческая фаза развития цивилизации, в котором главным продуктом производства является информация и знание [9, с. 9].

Информационный дефицит – недостаточность информации [9, с. 32].

Информационный шум – сообщения и данные, не представляющие значимости для пользователя информации [13, с. 354].

Онлайновый поиск – поиск конкретной информации конкретной поисковой системой [3, с. 204].

Пертинентность информации – соответствие полученной информации информационной потребности пользователя [4].

Потребитель информации – (по законодательству РФ) – субъект, обращающийся к информационной системе или посреднику за получением необходимой ему информации [4].

Релевантная информация – соответствие полученной информации информационному запросу [5, с. 60].

Стратегия поиска – систематический план проведения поиска [3, с. 205].

Старение информации – возрастающее по времени её не соответствие нуждам потребителям информации [9, с. 26].

2. Структурный анализ документа

.Сукиасян, Э.Р. Homo Quaerens (человек ищущий) [Текст]: К проблеме развития познавательных способностей читателя в процессе информационного поиска / Э.Р. Сукиасян // Научные и технические библиотеки. – 2002. – №4. – С. 73-84.

ПараметрАнализ структурной частиЦель документаПредставить значимость систематического электронного каталога для обеспечения оперативного и эффективного информационного поиска для читателей библиотек РГБ.Методологическая основа документаАвтор при написании статьи использовал свою работу (доклад) под таким же названием как статья, только на английском языке.Актуальность анализируемой статьи«..В дискуссии о взаимоотношениях между пользователями и компьютерами в библиотеках потерялось понимание развивающей, когнитивной функции электронного каталога. Далеко не всегда читатель формулирует свой запрос грамотно. Каждый читатель имеет в голове собственный тезаурус и накопленный личный опыт решения поисковых задач. Тем не менее мы придерживаемся того мнения, что только сам читатель может организовать и провести поиск в направлении, которое ему необходимо, выбрать желательные параметры поиска, а затем отобрать в полученном массиве нужную информацию. Информационный поиск – это функция читателя пользователя» [16, с. 76]. «А при использовании предметных рубрик обеспечит и предметный доступ к массивам информации. В 2001 году мы убедились в том, что ни один из функционирующих электронных каталогов в нашей стране не смог заменить карточный системный каталог» [16, с. 79]. Тема, рассматривая автором, актуальна и по сей день.Проблемы рассматриваемые автором1. Проблема использования АИБС (Автоматизированная информационно-библиотечная система); 2. Проблема обучения читателей работе с электронным каталогом для поиска необходимой информации; 3. Проблема АИБС не имеющих открытого доступа к фондам; 4. Проблема отсутствия систематических каталогов в электронном каталоге.Структура документаСтатья начинается с вводной части, далее делится на 4 блока: – Поиск – функция читателя работающего с каталогом; – Классификационная система и тезаурус как инструменты поиска; – ББК как поисковой инструмент электронного каталога; – Читатель как систематизатор. Заканчивается статья выводом.Терминосистема документаАвтор в своей статье не дает определений.Формирование выводовРассмотренные проблемы в статье с очевидностью доказывают, что появление в библиотеках России электронных каталогов, в которых вопросы тематического (содержательного) поиска либо вовсе не решены, либо решены примитивным образом, существенно ограничивая права и возможности читателя. Разработчики библиотечных АИБС исходят сегодня из неверной посылки о том, что электронный каталог должен обеспечивать оперативный поиск библиографической информации. По сути дела тематического поиска с использованием возможностей классификационных систем- иначе говоря, того самого поиска, который обеспечивал систематический каталог- в электронных каталогах нет.

.Максимов, Н.В. Информационный поиск и модели поведения пользователей [Текст] / Н.В. Максимов, Н.Н. Забегаева // Научно – техническая информация. – 2001. – №11. – С. 10-21.

ПараметрАнализ структурной частиЦель документаРассмотреть особенности восприятия и использование информации в контексте задач информационного поиска в документных базах данных. Проанализировать уровневую модель человеко-машинного взаимодействия.Методологическая основа документаАвтор статьи использовал для написания 24 источника, на которые даны ссылки в конце статьи.Актуальность анализируемой темыДанная тема рассматриваемая автором публикации актуальна, т.к. зная психотипы пользователей информационного поиска можно разработать для отдельного человека стратегию и технологию поиска нужной информации, а также улучшить восприятие её.Проблемы рассматриваемые автором-Проблема восприятия информации; – Проблема типов поискового поведения; – Проблема взаимодействия с поисковой системой (человеко-машинного взаимодействия); – Проблема стратегии и технологии поиска.Структура документаДанная статья начинается с вводного слова, затем текст разделён на 10 смысловых блоков, в которых автор анализирует тему статьи: – Человеко-машинный поиск. – Типология поисковых задач и план действия. – Информационная потребность пользователя и типология информационной неопределенности. – Стратегия и технология поиска. – Стереотипы поведения пользователя. – Когнитивные аспекты человеко-машинного взаимодействия. – Восприятие информации. – Понимание и мышление. – Типология и стереотипы поведения пользователей. – Исследование поведения пользователей. Статья заканчивается небольшим выводом, в конце статьи приведен список литературы.Терминосистема документаТехнология поиска – последовательность выполнения этапов с использованием соответствующих технологических средств, которые позволяют управлять действиями на каждом шаге и получать адекватный результат. Стратегия поиска – внутренняя предопределенность пользователем на достижение цели, диктующая выбор технологий и характер навигации, обусловленный технологичностью средств, целями поиска и субъективными наклонностями пользователя. Интерфейс пользователя – это совокупность правил, методов и программно-аппаратных средств, обеспечивающих взаимодействие пользователя с компьютером.Формулирование выводовТаким образом, информация рассматривается как отражение, результат упорядочения и структурирования разнообразия описания объектов поиска и их взаимодействие в реальном мире. В результате чего выделяется два типа стратегий поиска: 1) поиск, при котором пользователь, получив вначале большое число документов, постепенно уточняет свой запрос и в итоге получает небольшую выдачу, содержащей высокий процент релевантных документов, при этом он активно использует средства позволяющие работать с лексикой системы (словари, словники); 2) поиск, при котором пользователь, получив большую выдачу, не торопиться реформулировать запрос, а просматривает значительную часть выдачи, может быть, находит релевантные документы, с помощью лексики которых строит свою дальнейшую стратегию.

.Попов, В.С. Поиск информации и принятие решений [Текст] / С.В. Попов // Научно – техническая информация. – 2001. – №1. – С. 1-4.

ПараметрАнализ структурной частиЦель документаРассмотреть противоречие между различными направлениями теоретической информатики и отсутствия единого фундамента, по которому должно строится информационное общество. А также найти ответы на вопросы: – можно ли с 100% вероятностью превратить имеющуюся информацию в безошибочное решение? – если нет, то, при каких условиях это решение будет наиболее вероятным и какова эта вероятность?Методологическая основа документаПри написании статьи автор использовал один источник.Актуальность анализируемой темыНа взгляд автора статья является актуальной, потому что рассматриваемая проблема информационного тоталитаризма, который угнетает современное общество, когда большинство решений спускается незаметным образом из какого-то анонимного центра и навязывается не с помощью силы, а вследствие отсутствия у общества достоверной и полной информации.Проблемы рассматриваемые автором- Проблема информационного тоталитаризма; – Проблема определения критериев эффективности информационных систем; – Проблема конфликта информационной потребности и информационного запроса.Структура документаДанная статья состоит из двух блоков: – в первом блоке автор описывает исследования предшественника; – во втором блоке рассматривает собственное решение проблем темы. Заканчивается статья небольшим выводом.Терминосистема документаАвтор в своей статье не дает определений.Формулирование выводаПроанализировав статью можно сделать вывод: – имеющуюся информацию не возможно со 100% вероятностью превратить в безошибочное решение; – правильное решение будет наиболее вероятным, если лицу предпринимающему решение, дополнительно предоставить информацию по стратегии поиска информации.

.Овченкова, Е.А. Интернет как глобальная система поиска научных статей по информации и коммуникации [Текст] / Е.А. Овченкова // Научно – техническая информация. Серия 1. – 2010. – №7. – С. 26-34.

ПараметрАнализ структурной частиЦель документаОписать особенности поиска научных статей через интернет, на примере поиска информации по теме: информации и коммуникации.Методологическая основа документаДля написания статьи автор использовал один источник предшественника и на семь ссылается в пристатейном списке литературы.Актуальность анализируемой темыТема, заявленная автором статьи актуальна, потому что методики поиска информации в интернете очень разнообразны, но не каждая может предоставить более эффективный достоверный результат по запросу. Приведенные в статье методики могут помочь в поиске нужной информации, так как хранение и обработка огромных объёмов информации становится возможным только благодаря интернету – одному из средств доступа к базам данных всемирного масштаба.Проблемы рассматриваемые автором-Проблема эффективного поиска научной информации.Структура документаСтатья начинается с введения, затем представлен большой блок, где автор предлагает свой метод поиска информации: Методика поиска научной информации в сети интернет; затем идет заключение и список литературы.Терминосистема документаИнтернет – это особого рода информационная среда, главными функциями которой является как хранение информации, так и её обработка и передача. Формулирование выводаВ статье были описаны объект и средства поиска научной информации. Выбор объекта поиска, средства поиска и специфика поисковой информации непосредственно определяют результат выдачи информации. В ходе исследования ресурсов Интернет было выявлено, что не все ресурсы Интернета одинаково подходят для поиска научной информации. Поэтому становится очевидным, что поиск информации в Интернете рассматривается более как процесс решения поисковой задачи пользователем, а не просто как нахождение релевантной запросу информации.

. Ситник, С.М. Информационный поиск [Текст]: здесь и сейчас! / С.М. Ситник, Е.А. Бондаренко // Библиотека. – 2003. – №3. – С. 52-54.

ПараметрАнализ структурной частиЦель документаПоказать значимость квалифицированных сотрудников для работы с информационными ресурсами всех форм и видов и умения последовательного выполнения информационного поиска.Методологическая основа документаАвторы не использовали дополнительную литературу для написания статьи.Актуальность анализируемой темыТема, поднятая авторами статьи актуальна среди библиографов специалистов, так как обеспечение доступа к глобальным информационным сетям увеличивает возможности уже существующего библиотечного сервиса, и использование Интернета пользователем поможет выявить принципиально новые источники и получить информацию о появлении новой литературы, поэтому возрастает роль библиотекарей-библиографов, посредников, которые «фильтруют» и обрабатывают информацию, а затем доносят её до потребительской среды.Проблемы рассматриваемые автором- Проблема недостатка квалифицированных специалистов библиографов; – Проблема поиска информации.Структура документаСтатья имеет небольшое вводное слово, затем следует основная часть статьи и заканчивается небольшим выводом.Терминосистема документаИнформационный поиск – это поиск документов, сведений или фактов, соответствующих информационному запросу.Формулирование выводаПроблема недостатка специалистов решается переориентированием работы с информационными ресурсами. А также закономерно, что удельный вес электронных источников поиска в арсенале современного библиографа неуклонно возрастает.

. Коряковцева, Н.А. Инструменты поиска в информационной среде библиотеки и пространстве Интернета [Текст] / Н.А. Коряковцева // Мир библиографии. – 2006. – №3. – С. 62-64.

ПараметрАнализ структурной частиЦель документаПоказать значимость информационного поиска в информационной среде библиотеки и в пространстве Интернета.Методология документаАвтор при написании статьи ссылается на два источника.Актуальность анализируемой темыНовые технологии быстро развиваются, охватывая все виды общественной деятельности. Они изменили процесс передачи информации и всю библиотечную систему в целом. При этом, какие бы материальные носители или технические устройства ни использовались для передачи и поиска информации, этот процесс обеспечивает доступ к информации, содержание которой представляет ценность для пользователя.Проблемы рассматриваемые автором- Проблема доступа к информации.Структура документаСтатья начинается сразу с рассмотрения проблемы и заканчивается заключением.Терминосистема документаРобот(spider) – программа, которая просматривает web – страницы, индексирует их содержимое, следуя по ссылкам, найденным в нутрии документов, и возобновляет работу через определенное время. Индексы – база данных о проиндексированных роботом документах. Поисковый механизм – программа, проверяющая в соответствии запросом пользователя содержание индексов.Формулирование выводовПоявление электронных каталогов в библиотеках вывело поиск информации на качественно новый уровень. Поиск по ключевым словам значительно облегчил доступ к информации. Трансформация традиционных технологий и их интеграция с новыми возникшими в условиях информационного общества, позволяют стать не только информационными, но и информационно-образовательными центрами.7. Романенко, В.Н. Из чего складывается практический поиск информации в Сети [Текст] / В.Н. Романенко, Г.В. Никитина // Работа в интернете: от бытового до профессионального поиска / указать ответственных за издание. – Санкт – Петербург: Профессия, 2008. – С. 175-179.

ПараметрАнализ структурной частиЦель документаОпределить типы поиска информации в сети Интернет.Методологическая основа документаСтатья написана на основе двух источников (Аверченков В.И., Фишкин А.В.).Актуальность анализируемой темыАктуальность заключается в том, что авторы раскрывают методику правильного информационного поиска в Интернете. В Интернет вовлечено огромное количество пользователей с разными интересами и разной подготовкой, поэтому чтобы найти то, что действительно надо, необходимо знать, как искать.Проблемы рассматриваемые автором-Проблема выбора последовательности и характера поисковых операций.Структура документаСтатья состоит из небольшого вводного слова, основной части и заключения, содержащего небольшой вывод.Терминосистема документаЕстественный запрос – запрос, задаваемый на естественном языке. Последовательный поиск – процедура поиска, в процессе которого запросы уточняются. Прямой поиск – усложнение поискового запроса.Формулирование выводовСтратегия поиска сводится к тому, что после формулировки цели, пользователь ставит перед поисковой системой определённые вопросы. Это техническая составляющая поиска. Простые вопросы часто задаются с использованием дополнительных операторов, которые позволяют осуществлять поиск в определенных зонах ресурса. В этих случаях используются специальные операторы. В процессе поиска вопросы уточняются – это последовательный поиск. Иными словами все запросы могут быть первичными и уточненными. В результате чего можно говорить о простом, расширенном и сложном поиске. Также сложный поиск может включать в себя и простой поиск. Большинство практических поисковых задач решается методами сложного поиска, вследствие чего поиск можно разделить на бытовой, профессионально ориентированный и уточненный поиск.

. Прохоров, А. Эффективный поиск в Интернете [Текст] / А. Прохоров // Компьютер Пресс. – 2006. – №2. – С. 40-45.

ПараметрАнализ составной частиЦель документаПредоставить алгоритм действия при поиске в Сети Интернет.Методологическая основаДля написания статьи автор использовал два ресурса сети интернет (Артон Консалдинг, Nielsen NetRatings).Актуальность анализируемой темыТот факт, что сегодня всё больше работодателей обращают внимание на навыки сотрудников по поиску информации в Интернете и даже прибегают к услугам коммерческих служб поиска информации, говорит о том, что для эффективного поиска нужны определенные навыки и опыт – это делает статью актуальной в наше время.Проблемы рассматриваемые автором- Проблема достоверности документов в Сети; – Проблема экономии времени при поиске информации в Сети; – Проблема быстрого поиска информации в Сети.Структура документаСтатья имеет вводное слово, затем представлено три смысловых блока (в них рассматриваются работы предшественников, и приводятся результаты своего исследование): – Где искать, чтобы доверять; – Как искать, чтобы экономить время; – Где искать, чтобы быстрее находить. Статья заканчивается заключением с рекомендациями по поиску информации в сети интернет.Терминосистема документаМетопоисковая система – приложение, позволяющее передавать запрос пользователя сразу в несколько поисковых систем.Формулирование выводаВ выводе необходимо отметить, что при поиске нужно использовать инструменты разного профиля: поиск в каталоге дает представление о структуре вопроса, поисковая система позволяет найти конкретный документ, при поиске в поисковой машине надо избегать общих слов, чем уникальнее ключевое слово, тем больше шансов найти именно то, что нужно. Проводить поиск больше чем по одному слову и использовать синонимы. Использовать функцию «Найти похожие документы». А также надо пользоваться языком запросов – он поможет сделать запрос более точным, и применять расширенный запрос. Но если совсем не удается ничего найти надо использовать метопоисковую систему.

. Алёшин, И.Л. Поиск документов [Текст]: анализ и новые возможности / И.Л. Алёшин // Библиография. – 2002. – №4. – С. 14-22.

ПараметрАнализ составной частиЦель документаСформулировать стратегию релевантного поиска документов необходимых пользователю, с помощью «Анализатора текста».Методологическая основа документаАвтор при написании статьи использовал восемь источников.Актуальность анализируемой темыС появлением первых библиографических поисковых механизмов, входящих в состав автоматизированных библиотечно-информационных систем и электронных каталогов остро возникла проблема расширения поисковых элементов, поэтому тема рассматриваемая автором статьи столь актуальна в наше время.Проблемы рассматриваемые автором- Проблема недостаточно эффективного релевантного поиска документов уже существующими методами; – Проблема «ключевого слова» при поиске релевантных документов.Структура документаСтатья начинается с вводного слова, где автор статьи рассматривает работы авторов предшественников, затем автор описывает свою методику и полученные результаты в заключительном слове.Терминосистема документаАнализатор текста – программное обеспечение использующие элементы вычислительной лингвистики и предназначенного для анализа и составление из ведённого пользователем текста списка ключевых слов, и может произвести автоматическое реферирование текста.Формулирование выводаТаким образом, при использовании «Анализатора текста», отпадает потребность ввода ключевого слова и создание специальных электронных рубрикаторов, такое решение снимает значительный груз забот и работ систематизаторов и библиографов при описании документов и создании соответствующих библиографических записей в электронных каталогах библиотек. Рефераты созданные анализатором текста можно будет включать в соответствующие поля библиографических записей в электронных базах и банках данных (в том числе и электронных каталогах), что будет способствовать максимальному раскрытию фондов библиотек и не перегрузит аппаратные средства большими объемами машинно-читаемых данных. Более того поиск будет проходить быстрее, чем при извлечении необходимых сведений из полных текстов. А также поиск по ключевым словам, образующим такие рефераты, может значительно улучшить ситуацию с релевантностью.

. Берестова, Т.Ф. Поисковые инструменты библиотеки [Текст] / Т.Ф. Берестова // Библиография. – 2006. – №6. – С. 18-30.

ПараметрАнализ составной частиЦель документаПоказать ценность навигационно-поискового аппарата библиотек.Методологическая основа документаВ статье автор использовал 21 источник, на которые дает ссылки прямо в тексте.Актуальность анализируемой темыИзменения, происходящие в информационном пространстве библиотек происходит в результате создания информации, развитие форм её сохранения и передачи. Постоянное стремление пользователя библиотеки расширить своё информационное пространство побуждает библиотечный персонал преодолевать информационные барьеры, объективно существующие между потребителем и информацией, оно осуществляется через освоение и / или создание новых технологий, библиотечных услуг и в первую очередь, в результате расширения ассортимента видов поиска, проводимых пользователями библиотек и её персоналом – поэтому тема, рассматриваемая в статье автором актуальна и сейчас.Проблемы рассматриваемые автором- Проблема разработки согласованного эффективного и навигационно-поискового аппарата библиотеки; – Проблема преодоления информационного барьера между потребителем и информацией.Структура документаСтатья начинается с водного слова, затем идет блок с обзором работ авторов предшественников и собственного исследования (Диссертационное исследование на соискание учёной степени доктора педагогических наук «Общедоступная библиотека как часть информационного пространства: теоретико-методологические основания), полученные результаты оформлены в небольшое заключительное слово.Терминосистема документаИнформационное пространство – это материально-духовный конструкт, обеспечивающий сосуществование и взаимодействие вербальной или документальной коммуникации. Навигационно-поисковый аппарат – это средство ориентации в муниципальном, региональном, федеративном, мировом информационном пространстве, он должен стать механизмом навигации по информационному пространству, освоенному библиотекой и / или созданному ею. Электронная библиотека – это фонд локальных или распределенных электронных документов, объединенных единой идеологией структуризации и доступа к ним через комплекс или единичную ИПЯ, сформированные библиотечным персоналом на основе имеющихся материально-технических возможностях и в обязательном соответствии с информационными потребностями её пользователей.Формулирование выводовТаким образом, согласование элементов и частей навигационно-поискового аппарата библиотеки и внутри её пространства в целом направленные на обеспечение комфортных условий получения документов пользователем. Вероятность того, что «информационный голод» пользователя библиотеки будет утолен, достаточно велика, если библиотека имеет доступ к удаленным источникам. И чтобы обеспечить создание информационного пространства как наиболее комфортных условий получения информации, библиотека должна преодолеть информационные барьеры. Используя все имеющиеся методические и технико-технологические средства поиска.

3. Методика заимствования

.Попов, В.С. Поиск информации и принятие решений [Текст] / С.В. Попов // Научно – техническая информация. – 2001. – №1. – С. 1-4.

№ ссылкиИзложение содержанияПлагиатЦитированиеКритический анализУпоминание1++

·Автор использовал прямое цитирование, потому что выбранный текст стоит в кавычках и с указанием с какого источника цитировалось.

Лепский, В.Е. доклад под названием «Технократический подход к информации общества – источник угроз национальной безопасности России» на II Всероссийской научной конференции «Россия XXI век» Москва 1999 г., С. 143-147.

««…определил те признаки нарождающегося информационного общества, которые являются, по его мнению, потенциальными источниками угроз тотального манипулирования человеком и сообществами:

анонимность источников информации;

манипулирование навигацией пользователей;

манипулирование сообществами пользователей;

манипулирование предпочтениями пользователей и их потребностями;

стрессовые воздействия и возникновение синдрома зависимости от кибер-пространства;

сочетание безграничных информационных просторов и примитивных средств навигации, манипулированных узкой группой фирм.» …»

·Автор использовал упоминание автора предшественника и его работу: «По мнению профессора Лепского, «доминанта технократического подхода к информатизации общества завела эти процессы в глубокий кризис».

Вывод: автор анализируемой статьи для написания своей работы использовал прямое цитирование и упоминание работы автора предшественника.

. Овченкова, Е.А. Интернет как глобальная система поиска научных статей по информации и коммуникации [Текст] / Е.А. Овченкова // Научно-техническая информация. Серия 1. – 2010. – №7. – С. 26-34.

№ ссылкиИзложение содержанияКритический анализПлагиатЦитированиеУпоминание1+2+3+4+5+6+7+8+

1) Прямое цитирование, так как определение взято в кавычки и указан адрес, откуда взято определение.

Глоссарий: Служба тематических толковых словарей / EDI – Press &Web Mission [Электрон. ресурс]. – режим доступа: #”justify”>«Информация и коммуникация – это двигатели прогресса в современном информационном обществе, в котором главными продуктами производства является информация и знание».

) Автор использовал прямое цитирование текста, из – за большого объёма нет возможности воспроизвести весь цитируемый текст (на стр. 26-27).

Паршукова, Г.Б. Тема 1. Современные документальные научно-технические коммуникации. – 2005. Режим доступа: #”justify”>) Автор в свою работу вставил определение с форума без кавычек и написания имени, это плагиат.

Современный экономический словарь // Яндекс словари. Режим доступа: #”justify”>«Сайт в Интернете – визитная карточка любой компании или частного пользователя в увлекательной графике, от простой информационной странички до путеводителя по конкретной области знания или сфере бизнеса. Отдельные крупные фрагменты сайта, а иногда и сами сайты называют порталом».

) Автор использовал прямое цитирование, так как определение взято в кавычки и есть ссылка на то, откуда взят текст.

Гражданский кодекс РФ. Часть 4. Ст. 1260.режим доступа: #”justify”>«согласно ст. 1260 ГК РФ «базой данных является предоставленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены с помощью электронной вычислительной машины».

) Большой юридический словарь ОНЛАЙН. База данных. Режим доступа: #”justify”>«База данных – по законодательству РФ об авторстве объективная форма представлений и организаций….» весь цитируемый текст находится на стр. 30.

) Автор статьи излагает содержание текста автора предшественника в своей работе.

Дементьева Е.В. Модернизация работы МБА и создание службы электронной доставки документов на базе протокола Z39.50 // электронные библиотеки. – 2000. – Т. 3. – Выпуск 1. – Режим доступа: #”justify”>«…но существует протокол Z39.50, который предоставляет возможность пользователю предоставить и получить данные из множества электронных каталогов, объединенный в некоторый консорциум….» – из-за большого объёма излагаемого текста нет возможности воспроизвести его целиком, весь текст находится на стр. 31-32.

) Прямое цитирование текста, с взятием текста в кавычки и указанием источника.

Энциклопедия русского SEO/ Поисковая система. Режим доступа: #”justify”>«Поисковая система – сайт, предназначенный для поиска пользователем информации в Интернете».

) Прямое цитирование текста, с взятием текста в кавычки и указанием источника.

«Управляемую передачу информации между двумя или более лицами и / или системами».

Вывод: Автор статьи в основном использовал цитирование из источников, а также использовал изложение текста, но автор однократно прибёг в своей работе к плагиату.

3. Коряковцева, Н.А. Инструменты поиска в информационной среде библиотеки и пространстве Интернета [Текст] / Н.А. Коряковцева // Мир библиографии. – 2006. – №3. – С. 62-64.

№ссылкиИзложение содержанияКритический анализПлагиатЦитированиеУпоминание1+2+

) Прямое цитирование текста, с взятием текста в кавычки и указанием источника.

Культура и культуротехника в контексте образования. Сб. ст. / Сост. и отв. ред. В.А. Никитин. Тольятти, 1994, С. 3.

«…Он создан в дополнение к термину «культурология», который подразумевает познавательное отношение к культуре, описание её как естественного явления, и обозначает техническое отношение к культуре как к результату искусственного воздействия. Культуротехника ориентирована на выделение, прежде всего техник, процедур и операций деятельности тех, кто работает с культурой, задавая формы описания, анализа, систематизации её явлений».

) Прямое цитирование текста, с взятием текста в кавычки и указанием источника.

Сайт «Виртуальный компьютерный музей»: HTTP://www.COMPUTER-MUSEUM.ru/histoft/hypertxt/htm.

«…гипертекст не только какая-то новая идея, сколько находящаяся в эволюции концепций возможного применения компьютера».

Вывод: автор статьи над работой своего исследования прибег к прямому цитированию текстов предшественников.

. Прохоров, А. Эффективный поиск в Интернете [Текст] / А. Прохоров // Компьютер Пресс. – 2006. – №2. – С. 40-45.

№ссылкиИзложение содержанияКритический анализПлагиатЦитированиеУпоминание12+

) #”justify”>) Исследование специалистов «Артон Консалдинг» в 2005 году.

«Анализ популярности поисковых систем осуществлялся на базе 110 тысяч обращений на исследуемые сайты риелторских агенств и автосалонов….» – из – за большого объема текста нет возможности весь его воспроизвести, он расположен на стр. 41.

Вывод: Автор в своем исследовании использует цитирование результатов исследования компании, с взятием текста в кавычки.

. Романенко, В.Н. Из чего складывается практический поиск информации в Сети [Текст] / В.Н. Романенко, Г.В. Никитина // Работа в интернете: от бытового до профессионального поиска. – Санкт – Петербург: Профессия, 2008. – С. 175-179.

№ссылкиИзложение содержанияКритический анализПлагиатЦитированиеУпоминание1+2+

) Аверченков, В.И. Информационный поиск в сети Интернет: учеб. пособие / В.И. Аверченков, С.М. Рощин. – Брянск: изд-во БГТУ, 2001. – 204 с.

«…Поиск информации имеет несколько составляющих…» – Из-за большого объёма текста нет возможности воспроизвести его, он находится на стр. 176.

) Фишкин А.В. Поиск в Интернете / А.В. Фишкин. М.: Альфа-пресс, 2005. – 112 с.

«…На самом деле работа с запросами – это только техническая часть всей процедуры или тактики сетевого поиска…» – Из-за большого объёма текста нет возможности воспроизвести его, он находится на стр. 176.

Вывод: Автор для написания своей работы использовал плагиат, потому что взятые тексты не были взяты в кавычки, в тексте не упоминались авторы предшественники откуда были взяты материалы, а просто в конце статьи был приведен список использованной литературы.

Заключение

Таким образом, автор антиреферата рассмотрев статьи, приобрел навыки структурного анализа текста научного характера: научился выделять проблемы рассматриваемые автором статьи, научился формулировать актуальность проблем, а также в публикации выявлять цель написания статьи. Анализ рассмотренных статей, дали возможность научиться пользоваться и распознавать методы заимствования в научных статьях.

Делая общий вывод по теме работы можно сказать, что самое главное для самостоятельного поиска информации – это знать методы и способы поиска информации. К тому же традиционный поиск в библиотеках в первую очередь дает высокий процент релевантной искомой информации, но он длителен по времени, а электронные ресурсы (электронные библиотеки, электронные каталоги, базы данных, поисковые машины) дают возможности быстрого и эффективного поиска, но не отвечают за релевантность искомой информации потребителем.

Библиографический список

1. Алёшин, И.Л. Поиск документов [Текст]: анализ и новые возможности / И.Л. Алёшин // Библиография. – 2002. – №4. – С. 14-22.

. Берестова, Т.Ф. Поисковые инструменты библиотеки [Текст] / Т.Ф. Берестова // Библиография. – 2006. – №6. – С. 18-30.

. Галеева, И.С. Интернет как инструмент библиографического поиска [Текст] / И.С. Галеева; науч. ред. М.И. Вершинин. – Санкт – Петербург: Профессия, 2007. – 248 с. – (Библиотека).

. Глоссарий. ru [Электронный ресурс]: служба темат. толковых слов. / Web-and-Pess // Glossary/ru [Электронный ресурс] / Web-and-Pess. – Электрон. дан. – Москва: Изд-во Web-and-Pess, [2011]. – URL.: #”justify”>. Информационные технологии [Текст]: учеб.-метод. пособие для студентов специальности 071201 БИД / сост. М.Ф. Кряжева; Тюм. Гос. Академия культуры и искусств, каф. библ.-информ. деятельности. – Тюмень: РИЦ ТГАКИ, 2009. – 104 с.

. Коряковцева, Н.А. Инструменты поиска в информационной среде библиотеки и пространства Интернета [Текст] / Н.А. Коряковцева // Мир библиографии. – 2006. – №3. – С. 62-64.

. Максимов, Н.В. Информационный поиск и модели поведения пользователей [Текст] / Н.В. Максимов, Н.Н. Забегаева // Научно-техническая информация. – 2001. – №1. – С. 1-4.

. Овченкова, Е.А. Интернет как глобальная система поиска научных статей по информации и коммуникации [Текст] / Е.А. Овченкова // Научно – техническая информация. Серия 1. – 2010. – №7. – С. 26-34.

. Паршукова, Г.Б. Методика поиска профессиональной информации [Текст]: учеб.-метод. пособие / Г.Б. Паршукова. – Санкт – Петербург: Профессия, 2009. – 224 с. – (Библиотека).

. Попов, С.В. Поиск информации и принятие решений [Текст] / С.В. Попов // Научно-техническая информация. – 2001. – №1. – С. 1-4.

. Прохоров, А. Эффективный поиск в Интернете [Текст] / А. Прохоров // Компьютер Пресс. – 2006. – №2. – С. 40-45.

. Романенко, В.Н. Из чего складывается практический поиск информации в Сети [Текст] / В.Н. Романенко, Г.В. Никитина // Работа в интернете: от бытового до профессионального поиска / В.Н. Романенко, Г.В. Никитина. – Санкт – Петербург: Профессия, 2008. – С. 175-179.

. Российская энциклопедия по охране труда. Т. 3 [Текст]: С – Я / гл. ред. В.И. Бородулина. – 2-е изд., перераб. и доп. – Москва: Изд-во НЦ ЭНАС, 2007. – 400 с.: ил.

. Ситник, С.М. Информационный поиск [Текст]: здесь и сейчас! / С.М. Ситник, Е.А. Бондаренко // Библиотека. – 2003. – №3. – С. 52-54.

. Справочник библиотекаря [Текст] / науч. ред. А.И. Ванеев. – 4-е изд., перераб. и доп. – Санкт – Петербург: Профессия, 2010. – 640 с. – (Библиотека)

. Сукиасян, Э.Р. Homo Quaerens (человек ищущий) [Текст]: К проблеме развития познавательных способностей читателя в процессе информационного поиска / Э.Р. Сукиасян // Научные и технические библиотеки. – 2002. – №4. – С. 73-84.