Язык запросов поисковой системы реферат

Обновлено: 04.05.2023

Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей – проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По различным данным, в 2004 г. количество пользователей глобальной системы Интернет составило от 600 до 900 миллионов человек. Это число продолжает стремительно расти и уже в 2006 г. оно достигло миллиарда человек. Сегодня глобальная сеть превращается в важный социальный и политический фактор современного информационного общества. С развитием Интернет-технологий появился новый гигантский источник информационных ресурсов, доступ к которым является не только относительно дешевым, но и очень быстрым.

Поиск в компьютерных сетях становится искусством и требует вполне определённых знаний, которыми современному человеку необходимо овладеть. Я выбрала данную тему реферата, так как считаю что одной из составляющей грамотной работы в Интернет является умение работать в глобальной сети. И для того, чтобы не утонуть во всём изобилии информации необходимо научиться не только её искать, но и находить.

Задачи и стратегии поиска

Дать общий рецепт эффективной стратегии поиска информации в Интернет, пожалуй, невозможно. Есть лишь некоторые принципы, позволяющие тратить меньше времени. Вот некоторые из них. Например, вам необходимо узнать, где обитает трёхлапый ленивец, то вряд ли вы пойдете в алфавитный каталог библиотеки. Может быть, вы найдете нужную литературу с помощью систематического каталога. С несколько большей вероятностью – с помощью предметного. Но, скорее всего, ни один из библиотечных каталогов вам не поможет. Но, зайдя в информационно-библиографический отдел крупной библиотеки, дежурный библиограф достанет библиографический указатель по животным или какую-то похожую книжицу, из которой вы и найдете ответ на свой вопрос. Подобную стратегию можно с успехом применять и в Интернет. В ИПС(информационно-поисковых сетях) общего назначения можно утонуть в тысячах ссылок, выданных вам на простой запрос. Целью использования универсальной ИПС общего назначения может быть поиск специализированной ИПС, посвященной тематике вашего поиска. Такая ИПС может быть распознана по наличию слов “информация (information)”, “документ (document)” и т.п. Но часто специализированная ИПС может скрываться на сервере общественной, профессиональной или специализированной организации, издательства.

Этот пример иллюстрирует еще один элемент стратегии: читайте найденные документы в поисках наиболее точных терминов и связей между терминами. Возможно, вы мыслите в совершенно не тех терминах, которые используют авторы искомых документов (ведь большую роль играют культурные различия!).

Третий элемент стратегии: используйте несколько ИПС. Если вы регулярно занимаетесь поиском информации по какой-то тематике, отметьте те ИПС. которые для вас наиболее эффективны.

Средства поиска информации в глобальной сети

По принципу организации и использования средства поиска можно разделить на каталоги (справочники, директории) и поисковые машины.

  1. число, стоящее в круглых скобках около категории, указывает на количество ссылок в категории.;
  2. обозначение @ говорит о том, что подкатегория входит в состав нескольких категорий;
  3. слово new свидетельствует о том, что ссылка была добавлена недавно;
  4. значок с изображением очков указывает на интересную или полезную, по мнению администрации сайта, ссылку.

Механизм поиска Yahoo! Можно активизировать на любой из страниц каталога. Для поиска в пределах всего каталога или одной из страниц используются специальные переключатели и поисковое окно. Поиск в Yahoo! Производится в соответствии с типом адресов, выбираемых с помощью опций меню (размещённого под поисковым окном). Кроме системы адресации, используемой тематическим каталогом, существует возможность обращения по адресам информационной службы Usenet, а также электронной почты. При выборе опций меню Yahoo! Поиск ведётся среди Web-узлов, включённых в каталог служб новостей, относящихся к данной тематике.

В Internet размещаются узлы и других каталогов, снабжённых поисковыми системами, подобными поисковым системам Yahoo!

Ниже перечислены некоторые поисковые каталоги:

Главный недостаток поисковых каталогов Web-ресурсов в том, что их поисковые системы извлекают огромное число документов, не соответствующих вводимому запросу. Как правило, документы, которые находятся в конце списка, содержат мало полезной информации. Ключевые слова могут быть истолкованы системой поиска совершенно в ином контексте либо отвечают нескольким толкованием.

Поисковые машины. Для детального поиска документов используются специализированные поисковые системы – поисковые машины. Действие поисковых машин заключается в постоянном последовательном исследовании всех узлов Интернет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет.

При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте.

Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.

В настоящее время в отечественных ресурсах действует довольно много поисковых машин. Есть фирменные и даже индивидуальные сайты, которые включают те или иные поисковые машины. Поисковые элементы существуют практически на всех Интернет-газетах и учебных порталах.

Наиболее распространённые из поисковых машин представлены ниже:

Впрочем, есть возможность программно запретить регистрацию всего сайта, или отдельных элементов его, как всеми, так и определёнными поисковыми системами. Для подобных целей служат так называемые мета-теги или мета-определители. Однако это отдельный разговор, кем и с какой целью подобное запрещение делается.

Язык поисковых запросов. Применение языка запросов.

Поисковый запрос может состоять из одного или нескольких слов, в нем могут присутствовать различные знаки препинания. Составлять самые простые запросы можно и не вдаваясь в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логических операторов, будут найдены документы, содержащие все эти слова, да ещё и если они находятся на строго ограниченном расстоянии друг от друга. Такой поиск с довольно большой вероятностью закончится отрицательным результатом. И здесь о понятии успешности не может быть и речи. Знание и правильное применение языка запросов поисковой машины поможет сделать поиск быстрым и эффективным.

Что касается регистра, то в общем случае, регистр написания поисковых слов и операторов значения не имеет, то есть слова “реферат”, “Реферат”, рефеРАт, “РЕФЕРАТ” и “РеФерАт” – все будут восприниматься одинаково. Это полностью касается и латиницы. Так, “Yas” и “yES”, и даже “yeS”, “yes” и “YES” все они для поиска однообразны. И лишь иногда, в целях повышения качества поиска, регистр поискового запроса принимается во внимание. Если в запросе задано слово с большой буквы, то будут найдены только слова в таком написании, а если с маленькой – оба варианта. Если запрос состоит из двух, трех или четырех слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, и автоматически производится изменение ограничения расстояния между словами запроса со значения по умолчанию на величину (n-1)*2, где n – количество слов запроса. Это позволяет находить группу слов запроса, внутри которой есть не более одного “лишнего” слова или знака препинания, например: “М. Лермонтов”, “Баден-Баден”, “Шарль де Голь”, “Федор Михайлович Достоевский” и т.п.

Современные поисковые машины используют операторы для поиска в компьютерных сетях. Под оператором здесь понимается инструкция поиска. По этой причине запрос, включающий несколько слов, может содержать операторы. Поиск указанных операторов в документе не производится. Они служат лишь инструкцией поисковой машине. По этой причине они имеют свою орфографию и синтаксис. Рассмотрим их подробнее.

Логические операторы. Два запроса, соединенные оператором AND (логическое И) образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам, т.е. по запросу “телефон AND мобильный” найдутся только те документы, которые содержат и слово “телефон”, и слово “мобильный” одновременно. Если эти слова встретятся в текстах отдельно, поисковая машина эти тексты не покажет или покажет в конце списка найденных материалов, как только частично отвечающие запросу. Необходимо помнить, что если оператор в явном виде не указан, используется по умолчанию оператор AND. В результате будут выведены документы, содержащие все слова запроса.

Сложному запросу, состоящему из двух запросов, соединенных оператором OR (логическое ИЛИ) соответствуют все документы, удовлетворяющие хотя бы одному из этих двух запросов. Например, “телефон OR мобильный” будут найдены документы, в которых присутствует хотя бы одно из этих двух слов, либо оба эти слова вместе.

Оператор NOT (логическое И-НЕ) образует запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу “телефон NOT мобильный” будут показаны все документы, в которых есть слово “телефон” и при этом в данном документе на установленном расстоянии отсутствует слово “мобильный”.

Каждый из операторов имеет своё сокращенное обозначение, соответствие их приведено в таблице.

В языке запросов обычно один значок оператора означает его действие в пределах абзаца, а два подряд – в пределах всего текста.

Скобки. При построении запросов иногда возникает необходимость объединения слов запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Как правило, в большинстве поисковых машин используют только скобки вида ( ). Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются все правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.

Кавычки. Для поиска цитат можно использовать типовые (двойные) кавычки, вида « или “. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том виде и в том порядке, как они были заданы в запросе. Это весьма эффективный способ поиска. Его применение обеспечивает успешность более 60%. Здесь важно учитывать только два момента. Во-первых, цитирование должно быть точным, т.е. без изменения по падежам, числам и лицам, во-вторых, материал, который вы ищите, как минимум должен быть в Интернете. Если при такой форме поиска будет допущена грамматическая ошибка, поиск даст отрицательный результат.

Таким образом, двойные кавычки можно использовать и просто для поиска слова в заданной форме (по умолчанию слова находятся во всех формах). Например, запросу: удовлетворяет документ, содержащий текст ‘. поезд прибыл для осуществления посадки пассажиров . ‘, и не удовлетворяют документы: с ‘.. поезд подошел к платформе для посадки пассажиров . ‘, или ‘… поезд был подан для проведения посадки пассажиров…’ и т.п.

Метасимволы или маски. Далеко не всякая поисковая машина может поддерживать поиск строк с использованием метасимволов (‘*’, ‘?’), которые обычно используются в значении “любая подстрока” и “произвольный (любой) одиночный символ” соответственно. Тем не менее, эти операторы нередко бывают зарезервированы для подобного использования в будущем.

Яndex также позволяет использовать вместо слов целые логические выражения, при этом его необходимо заключить в скобки. Используя наш пример, введём в поле поиска следующее выражение: (информатика учебники) тесты CD-ROM. В результате поиска будет найдено 3564 страниц и не менее 701 сайта, содержащие в себе такую группу слов как (информатика учебники).

Также существуют некоторые слова и символы, которые по умолчанию исключаются из запроса в связи с их малой информативностью. Это – самые частотные слова русского и английского языков, например, предлоги, частицы и артикли. Очень часто опускаются апострофы и тире. Большинство поисковых машин их знают и сами освобождают от них сформулированный Вами запрос. Это связано с тем, что факт присутствия этих слов может заметно замедлить поиск и отрицательно повлиять на его результат и полноту, а, в конечном итоге, и успешность. В тоже время есть возможность обозначить необходимость этих слов в запросе. Для этого, следует взять запрос в двойные кавычки или воспользовавшись поиском точной фразы в расширенном поиске.

Существует также поиск, с помощью ограничения расстояния. Например, если запрос составлен из нескольких слов без применения операторов и конструкций языка запросов, то машина будет пытаться найти документы, в которых встречаются все слова запроса. При этом для каждого запроса всегда вводится так называемое ограничение контекста – положительное число. По умолчанию принимается расстояние равное 40 словам. Документ, в котором встретились все слова запроса, будет выдан только в том случае, если расстояние между словами запроса будет меньше этого числа. В поисковых системах есть возможность задавать порядок следования и расстояние между словами. Расстояние между словами А и В равно: 1 ( В следует сразу за А ), 2 ( В следует за А через одно слово ) и т. д. Или -1 ( В стоит перед А ), -2 … Знак “/” между словами, за которым стоит число, означает, что расстояние между ними не должно превышать этого числа слов.

Если же мы немного изменим наш запрос – информатика/(+1+4)учебники – то мы получим документы, в которых данные ключевые слова будут идти друг за другом в таком порядке на расстоянии от 1 до 4 слов.

Очень часто приходиться также проводить поиск уже в найденной информации, т.е. можно осуществить поиск по документам, найденным по предыдущему запросу. Для этого в конце запроса нужно поставить “$$” или просто сделать отметку в окошке “поиск в найденном”, расположенном на странице запроса. Эта функция очень удобна для последовательного сужения поиска.

Язык поисковой машины Яndex обладает наиболее полным набором возможностей в русскоязычном поиске, поэтому, освоив его, вы без труда сориентируетесь в языке запроса любого другого средства поиска.

Владение пользовательскими инструментами и техникой

Заключение

В заключении хотелось бы определить базовый алгоритм поиска.

  1. Прежде всего, определите, к какому разделу относится искомая информация.
  2. Определитесь какую именно поисковую машину лучше использовать. Учитывайте её специфику.
  3. Выявите основные слова (или словосочетания), которые характерны для той информации, которую ищите. Попробуйте выявить ключевые слова.
  4. Задавая отдельные слова и фразы, учитывайте язык запросов, операторы поиска, логические связки искомых слов и т.п. элементы, которые делают поиск значительно более эффективным.
  5. Если вам известна точная фраза из искомых материалов, используйте её как цитату.
  6. После проведения предварительного поиска (или первой ступени поиска), если выдано довольно большое количество документов, воспользуйтесь элементом уточнения: “Искать в избранном”. При этом задание поиска следует обязательно уточнить, введя хотя бы одно новое слово или ограничение, которое по вашему мнению поможет провести правильный отбор требуемого материала.
  7. Грамотно располагайте материал и проводите его сортировку по удобным для вас признакам. Это заметно ускорит последующую обработку материала.
  8. Фиксируйте все интересные для вас найденные адреса документов в Интернете (например, с помощью программы Блокнот). Затем выберите среди них нужные для выполнения конкретной работы.
Содержание

Введение
1.Общие принципы организации поиска информации в сети интернет
1.1 Поиск информации в Интернет: стратегия и методика
1.2 Принцип работы, преимущества и недостатки каталогов
1.3 Электронные каталоги глобального масштаба
1.4 Российские каталоги ресурсов Интернет
2. Поиск с помощью поисковых машин
2. 1 Принцип работы, преимущества и недостатки поисковых машин
2.2 Глобальные поисковые машины
2.3 Российские поисковые машины
3.Язык поисковых запросов. применение языка запросов.
4.Владение пользовательскими инструментами и техникой
Заключение
Библиографический список

Вложенные файлы: 1 файл

курсовая работа.doc

Практически все всемирно известные каталоги и поисковые машины в настоящее время превратились во внушительные информационные корпорации с многомиллионными доходами. Заработав авторитет наиболее посещаемых мест в Сети, они предоставляют свои страницы для размещения рекламной информации, доходы от которой и составляют основу их бюджета. Постепенно поисковые сервера превращаются в многофункциональные порталы, в которых поисковый сервис остается главной приманкой для пользователей, но далеко не единственной и даже не основной из предоставляемых услуг. Помимо разыскания информации, такие сервера обычно предоставляют пользователям бесплатную электронную почту, возможность бесплатно размещать собственные страницы, сведения о погоде, текущих новостях, биржевые котировки, карты местности и т.д.

3.ЯЗЫК ПОИСКОВЫХ ЗАПРОСОВ. ПРИМЕНЕНИЕ ЯЗЫКА ЗАПРОСОВ.

Т а б л и ц а 1. Сокращенные обозначения операторов.

В языке запросов обычно один значок оператора означает его действие в пределах абзаца, а два подряд – в пределах всего текста.

Скобки. При построении запросов иногда возникает необходимость объединения слов запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Как правило, в большинстве поисковых машин используют только скобки вида ( ). Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются все правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию. Кавычки.Для поиска цитат можно использовать типовые (двойные) кавычки, вида « или “. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том виде и в том порядке, как они были заданы в запросе. Это весьма эффективный способ поиска. Его применение обеспечивает успешность более 60%. Здесь важно учитывать только два момента. Во-первых, цитирование должно быть точным, т.е. без изменения по падежам, числам и лицам, во–вторых, материал, который вы ищите, как минимум должен быть в Интернете. Если при такой форме поиска будет допущена грамматическая ошибка, поиск даст отрицательный результат.

Пример: Яndex также позволяет использовать вместо слов целые логические выражения, при этом его необходимо заключить в скобки. Используя наш пример, введём в поле поиска следующее выражение: (информатика учебники) тесты CD-ROM. В результате поиска будет найдено 3564 страниц и не менее 701 сайта, содержащие в себе такую группу слов как (информатика учебники).

Пример: Если же мы немного изменим наш запрос – информатика/(+1+4)учебники – то мы получим документы, в которых данные ключевые слова будут идти друг за другом в таком порядке на расстоянии от 1 до 4 слов.

Язык поисковой машины Яndex обладает наиболее полным набором возможностей в русскоязычном поиске, поэтому, освоив его, вы без труда сориентируетесь в языке запроса любого другого средства поиска.

4.ВЛАДЕНИЕ ПОЛЬЗОВАТЕЛЬСКИМИ ИНСТРУМЕНТАМИ

Не забывайте о команде Find браузера. Если ваш браузер имеет в меню Файл, Правка или Вид команду Find (Найти), используйте ее для обнаружения трудноуловимых ключевых слов страницы. Чтобы отыскать слово, которое вам нужно, воспользуйтесь комбинацией клавиш CTRL+F в вашем браузере и введите искомое ключевое слово.

Сохраняйте копии важных документов. Активно используйте команды контекстного меню Сохранить объект как… и Сохранить рисунок как… и команду меню Файл – Сохранить как… для создания копий необходимой вам информации из сети Интернет на локальном ресурсе вашего ПК. Этим вы решите некоторые проблемы: изменчивости и недолговечности WWW , концентрации внимания исключительно на целях определенного этапа поиска, экономии времени on–line подключения и перевод изучения отобранных материалов в режим off-line.

При работе над данной курсовой работой я определила для себя базовый алгоритм поиска.

Придерживаясь этого алгоритма поиск информации в сети интернета становится проще и быстрее.

При проведении поиска информации в службе www, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги и поисковые указатели. Знание основных понятий и терминов позволяет провести углубленный поиск с применением ключевых слов, наиболее точно характеризующих искомую тему. При этом следует различать приемы простого, расширенного и контекстного поиска.

При использовании расширенного поиска ключевые слова связываются между собою операторами логических отношений(так называемый язык запросов). При помощи логических отношений поисковое задание формулируется так, чтобы более точно детализировать задание и ограничить область отбора.

Контекстный поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых системах. К тому же эта операции достаточно медленная.

Язык запросов – язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа.

Порядок действий логических операторов: сначала выполняются действия в скобках ( ), потом операторы AND, NOT и лишь потом OR.

В разных поисковых системах используются различные приемы связывания между собой ключевых слов при помощи логических операторов. В дальнейшем будут приведены правила построения запросов в трех наиболее распространенных русскоязычных системах.

слово1 пробел слово 2

слово 1 & слово 2

слово 1 AND слово 2

Будут найдены все документы, где в одном предложении есть оба слова

машина AND самолёт

Слово 1 or слово 2

Слово 1 | слово 2

Будут найдены документы, содержащие или одно слово, или другое

самолёт or аэродром

Слово 1 not слово 2

Слово 1! слово 2

Будут найдены документы, содержащие первое слово, но без второго

машина not самолёт

Оформление запросов в поисковой системе Яндекс [2]

слово 1 && слово 2

слово 1 & слово 2

+слово 1 +слово 2

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

слово 1 ~~ слово 2

слово 1 ~ слово 2

слово 1 –слово 2

Будут найдены документы с первым словом, но без второго

руководство Visual C ~~ цена

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом

частные объявления продажа

несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа

контекст “а шапочка у неё была красная” найден не будет

поставщики /2 кофе

найдутся “поставщики колумбийского кофе”, “поставщики кофе из Колумбии” и т.д.

Будут найдены документы, в которых известны расстояния между словами

+n – это минимальное число слов, а –n – максимальное

музыкальное /(-2 4) образование

музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа

если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в предложениях

Содержимое работы – 1 файл

Язык запросов SQL.docx

Язык запросов SQL.

SQL является непроцедурным языком и не содержит операторов управления, организации подпрограмм, ввода-вывода и т.п. В связи с этим SQL автономно не используется, обычно он погружен в среду встроенного языка программирования СУБД (например, FoxPro СУБД Visual FoxPro, ObjectPAL СУБД Paradox, Visual Basic for Applications СУБД Access).

В современных СУБД с интерактивным интерфейсом можно создавать запросы, используя другие средства, например QBE. Однако применение SQL зачастую позволяет повысить эффективность обработки данных в базе. Например, при подготовке запроса в среде Access можно перейти из окна Конструктора запросов (формулировки запроса по образцу на языке QBE) в окно с эквивалентным оператором SQL. Подготовку нового запроса путем редактирования уже имеющегося в ряде случае проще выполнить путем изменения оператора SQL. В различных СУБД состав операторов SQL может несколько отличаться.

Язык SQL не обладает функциями полноценного языка разработки, а ориентирован на доступ к данным, поэтому его включают в состав средств разработки программ. В этом случае его называют встроенным SQL. Стандарт языка SQL поддерживают современные реализации следующих языков программирования: PL/1, Ada, С, COBOL, Fortran, MUMPS и Pascal.

В специализированных системах разработки приложений типа клиент-сервер (данную архитектуру мы рассмотрим позже) среда программирования, кроме того, обычно дополнена коммуникационными средствами (установление и разъединение соединений с серверами БД, обнаружение и обработка возникающих в сети ошибок и. т. д.), средствами разработки пользовательских интерфейсов, средствами проектирования и отладки.

Различают два основных метода использования встроенного SQL: статический и динамический.

При статическом использовании языка (статический SQL) в тексте программы имеются фиксированные по структуре вызовы функций языка SQL, включаемые в выполняемый модуль в процессе компиляции. Параметры запросов (обычно представляют константные значения, с которыми сравниваются значения полей в таблицах), являющиеся переменными языка программирования, позволяют добиться некоторой гибкости статических запросов.

При динамическом использовании языка (динамический SQL) предполагается динамическое построение запроса в форме текстовой строки. Данная строка используется как параметр для функции выполнения SQL-запросов, которая выполняет синтаксический анализ строки запроса и формирует на его основе последовательность команд БД. Динамический метод обычно применяется в случаях, когда в приложении заранее неизвестен вид SQL-вызова.

Для удобства работы с представлениями в язык SQL введено понятие курсора. Курсор представляет собой своеобразный указатель на набор записей в представлении, обеспечивающий в каждый момент доступ лишь к некоторой небольшой части строк представления. С помощью операторов перемещения курсора по записям можно получить доступ ко всем строкам таблицы.

История. Первые разработки.

Целью разработки было создание простого непроцедурного языка, которым мог воспользоваться любой пользователь, даже не имеющий навыков программирования. Собственно разработкой языка запросов занимались Дональд Чэмбэрлин (Donald D Chamberlin) и Рэй Бойс (Ray Boyce). Пэт Селинджер (Pat Selinger) занималась разработкой стоимостного оптимизатора (cost – based optimizer), Рэймонд Лори (Raymond Lorie) занимался компилятором запросов.

Стоит отметить, что SEQUEL был не единственным языком подобного назначения. В Калифорнийском Университете Беркли была разработана некоммерческая СУБД Ingres (являвшаяся, между прочим, дальним прародителем популярной сейчас некоммерческой СУБД PostgreSQL ), которая являлась реляционной СУБД, но использовала свой собственный язык QUEL , который, однако, не выдержал конкуренции по количеству поддерживающих его СУБД с языком SQL.

Первыми СУБД, поддерживающими новый язык, стали в 1979 году Oracle V2 для машин VAX от компании Relational Software Inc. (впоследствии ставшей компанией Oracle ) и System/38 от IBM, основанная на System/R.

Стандартизация.

Поскольку к началу 80-х годов существовало несколько вариантов СУБД от разных производителей, причём каждый из них обладал собственной реализацией языка запросов, то было принято решение разработать стандарт языка, который будет гарантировать переносимость ПО с одной СУБД на другую (естественно, обе из которых в полной мере будут поддерживать этот стандарт).

Стандарт SQL1 разделялся на два уровня. Первый уровень представлял собой подмножество второго уровня, описывавшего весь документ в целом. То есть, такая структура предусматривала, что не все спецификации стандарта SQL1 будут относиться к Уровню 1. Тем самым, поставщик, заявлявший о поддержке данного стандарта, должен был заявлять об уровне, которому соответствует его реализация языка SQL. Это значительно облегчило принятие и поддержку стандарта, поскольку производители могли реализовывать его поддержку в два этапа.

Сразу после завершения работы над стандартом SQL1 в 1987 году была начата работа над новой версией стандарта, который должен был заменить стандарт SQL89, получив название SQL2, поскольку дата принятия документа на тот момент была неизвестна. Таким образом, фактически SQL89 и SQL2 разрабатывались параллельно. Новая версия стандарта была принята в 1992 году, заменив стандарт SQL89. Новый стандарт, озаглавленный как SQL92, представлял собой по сути расширение стандарта SQL1, включив себя множество дополнений имевшихся в предыдущих версиях инструкций.

SQL1 Уровень 1 -> SQL1 Уровень 2 -> SQL92 “Начальный” -> SQL92 “Средний” -> SQL92 “Полный”.

SQL является, прежде всего, информационно – логическим языком , предназначенным для описания, изменения и извлечения данных, хранимых в реляционных базах данных . SQL нельзя назвать языком программирования .

Изначально, SQL был основным способом работы пользователя с базой данных и позволял выполнять следующий набор операций:

  • создание в базе данных новой таблицы;
  • добавление в таблицу новых записей;
  • изменение записей;
  • удаление записей;
  • выборка записей из одной или нескольких таблиц (в соответствии с заданным условием);

а, также, изменение структур таблиц. Со временем, SQL усложнился – обогатился новыми конструкциями, обеспечил возможность описания и управления новыми хранимыми объектами (например, индексы, представления, триггеры и хранимые процедуры) и стал приобретать черты, свойственные языкам программирования.

При всех своих изменениях, SQL остаётся единственным механизмом связи между прикладным программным обеспечением и базой данных. В то же время, современные СУБД, а, также, информационные системы, использующие СУБД, предоставляют пользователю развитые средства визуального построения запросов.

Каждое предложение SQL – это запрос или обращение к базе данных, которое приводит к изменению в базе данных. В соответствии с тем, какие изменения происходят в базе данных, различают следующие типы запросов:

  • запросы на создание или изменение в базе данных новых или существующих объектов (при этом в запросе описывается тип и структура создаваемого или изменяемого объекта);
  • запросы на получение данных;
  • запросы на добавление новых данных (записей)
  • запросы на удаление данных;
  • обращения к СУБД.

Основным объектом хранения реляционной базы данных является таблица, поэтому все SQL-запросы – это операции над таблицами. В соответствии с этим, запросы делятся на:

При проведении поиска информации в службе www, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги и поисковые указатели. Знание основных понятий и терминов позволяет провести углубленный поиск с применением ключевых слов, наиболее точно характеризующих искомую тему. При этом следует различать приемы простого, расширенного и контекстного поиска.

При использовании расширенного поиска ключевые слова связываются между собою операторами логических отношений(так называемый язык запросов). При помощи логических отношений поисковое задание формулируется так, чтобы более точно детализировать задание и ограничить область отбора.

Контекстный поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых системах. К тому же эта операции достаточно медленная.

Язык запросов – язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа.

Порядок действий логических операторов: сначала выполняются действия в скобках ( ), потом операторы AND, NOT и лишь потом OR.

В разных поисковых системах используются различные приемы связывания между собой ключевых слов при помощи логических операторов. В дальнейшем будут приведены правила построения запросов в трех наиболее распространенных русскоязычных системах.

Язык запросов в поисковой системе РАМБЛЕР [1]

слово1 пробел слово 2

слово 1 & слово 2

слово 1 AND слово 2

Будут найдены все документы, где в одном предложении есть оба слова

машина AND самолёт

Слово 1 or слово 2

Слово 1 | слово 2

Будут найдены документы, содержащие или одно слово, или другое

самолёт or аэродром

Слово 1 not слово 2

Слово 1! слово 2

Будут найдены документы, содержащие первое слово, но без второго

машина not самолёт

Оформление запросов в поисковой системе Яндекс [2]

слово 1 && слово 2

слово 1 & слово 2

+слово 1 +слово 2

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

слово 1 ~~ слово 2

слово 1 ~ слово 2

слово 1 –слово 2

Будут найдены документы с первым словом, но без второго

руководство Visual C ~~ цена

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом

частные объявления продажа

несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа

контекст “а шапочка у неё была красная” найден не будет

поставщики /2 кофе

найдутся “поставщики колумбийского кофе”, “поставщики кофе из Колумбии” и т.д.

Будут найдены документы, в которых известны расстояния между словами

+n – это минимальное число слов, а –n – максимальное

музыкальное /(-2 4) образование

музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа

если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в предложениях

Читайте также:

      

  • Реферат на тему передача давления жидкостями и газами закон паскаля
  •   

  • Баяндама реферат тан айырмашылығы
  •   

  • Реферат система методов вокальной работы с детьми
  •   

  • Реферат кутузов и наполеон в романе война и мир
  •   

  • История психофизиологии профессиональной деятельности реферат

Реферат: Язык запросов русскоязычных поисковых систем

Реферат подготовила ученица 11 класса Зимина Марина

МОУ Коробовская СОШ

Управления образования Администрации Шатурского района Московской области

2005 год

Введение.

При проведении поиска информации в службе www, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги и поисковые указатели. Знание основных понятий и терминов позволяет провести углубленный поиск с применением ключевых слов, наиболее точно характеризующих искомую тему. При этом следует различать приемы простого, расширенного и контекстного поиска.

Под простым поиском понимается поиск Web-ресурсов по ключевому слову. Недостаток этого вида поиска заключается в том, что обычно он выдает слишком много документов, причем наряду с ценной информацией попадается много «мусора».

При использовании расширенного поиска ключевые слова связываются между собою операторами логических отношений(так называемый язык запросов). При помощи логических отношений поисковое задание формулируется так, чтобы более точно детализировать задание и ограничить область отбора.

Контекстный поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых системах. К тому же эта операции достаточно медленная.

Язык запросов – язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа.

Порядок действий логических операторов: сначала выполняются действия в скобках ( ), потом операторы AND, NOT и лишь потом OR.

В разных поисковых системах используются различные приемы связывания между собой ключевых слов при помощи логических операторов. В дальнейшем будут приведены правила построения запросов в трех наиболее распространенных русскоязычных системах.

Язык запросов в поисковой системе РАМБЛЕР [1]

Написано Результат поиска Примечания и примеры
идти Все формы по правилам русского языка найдётся идти, идёт, шёл, шла и т.д.
Регистр (shift) Если подряд идёт не менее чем два, три или четыре слова с большой буквы, то будет производиться только по имени собственному ДОМ и дом, nOt и Not воспринимаются одинаково

слово1 пробел слово 2

слово 1 & слово 2

слово 1 AND слово 2

Будут найдены все документы, где в одном предложении есть оба слова

машина самолёт

машина & самолёт

машина AND самолёт

Слово 1 or слово 2

Слово 1 | слово 2

Будут найдены документы, содержащие или одно слово, или другое

самолёт or аэродром

самолет | аэродром

Слово 1 not слово 2

Слово 1! слово 2

Будут найдены документы, содержащие первое слово, но без второго

машина not самолёт

машина! самолёт

” “ Слова, заключенные в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они указаны в запросе* самолёт «заправился» посадка не будет найдено: самолёт совершил посадку, чтобы заправиться
(X,Y) Будут найдены документы, в которых расстояние между словами не более Х слов (2, красная армия) между словами не стоит ни одного слова, поскольку лишь в случае непосредственного их соседства разница в порядковых номерах слов меньше 2, по умолчанию максимальное расстояние – 40 слов

Оформление запросов в поисковой системе Яндекс [2]

Написано Результат поиска Примечания и примеры
идти Все формы по правилам русского языка найдётся идти, идёт, шёл, шла и т.д.

Путина

путина

Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы по запросу ‘путина’ найдется и президент, и сезон интенсивного рыболовства. А по запросу ‘Путина’ – президент и те случаи рыболовного сезона, когда он написан с большой буквы.

слово 1 && слово 2

слово 1 & слово 2

+слово 1 +слово 2

Будут найдены документы, в которых есть оба слова

лечебная & физкультура

+лечебная +физкультура

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

слово 1 ~~ слово 2

слово 1 ~ слово 2

слово 1 –слово 2

Будут найдены документы с первым словом, но без второго

руководство Visual C ~~ цена

рак -гороскоп

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом

слово 1 пробел слово 2 пробел слово 3 Будет найдено много документов с этими словами

частные объявления продажа

велосипедов

несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа

слово 1 | слово 2 Будут найдены документы либо с первым словом, либо со вторым фото | фотография
Таблица «Оформление запросов в поисковой системе «Яндекс» (продолжение)
” “ Будут найдены документы, в которых слова, заключенные в кавычки, идут подряд

«красная шапочка»

контекст «а шапочка у неё была красная» найден не будет

! слово Будут найдены документы, содержащие это слово ! Лужкову
слово 1 /число слово 2 Будут найдены документы, в которых первое слово находится на расстоянии заданного числа от второго

поставщики /2 кофе

найдутся «поставщики колумбийского кофе», «поставщики кофе из Колумбии» и т.д.

слово 1 /(+n –n)

слово 2

Будут найдены документы, в которых известны расстояния между словами

+n – это минимальное число слов, а –n – максимальное

музыкальное /(-2 4) образование

музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа

если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в предложениях

$title X Будут найдены документы с заголовком Х

$title Comp Tek

ищет в заголовках документов слово Comp Tek

$anchor (X | Y) Будут найдены документы, в ссылках которых есть одно из слов Х или Y

$anchor (Comp Tek | Dialogic)

#url=«www.X.ru» Ограничить поиск информации сервером Х

Comp Tek

#url=www.comptek.ru

упоминание компании Comp Tek на сервере www.comptek.ru и в адресах начинающихся с данной последовательности символов

#linkl=«www.x.ru/*» Будут найдены документы, содержащие ссылки на определённые URL

#linkl=www.comptek.ru*

найдутся документы, которые сослались на сервер компании

#image=«X*» Будут найдены документы, содержащие ссылки на документы с изображениями Х

#image=«tort*»

найдутся ссылки на документы с изображением тортов

возможно, найдётся и портрет черепахи Тортиллы

#hint=(X) Будут найдены документы, содержащие изображение с подписью Х

#hint=(кино)

документы, содержащие изображение с подписью кино

Таблица. «Оформление запросов в поисковой системе Яндекс» (окончание)

#keywords=(X Y Z)

#abstrakt=(X Y Z)

Будут найдены документы по ключевым словам и аннотациям X Y Z keywords – краткое описание содержания страницы. Эта служебная информация и она не видима на странице
Х <- Y Будут найдены документы, содержащие слова Х и Y, при этом будут выданы первыми документы, содержащие слово Y

компьютер <- телефон

первыми будут выданы документы, содержащие слово телефон

Оформление запросов в поисковой системе Апорт [3]

Написано Результат поиска Примечания и примеры
идти

Все формы по правилам

русского языка

найдётся идти, идёт, шёл,

шла и т.д.

Регистр(shift) Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы красная площадь

слово 1 AND слово 2

слово 1 + слово 2

слово 1 и слово 2

слово 1 & слово 2

Будут найдены документы, в которых есть оба слова

лечебная & физкультура

лечебная и физкультура

лечебная + физкультура

лечебная AND физкультура

слово 1оr слово 2

слово 1│ слово 2

слово 1 или слово 2

Будут найдены документы, содержащие любое из указанных слов или оба слова одновременно фото | фотография

слово 1 не слово 2

слово 1 not слово 2

слово 1 — слово 2

Будут найдены документы с первым словом, но без второго

рак — гороскоп

рак не гороскоп

рак not гороскоп

” ” Будут найдены документы с данными словосочетанием или близкое к нему

”яблоки на снегу ”

будут найдены ”яблоки на снегу”, ”яблоки и снег”, ”яблокам под снегом”, ”яблоко снег”

слХ(слова)

сХ(слова)

wX(слова)

[Х, слова]

Будут найдены документы, где между словами стоит не более двух других слов

сл5(папа мама сын)

между словами ”папа”, ”мама” и ”сын” стоит не более двух других слов, т.е. общее число слов во фрагменте не более 5

Таблица «Оформление запросов в поисковой системе Апорт» (продолжение)

url:

url=

Ограничение поиска одним или несколькими серверами, или даже частью сервера

url=www.intel.ru

документы, на сервере www.intel.ru. В случайном порядке

url=www.intel.ru & soft & условия

все документы, сервера www.intel.ru, содержащие слова ”soft” и ”условия”

url=www.intel.ru/soft/*

все документы, на сервере www.intel.ru в каталоге soft и его подкаталогах

url=*.agama.com

все документы, на серверах www.agama.com, russia.agama.com и т.д.

дата:

дата=

date=

date:

Поиск по датам

папа дата=01/01/97-01/02/97

документы, содержащие слово папа, и имеющие дату от 1 января 1997 года до 1 февраля 1997 года

date=01/01/97 папа

документы, содержащие слово папа, и имеющие дату 1 января 1997 года

дата:<01/02/97 папа

дата:-01/02/97 папа

все документы, содержащие слово папа, и имеющие дату не позже 1 февраля 1997 года

title=

t=

title( )

заг=

з=

Поиск в заголовках

title(папа │мама)

будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба одновременно

перед круглыми скоками знак равенства можно опустить

keywords=

kw=

клсл=

кл=

Поиск в поле МЕТА KEYWORDS

kw(папа мама)

будут найдены документы, для которых автор в ключевых словах указал оба слова: папа и мама

Таблица «Оформление запросов в поисковой системе Апорт» (окончание)

alt=

a=

рис=

р=

Поиск в комментариях к картинкам

alt=(Билл Гейтс)

документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Билл и Гейтс

anchor= Поиск в тексте ссылок

anchor=(ненавижу Интернет)

документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет

description= Поиск в тексте описаний сайтов и в поле DESRIPTION

description=(”уксусная кислота”)

будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание уксусная кислота

text=(оглавление или содержание)

x=(оглавление или содержание)

текст=(оглавление или содержание)

т=(оглавление или содержание)

Поиск в обычном тексте.

Будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа

текст=(Последний звонок)
* Произвольное число любых букв

зелен*

найдутся: зеленка, зелень, зеленый, Зеленоград

! слово Будут найдены документы, содержащие это слово ! Лужкову

Список литературы

1. www.rambler.ru/doc

2. www.yandex.ru/info/syntax

3. www.glossary.ru

РЕФЕРАТ

ФОРМИРОВАНИЕ
ЗАПРОСОВ ДЛЯ РАБОТЫ СЕТИ ИНТЕРНЕТ

ИНФОРМАТИКА

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1
ПРИЕМЫ ПОИСКА В СЕТИ ИНТЕРНЕТ

4

1.1
Поисковые системы

6

1.2
Информационно – поисковые системы

6

2
КЛАССИФИКАЦИИ  ПОИСКОВЫХ  СЛУЖБ

6

2.1
Особенности поисковых каталогов

7

2.2
Этапы работы поискового робота

8

3
СТРУКТУРЫ И ОСОБЕННОСТИ  ИНФОРМАЦИОННОГО-ПОИСКОВОГО ЯЗЫКА

9

3.1
Операторы поисковых систем

9

3.2
Логические операторы

9

3.3
Операторы расстояния

10

3.4
Прочие операторы

10

3.5
Слова для запроса поисковому серверу

10

3.6
Язык запросов

11

ЗАКЛЮЧЕНИЕ

12

СПИСОК
ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

13

ВВЕДЕНИЕ

Говорят,
что в Интернете есть все. На самом деле – это не так. Материалы для размещения
в сети готовят живые люди, и потому там можно найти  лишь то, что они сочли
нужным опубликовать. Благодаря их творчеству сегодня в Интернете уже
образовалось около двух миллиардов Web-страниц. В результате каталогизация
имеющихся в сети ресурсов стала серьезной проблемой. Несмотря на то, что
проблемой занимаются тысячи организаций, она не только не приближается к
разрешению, но и становится острее. Процент каталогизированных ресурсов
неуклонно падает. В последние годы это падение стало катастрофическим. Так,
если в 1999 году процент каталогизированных ресурсов приближался к 40%, то
всего, лишь за один следующий год он опустился до 25 %.

1 ПРИЁМЫ
ПАКЕТА ИНФОРМАЦИИ В СЕТИ

1.1 
Поисковые
системы

Поисковая система – это аппаратнопрограммный комплекс, который
предназначен для осуществления функции поиска в интернет

Приемы
поиска информации в сети

Сеть Интернет растет очень быстрыми темпами, найти нужную
информацию среди сотен миллиардов Web-страниц и сотен миллионов файлов
становится все сложнее. Для поиска информации используются специальные
поисковые системы, которые содержат постоянно обновляемую информацию о
местонахождении Web-страниц и файлов на сотнях миллионов серверов Интернета.

Прежде, чем рассматривать информационно-поисковые системы, нам
надо разобраться с вопросами — что мы можем искать и где, а
после — как организовать такой поиск.

Хранения информации обычно завершается поиском конкретной
информации для дальнейшего использования. Поиск органически связан с
процедурой хранения, поэтому он не всегда выделяется отдельно.

Служба World Wide Web (WWW)

Это
самая популярная служба современного Интернета. Именно её нередко отождествляют
с Интернетом в целом, хотя на самом деле это лишь одна из его многочисленных
служб.

Определение
WWW

Основатель
сети Тим Бернес-Ли дал такое определение.

WWW —
это сеть серверов, распределённая гетерогенная информационная мультимедиасистема
коллективного пользования.

Из
определения понятно, какую огромную роль в современном обществе имеет
компьютерная информационная среда. Среда WWW не имеет централизованной
структуры. Все, кто желает разместить в Интернете свои материалы, не
противоречащие законодательству, могут это сделать. Отдельный документ World
Wide Web называют Web-страницей. Обычно это комбинированный документ, который
может содержать текст, графические иллюстрации, мультимедийные и другие
объекты. Отличительной особенностью среды WWW является наличие средств перехода
от одного документа к другому, тематически с ним связанному, без явного
указания адреса. Связь между документами осуществляется при помощи гипертекстовых
ссылок. Огромное число гипертекстовых электронных документов, хранящихся
на серверах WWW, образует своеобразное гиперпространство документов, между
которыми возможно перемещение.

Связь
между сотнями миллионов документов, хранящихся на физических серверах
Интернета, не могла бы существовать, если бы каждый документ в этом
гиперпространстве не обладал своим уникальным адресом. Файл одного локального
компьютера обладает уникальным полным именем, в которое входит собственное имя
файла с расширением и путь доступа к файлу, начиная от имени устройства, на
котором он хранится. Определяя местоположение файла в Глобальной сети, надо
расширить представление об уникальном имени файла. Адрес любого файла во
всемирном масштабе определяется унифицированным указателем ресурса — URL.
URL-адрес представляет собой стандартизованную строку символов, указывающую
местонахождение ресурса, документа или его части в Интернете, и состоит из трех
частей.

·               
имя протокола для доступа к
службе Интернет;

·               
имя сервера, на котором
хранится ресурс и работает сервер-программа службы Интернет;

·               
полное имя файла, который
хранится на сервере.

1.2  Информационно-поисковые системы

Информационные
службы определяют технологию хранения, передачи информационных объектов и,
соответственно, алгоритмы поиска.

Web-документы
хранятся на Web-серверах, файлы и файловые архивы — на файловых серверах. В
связи с этим, набор информационных объектов, доступных с помощью каждого
сервиса, может рассматриваться как отдельное информационно-поисковое
пространство.

Теперь,
зная, что мы можем искать и где, обратимся к вопросу
– как организовать такой поиск.

В настоящее
время для поиска конкретной информации существуют так называемые информационно-поисковые
системы или, как принято выражаться на языке Интернет, поисковые
службы. Поисковая система представляет собой специализированный Web-узел.
Принцип работы таких систем прост: пользователь должен объяснить системе, что
ему необходимо получить, а задача поисковой службы состоит в том, чтобы найти и
выдать список гиперссылок на страницы, на которых упоминаются соответствующие
сведения.

2 КЛАССИФИКАЦИЯ
ПОИСКОВЫХ СЛУЖБ

·                   
по способу организации и
пополнения базы данных о документах в сети на поисковые каталоги и поисковые
машины;

·                   
по глубине охвата ресурса на
глобальные и локальные.

2.1 Особенности поисковых каталогов

Поисковые каталоги устроены по тому же принципу, что и
тематические каталоги крупных библиотек. Принципы работы с каталогами
достаточно просты. Как правило, главная страница Web-сайта каталога содержит в
себе список категорий, или рубрик, каждая из которых представлена гиперссылкой

Работа с поисковыми каталогами интуитивно проста. В них поиск информации
практически всегда завершается более или менее плодотворно. Однако за этой
простотой скрывается высочайшая сложность создания и ведения каталога.

Важнейшей характеристикой каталогов является объем базы данных,
т.е. количество представленных документов. Для глобальных каталогов данная
величина составляет примерно 1-2 миллиона документов, что составляет порядка
0,1-0,2% от общего пространства WWW, и степень охвата общего объема ресурсов
WWW непрерывно уменьшается из-за лавинообразного увеличения информационных
ресурсов в Глобальной сети. Поэтому использование каталогов не может дать
результатов, обладающих высокой полнотой.

По сравнению с поисковыми машинами скорость увеличения баз
данных каталогов достаточно мала. Дело в том, что поисковые каталоги создаются
вручную, коллективом высококвалифицированных редакторов, которых называют также
модераторами. Однако это может рассматриваться и как преимущество поисковых
систем, поскольку ручной отбор позволяет повысить точность поиска и
распределение материалов по соответствующим рубрикам.

Другой характеристикой каталогов является количество категорий
или рубрик в каталоге. Естественно, чем выше это значение, тем большей
точностью характеризуются результаты поиска. Для глобальных каталогов это
значение в настоящее время составляет несколько десятков тысяч.

Особенности поисковых машин

В поисковых машинах каталоги Web-ресурсов создаются
автоматически специальными программами, называемыми поисковыми роботами или
поисковыми указателями (а также “червяками”, “пауками”, “траулерами”,
“автоматами”, “агентами” и т.п.). Из процесса наполнения базы данных поисковой
системы исключается человеческий фактор. При этом падает качество ссылок,
предоставляемых системой по результатам поиска, но одновременно увеличивается
их количество.

Программа Поисковый робот осуществляет просмотр Сети с целью
выявления новых документов для включения их в базу данных поисковой машины
— индекс. Процесс занесения информации о документе в индекс
называется индексированием

2.2 Этапы
работы поискового робота

1.               
Сбор первичной базы данных.

2.               
Индексация базы данных.

3.               
Создание результирующего
списка ссылок.

Формирование
запросов на поиск информации

Осуществляя
поиск информации в Интернете, мы вправе надеяться на полноту, точность и
актуальность результатов поиска, к тому же результаты мы хотим получить как
можно быстрее.

На часть из
перечисленных факторов пользователь, проводящий поиск, не может повлиять.
Например, скорость получения информации зависит от технических характеристик и
загруженности каналов связи и серверов поисковых служб, а также особенностями
алгоритмов, реализованных в поисковой системе. Однако, пользователь может
повлиять на качество результатов поиска, если при проведении поисковых работ
будет:

·                   
делать оправданный выбор
информационно-поисковой службы;

·                   
учитывать особенности
информационно-поисковой системы;

·                   
грамотно формулировать
запросы на поиск информации.

Формирование
запроса — это процесс выражения информационной потребности с помощью ключевых
слов и комбинирования этих ключевых слов с помощью средств
информационно-поискового языка системы.

На качество
запроса оказывают воздействие три фактора: знание пользователем особенностей
естественного языка, умение учитывать   языковые особенности документов и
знание структуры и особенностей информационно-поискового языка.

2         
СТРУКТУРЫ И ОСОБЕННОСТИ ИНФОРМАЦИОННО-ПОИСКОВОГО ЯЗЫКА

Для повышения точности результатов поиска, как уже было
отмечено, важно грамотно формулировать запросы на поиск информации. Информационно-поисковые
языки предоставляют пользователю большое число операторов, т.е. служебных слов,
которые используются для комбинирования ключевых слов запроса. Каждая поисковая
машина имеет свой состав операторов, однако обычно эти операторы объединены в
группы, общие для большинства систем.

3.1 Операторы поисковых систем

При использовании языков запроса приходится учитывать, что они
сильно отличаются в различных поисковых машинах. Это становится большой
проблемой при использовании сложных запросов в мета поисковых системах.

3.2 Логические операторы

В поисковых системах обычно имеются три оператора: “логическое
И”, “логическое ИЛИ” и “логическое НЕ”. Оператор “логическое И” указывается
между ключевыми словами, если необходимо выдать документы, содержащие все
искомые слова. “Логическое ИЛИ” используется при необходимости поиска
документов, содержащих хотя бы одно из ключевых слов, связанных этим
оператором.

3.3 Операторы расстояния

Большинство поисковых машин в настоящее время предоставляют
возможность использовать так называемые операторы расстояния, которые задают
ограничения на удаленность вхождений ключевых слов друг от друга в тексте
документа. Как правило, выделяют три оператора этой группы: оператор поиска
фразы, позволяющий находить точные вхождения указанной последовательности слов
(фраза задаётся в кавычках), оператор, с помощью которого задаётся расстояние в
словах, и оператор, задающий расстояние в предложениях.

3.4 Прочие
операторы

·                   
учета особенностей
естественного языка;

·                   
выбора части документа, по
которой осуществляется поиск;

·                   
отбора для поиска страниц,
написанных на определенном языке;

·                   
ограничения поиска
определенным типом файла;

·                   
поиска текста в заголовках
страниц;

·                   
выбора подмножества
документов.

Состав этих
групп сильно зависит от поисковой машины.

3.5 Слова для
запроса поисковому серверу

Есть
выражение «Машина должна работать, человек — думать», и сказано оно как раз о
такой ситуации. Задача пользователя при составлении поискового запроса —
выделить ключевые слова, задача поискового сервера — наилучшим образом
обработать введенный запрос. Рассмотрим пример, иллюстрирующий типичные
ошибки начинающих пользователей при поиске в Интернете. На запрос «Загадки о
музыкальных инструментах» поисковик не выдал полезных результатов. Тогда
пользователь решает исправить запрос, дополнив его и написав: «Загадки для
детей о музыкальных инструментах» — результаты поиска оказались еще хуже
предыдущего. Для данного примера неплохим решением явился поиск по ключевому
слову «загадки». В Интернете много таких сайтов, а зайдя на сам сайт и немного
поискав по его разделам, вполне можно найти интересующую информацию.
Сформулируем несколько правил составления запросов:

·                   
выбирайте только самые
важные ключевые слова, касающиеся рассматриваемой темы;

·                   
слов не должно быть слишком
много, но и не слишком мало;

·                   
при неудовлетворительных
результатах поиска, используйте более «мягкие» условия для запроса или
попробуйте поискать в другой поисковой системе, т.к. механизмы работы
поисковиков неодинаковые, следовательно, результаты также могут различаться.

3.6 Язык запросов

 

Язык запросов — система команд, позволяющая
изменять параметры запроса из основной строки поиска с помощью специальных
команд. Ориентирован на опытных пользователей.

ЗАКЛЮЧЕНИЕ

В сети Интернет хранится очень большой объем информации по
различной тематике в виде статей в электронных газетах, отчетов, справочников,
графических изображений, аудио и видеофайлов и многого другого. Путешествуя по
Интернет, можно найти любую информацию, не выходя из дома или офиса, иначе
говоря, если какие-либо данные вводились когда-либо в компьютер, то вероятнее
всего их можно найти где-то на необозримых просторах Интернет. Для этого нужен
только непосредственно сам компьютер, подключенный к Интернет с установленной
специальной программой – браузером, предназначенной для просмотра содержимого
Web-страниц.

С появлением World Wide Web (WWW) – гипертекстовой
информационной системы, опутавшей весь мир, связавшей сотни и сотни
компьютеров, тысячи и тысячи страниц гипертекстовых документов – без высокоэффективных
средств поиска просто не обойтись. Благодаря разнообразию поисковых систем,
специально разработанных для рядового пользователя, каждый может без труда
отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель
поиска

Существует множество средств поиска в Интернет, как автономных,
использующих только собственные ресурсы, так и глобальных, так называемых
мета-средств.

Существуют разные методы поиска учебной информации в сети
Интернет: поиск с использованием гипертекстовых ссылок, использование поисковых
машин, поиск с применением специальных средств, анализ новых ресурсов.

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

1)               
Гармашов М. Ю., Коротков А. М. Подготовка учащихся к продуктивной
деятельности в дидактической компьютерной среде. – Волгоград, 2001.

2)               
Норенков И.П. Управление знаниями в информационно-образовательной
среде. – М.: МЭСИ, 2000.

3)               
Путилов Г.П. Концепция построения
информационно-образовательной среды технического вуза. – М.: МГИЭМ, 1999.

4)               
Средства поиска информации в INTERNET // Афанасий-биржа (Тверь). –
28 марта 1997.

5)               
Усков В.Л. Дистанционное инженерное образование на базе
Internet / Библиотечка журнала “Информационные технологии”, 2000,
№ 3

6)               
Официальный сайт: life.mosmetod
— обновляется в течение суток. — Режим доступа: http://life.mosmetod.ru/—
Дата обращения: 25.03.2022. — Текст: электронный.

Содержание:

Введение

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети Интернет.

Всемирная сеть очень важна и полезна почти для всех! Любой пользователь Интернета может отыскать в нем много разной и интересной информации, а также использовать все широкие возможности сети. Для меня главными обстоятельствами в выборе темы «Анализ поисковых систем в сети Интернет», для моей курсовой работы, стали актуальность темы на сегодняшний день, а также достаточная открытость и известность мне этой темы, так как я часто пользуюсь всемирными сетями.

Ресурсы Интернета уже давно не просто игрушка, превратившаяся в незаменимый инструмент для каждодневной работы людей различных профессий. Количество данных в сети стремительно растет, и пропорционально им растет и объем. Ученые утверждают, что объем информации, передаваемой по Интернету, увеличивается в два раза каждые шесть месяцев.

В сети каждый день появляются множество новых документов, и что бы быстро и качественно находить нужную информацию появились специальные поисковые средства. Несколько лет назад говорили: в Интернете ничего невозможно найти, но там есть всё. Но когда появились поисковые программы, ситуация в корне поменялась, и сейчас в интернете информацию которая вам нужна, можно найти практически мгновенно.

Наиболее популярным способом поиска в Интернете является использование поисковых систем. Что же такое поисковая система? Поисковая система – портал, осуществляющий поиск, сбор и сортировку информации в сети Интернет. Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.

В данной курсовой работе рассматривается поиск информации во Всемирной паутине с помощью нескольких наиболее распространённых систем поиска (Рамблер, Яндекс и т.д.). Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от ваших личных пристрастий.

Глава 1. Теоретическая часть

1.1 Особенности поисковых систем

Поисковая система – это сайт, к которому пользователь обращается посредствам ключевого слова и находит интересующую его информацию. Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.

По пространственному масштабу поисковую систему можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные поисковые системы описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное – по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

Поисковой процесс представляет собой четыре этапа: формулировка (до начала поиска), действие (идет поиск), обзор результатов (выводится на экран), и усовершенствование (возвращаемся к поиску с той же потребностью, но уже иной формулировкой). Более удобная схема поиска состоит из следующих этапов:

  • Задание информационной потребности на естественном языке;
  • Выбор поисковых сервисов и точная запись информационной потребности;
  • Выполнение созданных запросов;
  • Предварительная обработка полученных ссылок на документы;
  • Обращение за искомыми документами;
  • Предварительный просмотр найденных документов;
  • Сохранение подходящих документов для изучения;
  • Извлечение из подходящих документов ссылок для расширения запроса;
  • Изучение всех сохраненных документов;
  • Если искомая информация не найдена, то возвращаемся к первому пункту.

1.2 Методы поискового запроса

Процесс поиска довольно прост: задавая ключевые слова, характерные для искомой информации, пользователь надеется максимально просто и быстро найти интересующую его информацию. Это значит, что поисковая система должна думать точно также как думает пользователь, когда ищет ту или иную информацию. Разработчики поисковых систем постоянно стараются совершенствовать алгоритмы и принципы поиска, пытаются всячески ускорить работу системы, добавляя новые функции и возможности, чтобы удовлетворить потребности пользователей.

Поисковая система состоит из поисковой машины, базы данных или индекса и точек входа в систему. Поисковая машина – это аппаратно-программный комплекс, который осуществляет быстрый поиск внутри сервера или Интернет-ресурса необходимой информации.

Поисковая машина состоит из:

  • паук или спайдер (spider) приложение, которое занимается скачиванием страниц интернет ресурсов.
  • индексатор (indexer). Индексатор производит первоначальный анализ содержимого скачанной страницы, выделяет основные части (название страницы, описание, ссылки, заголовки и т.д.) и раскладывает все это по разделам поисковой базы данных – помещает в индекс поисковой системы. На основе результатов первоначального анализа индексатор также может принять решение, что страница вообще “недостойна” находиться в индексе. Причины такого решение могут быть разными: страница не имеет названия, является точной копией другой, уже имеющейся в индексе страницы или содержит ссылки на запрещенные законодательством ресурсы.
  • краулер (crawler) программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета с целью занесения информации о них в базу данных поисковика. Краулер анализирует пути, ведущие с текущей страницы на другие разделы сайта, или на страницы внешних интернет ресурсов и определяет дальнейший порядок обхода пауком нитей всемирной паутины. Именно краулер находит новые для поисковой машины страницы и передает их пауку. Работа краулера построена на базе алгоритмов поиска на графах в ширину и глубину.
  • подсистема обработки и выдачи результатов (Search Engine and Results Engine ) самая важная часть любой поисковой машины. Алгоритмы работы этой подсистемы компании разработчики хранят в строгой секретности, поскольку они являют собой коммерческую тайну. Именно эта часть поисковой машины отвечает за адекватность ответа поисковой системы на запрос пользователя.

Вне зависимости от того, какой поисковой системой вы пользуетесь, примерный алгоритм поиска информации следующий:

  • Вы переходите на начальную страницу поисковой системы или на любую страницу, на которой находятся поля для ввода запроса и кнопка для начала поиска. В последнем случае после нажатия кнопки вы автоматически перейдёте на страницу поисковой системы. Отличий между собственно поисковой системой и страницей с полями для ввода запроса, который передаётся поисковой системе, нет. Главное – перейти на страницу, на которой вы можете ввести ваш запрос;
  • Если система позволяет последовательные уточнения области поиска, то вы переходите в разделы, определяющие границы поиска информации (например, поиск только в области науки или поиск среди европейских узлов Интернета). В таких системах, запрос в главном разделе, осуществляет поиск среди всех узлов Интернета. Если же вы, например, перейдёте в раздел «Новости», то поиск по запросу будет выполняться только среди узлов, посвящённых новостям. Таким образом, вы сначала определяете границы поиска, после этого отправляется запрос на поиск информации. Если выбранная вами система поиска не позволяет уточнить запрос, то это действие пропускается;
  • Вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. В простейшем случае это одно или несколько слов, например «Анекдоты», но возможны и сложные запросы с логическими операциями «И», «ИЛИ», «НЕТ»;
  • Если система поиска позволяет, то уточняются некоторые параметры запроса с помощью дополнительных полей, списков, флажков и переключателей, которые могут находиться на странице рядом с полем запроса. В большинстве случаев уточнение параметров не требуется. Составление сложных запросов чем-то похоже на программирование и пользуется популярностью у программистов, людей, не знакомых с программированием;
  • Нажимается кнопка для начала поиска. После некоторой паузы вы автоматически попадаете на страницу со списком документов, удовлетворяющих вашему запросу. Длительность паузы зависит от сложности запроса, скорости работы поисковой системы и качества вашей связи с данной системой;
  • Если ссылок много, и они не помещаются на одной странице, то после прочтения первой страницы с результатами поиска вы можете перейти к следующей, и так далее. Таким образом, вы просматриваете все найденные ссылки на документы;
  • После нахождения нужной ссылки вы щёлкаете на ней мышью и переходите на страницу, которую вы разыскивали. Если вы захотите посмотреть другие найденные страницы, то можно вернуться назад, к странице со ссылками на найденные документы, и перейти по другой ссылке.

Когда говорят о поисковых запросах, то часто упоминают слово «релевантность». Слово релевантность означает степень соответствия документа запросу. Чем больше релевантность, тем лучше результаты поиска. Релевантность определяется по следующим критериям:

  1. Проверяется, сколько раз заданное словосочетание (слово) встречается на отображенных страницах;
  2. Если введена фраза, то проверяется расстояние между словами;
  3. Индекс цитируемости (количество ссылок на данную страницу);
  4. Чем больше на страницу ссылаются, тем больше вероятность, что именно эта страница нужна пользователю;
  5. Каким стилем (шрифтом) написана на странице искомая фраза;
  6. Если фраза выделена жирным или написана крупным шрифтом; (заголовок), то это признак более высокой релевантности страницы;
  7. Возраст сайта (Чем старше сайт, тем лучше это влияет на релевантность).

Таким образом, можно отметить, что уровень релевантности – это целый комплекс параметров.

Итак, для того чтобы найти интересующую вас информацию в кротчайшие время, вам необходимо правильно составлять поисковой запрос.

Наиболее эффективным является следующий метод составления поискового запроса:

  1. Слова поискового запроса нужно писать грамотно. Так, например, запрос «пошив пальтов» нужного результата не даст;
  2. Если поиск нужных результатов не принес, нужно переформулировать запрос с помощью синонимов;
  3. Если результат поиска не удовлетворяет вас, то попробуйте включить в запрос уточняющие слова. Для запроса «стихи Пушкина» слово «стихи» является уточняющим;
  4. В сложных случаях нужно использовать язык запросов. С помощью языка запросов можно задавать комбинации разных критериев поиска.

1.3 Поисковая система Yandex

Подробнее рассмотрим язык запросов поисковой системы Yandex. Предположим, что нам нужно найти адрес проживания Мартиросяна С.Т. Если правильно сформулировать поисковой запрос, то это не составит нам труда. В языке запросов есть такая функция, как включение/ исключение определенных слов – знаки «+» и «-».

Попробуем сформулировать поисковой запрос. Для этого используем фамилию человека и пару уточняющих слов. В качестве уточняющего слова возьмем «адрес» и дату рождения человека. Получим:

Рис.1

Как видно на рисунке 1 нашлось 7 страниц, но с помощью языка запросов можно сократить их число до 1 страницы. Применим специальный символ «+» к уточняющим словам – это означает, что будут найдены те страницы, на которых в обязательном порядке присутствуют уточняющие слова. Получим:

Рис.2

На рисунке 2 видно, что мы нашли 1 страницу, без лишнего мусора. Этот поисковый запрос сформулирован правильно. Еще одним важным символом языка запросов является знак «|». Вертикальная черта позволяет задать альтернативы – система ищет хотя бы одно из перечисленных слов. Например запрос: «Физика лекции | конспекты» будет аналогичен как запросам «Физика лекции» и «Физика конспекты».

Обычно поисковики ищут все формы введенного слова. Например по запросу «Звукоизолирующая» будут выведены страницы со словом «звукоизолирующий» , «Звукоизолирующих» и т.д. Рисунок 3.

Рис. 3

Но чтобы найти именно ту форму слова, которая задана в поисковой строке, в языке запросов предусмотрен символ «!». Применение этого символа видно на рисунке 4.

Рис. 4

Если вам нужно найти точную фразу, то следует её заключать в кавычки: «»

В случае, когда вы хотите найти все варианты фразы: «очень (любое слово) девушка». То нужно поставить запрос так «очень /+2 девушка» , причем 1 – это означает отсутствие слова, а 3 означает, что между «очень» и «девушка» будут два любых слова:

Рис.5

На рисунке 5 видно, как между словами «очень» и «девушка» вставлено «любое слово».

Следует отметить, что при выполнении запроса поисковая система не ищет документ непосредственно в Интернете. Она обращается к своей базе данных, где в компактном виде собраны данные об информации в Интернете. Возможно, что реальное состояние Интернета несколько отличается оттого, что храниться в базе данных.

Поисковые системы постоянно пополняют и обновляют свои базы данных, чтобы минимизировать такое несовпадение. Существует способ пополнения информации в базы данных поисковых машин: Разработчик Web-страницы самостоятельно добавляет ссылку на неё в поисковую систему. Большинство систем позволяют это сделать совершенно бесплатно. Специальная программа, называемая роботом, находит ссылку на новую страницу во Всемирной паутине. Роботы запускаются поисковой системой, чтобы проверить, существуют ли ранее найденные документы и не появились ли новые.

Глава 2. Практическая часть.

2.1. Поиск с помощью Alta Vista

Поисковая система Alta Vista была открыта для свободного использования в конце 1995 года. Это система до сих пор является достаточно популярной, хотя в последнее время другие системы составляют ей значительную конкуренцию. Система обеспечивает поиск как во Всемирной паутине, так и в группах новостей. После ввода ключевых слов вы получаете информацию о количестве найденных документов и их краткие описания со ссылками на информацию в Интернете. Расширенный поиск позволяет использовать логические операторы для формирования сложных запросов. Рассмотрим возможности системы Alta Vista на конкретных примерах.

Рис.2.1 Начальная страница системы Alta Vista

На начальной странице (Рис.2.1) кроме поля для ввода запроса расположен открывающийся список. С его помощью можно выбрать интересующий вас язык искомого документа: any languache (Любой язык), Russian (Русский) или любой другой язык. По умолчанию ищется информация на любом языке. Выше поля ввода расположены несколько ярлычков, щелчком на которых можно выбрать область поиска: Web (Паутина) – во Всемирной паутине,  News (Новости) – в группах новостей и так далее.

Зададим несколько простых вопросов для поиска информации, чтобы продолжить знакомство с возможностями системы Alta Vista. Для поиска документов, содержащих некоторое слово, надо ввести это слово, а для поиска документов, содержащих искомое словосочетание, необходимо заключить несколько слов в двойные кавычки. Если слово содержит только строчные буквы, то ему сопоставляются также и слова, содержащие заглавные буквы.

Например, слову интернет будет поставлено в соответствие интернет, Интернет и ИНТЕРНЕТ. То есть, чтобы найти слово, написанное, как большими, так и маленькими буквами, надо в запросе использовать только маленькие буквы (строчные).

Наличие заглавных букв в слове, заданном в запросе, конкретизирует поиск. В результате поиска будет найдено точно такое слово с учётом регистра. Например, на запрос интерНЕТ будет найдено только слово интерНЕТ, если оно, конечно, имеется в базе данных. Слова же интернет, Интернет  и  ИНТЕРНЕТ по такому запросу найдены не будут.

В системе Alta Vista можно задавать только часть слова, используя для этого знак *.  Использование этого знака похоже на его использование в шаблонах файлов. Вместо переменной части слова ставится данный знак, например: на запрос интернет* будет найдены слова интернет, Интернета,  ИНТЕРНЕТОМ, и тому подобные. Данную возможность удобно использовать для поиска однокоренных слов.

Другой удобной возможностью является использование в запросах знаков + и -. Добавив такой знак перед словом или фразой, вы требуете обязательное их присутствие или отсутствие в документе. Если вы ставите знак + перед словом, то этим вы указываете, что данное слово обязательно должно присутствовать в найденном документе. Символ – указывает на то, что следующее за ним слово не должно присутствовать. Например: запрос +интернет* – интернет выдаст вам только склонения слова Интернет, но не само слово. Мы указали с помощью +интернет*, что в искомом документе должны быть все слова, начинающиеся с «интернет». С помощью же  -интернет мы задаём, что само слово «интернет» не должно присутствовать.

Ещё одним удобным способом уточнения поиска является использование специальных ключевых слов. Существуют различные ключевые слова, мы рассмотрим только два наиболее полезных слова. Ключевое слово link: позволяет ограничить поиск среди страниц, на которых расположены ссылки на заданную страницу. Например, для поиска страниц со ссылками на узел Microsoft, необходимо в качестве запроса ввести  link:www.microsoft.com.  Ключевое слово url: позволяет искать среди страниц, в адресе которых существует заданная в качестве аргумента часть. Если вы хотите найти все страницы, в адресе которых есть название фирмы Intel, то следует ввести запрос url:intel. Эти ключевые слова можно использовать вместе. Например, если мы хотим найти все страницы Российской части Интернета, на которых имеются ссылки на систему Alta Vista, следует в качестве запроса указать link:altavista.digital.com url:ru.

В подавляющем большинстве случаев вы сможете найти необходимую информацию с помощью простых запросов, но иногда могут потребоваться и более сложные. Система Alta Vista позволяет формировать запросы с использованием логических операций. Они называются сложными, или расширенными.

Для построения сложного запроса используются логические операторы и синтаксические выражения. Попытаемся пояснить, что это такое.

Синтаксические выражения – это любые слова и словосочетания, аналогичные рассмотренные в простых запросах. Логические операторы служат для выполнения операций «И», «ИЛИ», «НЕТ» и «ОКОЛО» над синтаксическими выражениями. Часто синтаксические выражения, над которыми производятся логические операции, называются аргументами. В синтаксических выражениях вы также можете использовать отдельные слова или фразы, заключая несколько слов в двойные кавычки. Правила использования заглавных и прописных букв в сложных запросах так же не отличаются от данных правил в простых запросах.

Главное, что отличает сложный запрос – это использование логических операторов и круглых скобок. С помощью операторов и скобок вы создаёте из отдельных синтаксических выражений необходимый запрос.

Рассмотрим несколько примеров. Перед примерами перечислим допустимые в расширенных запросах логические операторы:

  • Оператор AND для логической операции «И». Оператор гарантирует, что в документе присутствуют оба документа.
  • Оператор OR для логической операции «ИЛИ». Оператор гарантирует, что в документе присутствует хотя бы один из аргументов.
  • Оператор NEAR для операции «ОКОЛО». Данный оператор гарантирует, что аргументы стоят друг от друга в тексте не дальше, чем на десять символов.
  • Оператор NOT для логической операции отрицания, то есть для операции «НЕТ». Этот оператор гарантирует, что аргумент не присутствует в документе.

Чтобы в найденном документе отсутствовало какое-либо слово, надо перед ним в запросе поставить оператор отрицания. Полезно для удобства чтения запроса выделить слово с отрицанием круглыми скобками: (NOT описание).

Для задания одновременного присутствия в искомом документе сразу нескольких слов или словосочетаний используется логический оператор «и».

Например, если вы хотите, чтобы в документе было слово «провайдер» и словосочетание «очень дёшево», то следует в запросе указать провайдер AND «очень дёшево». В качестве аргумента можно использовать не только слова и словосочетания, но и логические выражения, например по запросу интернет AND (NOT описание) будут найдены документы, в которых имеется слово «интернет» и нет слова «описание». В простом запросе для этого мы использовали бы +интернет-описание. Если вы хотите, чтобы в искомом документе находилось хотя бы одно из нужных слов, то следует воспользоваться логической операцией «ИЛИ». Например, запрос телевизор OR радио ORвидео найдёт документы, в которых есть хотя бы одно из перечисленных слов.

Более сложный запрос «дешевый доступ в Интернет» OR  (провайдер END  «очень дёшево»)  задаст поиск документов, в которых есть словосочетание «дешевый доступ в Интернет» или встречаются одновременно слова «провайдер» и «очень дёшево».

Операция «ОКОЛО» не является классической логической операцией. С её помощью можно задать, то, чтобы слова находились рядом друг с другом. Например, провайдер AND «очень дёшево» указывает, что данные слова просто присутствуют, однако они могут располагаться в разных концах документа. Запрос же провайдер NEAR «очень дёшево» описывает, что слово «провайдер» и словосочетание «очень дёшево» должны находится друг от друга недалеко, то есть между ними не должно находиться более десяти слов.

С помощью логических операций можно создавать достаточно сложные запросы, например:

((провайдер* NEAR московск*) OR ((NOT описание) AND интернет*)) AND  «очень дёшево». Разберём этот запрос по частям. Выражение  (провайдер* NEAR московск*) описывает, что в искомом документе должно быть слово, начинающееся с «провайдер», то есть «провайдер», «провайдера», «провайдеру» и тому подобное, причём это слово должно находиться рядом со словом, которое начинается с «московск». Этим мы ограничиваем поиск московскими провайдерами. В других скобках выражении  ((NOT описание) AND интернет*) описывает, что в документе должно быть слово, начинающееся с «интернет», и недолжно присутствовать слово «описание». Рассмотренные два выражения соединяются логическим

оператором OR, то есть мы ищем документ, в котором или описываются московские провайдеры, или имеется информация об Интернете, которая не является описанием. Такой поиск осуществляется по запросу   ((провайдер* NEAR московск*) OR ((NOTописание) AND интернет*)). В нашем же запросе ещё присутствует последняя часть AND «очень дёшево». С её помощью мы задаём, что в дополнение к предыдущим условиям, необходимо, что бы в найденном документе присутствовало словосочетание «очень дёшево». Таким образом мы сформировали достаточно сложный запрос, хотя, скорее всего, по нему вы не найдёте не одного документа.

Пример: зададим более простой запрос. С помощью части запроса (интернет* OR internet) мы описываем русское название Интернета в любых склонениях или его английское название. Что бы искать провайдеров Интернета, мы описываем, что рядом со словом «Интернет», в любом виде, должно находиться слово «провайдер». Теперь наш запрос выглядит так: (провайдер NEAR (интернет* OR internet)). По нему мы найдём информацию о провайдерах Интернета. Если же мы хотим ограничить информацию только московскими провайдерами, то следует в запрос добавить AND моск*. Этим мы описываем, что в документе обязательно должно присутствовать слово, начинающееся с «моск*». В итоге мы получили запрос (провайдер NEAR(интернет* OR internet)) AND моск*.

В этом примере я искал русские слова в Интернете. Для этого можно воспользоваться системой Alta Vista, но более удобно использовать русские поисковые системы. Если же вы хотите найти зарубежную информацию, система Alta Vista становится просто незаменимой.

Здесь я подробно описал поисковую систему Alta Vista по двум причинам. Во-первых, она является крупнейшей в мире, и вам наверняка придётся воспользоваться её услугами. Кроме того, построение запросов в ней аналогично построению запросов для других систем поиска.

2.2. Использование системы Yahoo

Принципиальное отличие поисковой системы Yahoo (Яхо) от других систем в том, что вы можете найти необходимую вам информацию без использования запросов, а просто переходя по ссылкам разделов встроенного справочника и последовательно уточняя область ваших интересов. Yahoo является самой популярной системой в США, так как не требует специальной подготовки для поиска информации. Не надо знать правила формирования запросов, достаточно просто переходить по ссылкам в нужные разделы. Однако для русскоязычных пользователей эта система не слишком удобна, так как разбиение на разделы проводилась с учётом американской специфики. Кроме того, в справочнике Yahoo содержится намного меньше ссылок на русскоязычные документы, чем в базе данных Alta Vista. Однако для поиска информации по конкретной тематике данная система может оказаться достаточно полезной.

Заглавная страничка Yahoo! (Рис.2.2.) грузится очень быстро – хотя на ней очень много ссылок, но все они текстовые. При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу “Intelligent default”, то есть Yahoo! ищет наиболее подходящие результаты в таких областях: в категориях Yahoo, в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях.

Рис. 2.2 Начальная страница поисковой системы Yahoo

При задании критериев поиска для Yahoo! нужно помнить, что Yahoo! ищет эти слова только в названии и описании страницы, поскольку полнотекстового индекса на Yahoo! нет. Поэтому не следует указывать при поиске слишком много терминов или синонимов – количество результатов с Yahoo! снизится или даже будет нулевым.

Поиск в системе Yahoo реализован с использованием Alta Vista. Все описанные выше приёмы, которые мы применяли при работе с Alta Vista, применимы и к Yahoo. Таким образом, вы можете использовать поиск в Yahoo совершенно так же, как и в системе Alta Vista.

Систему Yahoo удобно использовать для поиска спортивных событий, новостей, прогнозов погоды, развлечений и тому подобной информации. Это обусловлено особенностями разбиения информации на разделы в данной системе. Если вам удобнее не составлять запрос, а выполнять последовательные уточнения, то эта система вас должна устроить.

Поисковая система Google

Рис. 2.3 Начальная страница поисковой системы Google

За почти 20 лет существования корпорации Google, он приобрел статус крупнейшей поисковой системой в мировом масштабе.

Google (Рис 2.3.) осуществляет поиск по документам на более чем 35 языках, в том числе русском. В настоящее время многие порталы и специализированные сайты предоставляют услуги поиска информации в Интернете на базе Google, что делает задачу успешного позиционирования сайтов в Google еще более важной.

Поисковая система Google выглядит стабильнее своих конкурентов в плане смены алгоритма и апдейтов. Информация, только что размещенная на сайте, может в считанные минуты попасть в основную выдачу. Поисковые роботы Google в три раза быстрее, чем роботы других поисковых систем.

Google первым применил новую технологию поиска и выдачи результатов – релевантность интернет-страниц – то, что не лежит на данной конкретной странице, но тем ни менее влияет на ранг ее выдачи. Поисковая система Google учитывает гипертекстовую структуру Интернета, и какие страницы на какие ссылаются. Google сама определяет релевантность интернет-страниц Страница, на которую ссылаются чаще, более релевантна и значит более популярна.

Особенность Google заключается в том, как и по какому критерию эта поисковая система классифицирует результаты поиска на своей странице. Используемый алгоритм PageRank сортирует все веб-страницы по критерию смыслового соответствия.
Алгоритм PageRank зависит от нескольких факторов:

  • От частоты повторения и местоположения ключевых слов на веб-странице – если искомое слово или фраза только один раз встречается на сайте, то страница получает низкий бал.
  • От времени существования страницы – каждый день в Интернете появляются новые сайты, но не многие задерживаются надолго. Поэтому преимущество отдается уже зарекомендовавшим себя сайтам, существующим долгое время.
  • От количества веб-станиц, связанных с «главной страницей» – Google «смотрит» на количество веб-страниц, относящихся к определенному сайту и определяет ее рейтинг среди всех остальных. 

Помимо просто поиска, здесь можно сравнивать цены на товары в интернет-магазинах, читать новости и многое другое. Есть и служба блокировки назойливой интернет-рекламы

2.3 Поисковая система Rambler

Рамблер — одна из первых поисковых систем российского интернет-пространства. Несмотря на свой солидный «возраст», конкуренции с сильными соперниками она не выдерживает, сегодня система охватывает только 0,4% поиска. ( Рис 2.4.)

Рис. 2.4 Начальная страница поисковой системы Rambler

Название «Рамблер» как нельзя лучше отражает суть деятельности компании («rambler» – по-англ. «бродяга»). Rambler позволяет искать документы на английском, русском, украинском и многих других языках, а при формировании списка к выдаче учитываются не только ключевые запросы, но и их разнообразные словоформы. Полученные в результате поиска данные структурируются по степени соответствия запросу (релевантности) и распределяются по сайтам. 
В июне 2003 года компания запустила новую версию поисковой машины, которая отличается от предыдущей по двум основным параметрам. Первое и главное – значительно увеличилась скорость поиска; второе, благодаря новой архитектуре системы, обновление поискового индекса происходит несколько раз в день.

Теперь поисковик всегда находит самые свежие документы и последние новости. Рамблер знаком с русским языком, понимает термины типа «б/у», «у.е.» и «а/я». Как дань моде, открылась лаконичная версия поисковой системы по адресу «r0.ru». Содержание ее стандартно – строка поиска, почта и новости.

Еще одна особенность поисковика Rambler, это механизм ассоциаций. Помимо стандартной ответной страницы, в которой найденные документы расположены в порядке убывания релевантности, появляется строка – «У нас также ищут». В ней приведены слова и словосочетания, тематически связанные с запросом. Новый механизм также исправляет ошибки запросов. На введенное gjujlf пользователь получит теперь положительный результат: сведения о погоде (gjujlf – это слово «погода» набранное латиницей).

Необходимо отметить проекты Rambler-Группы и Rambler-Фото. Оба этих проекта предоставляют пользователям сети возможность использования заложенных в проекты программных алгоритмах в собственных целях. Проект Rambler-Группы дает людям возможность начинать обсуждения самых разных тем, которые существуют не только в виде форумов, но также и в виде открытых списков рассылки. Проект Rambler-Фото представляет пользователям сети возможность создания фотоальбомов в объеме до 20 мегабайт, причем это дисковое пространство зарегистрированные пользователи поисковой системы Rambler получают в дополнение к тем мегабайтам почты, на которые они могут претендовать по новым условиям e-mail обслуживания (15 мегабайт).

Rambler Mass Media – первый и по-прежнему лидирующий на рынке информационный дайджест. Помимо текстовых материалов и фоторепортажей, ставших визитной карточкой проекта, Rambler Mass Media представляет пользователям аудио и видеосюжеты. В числе поставщиков – ВГТРК и BBC, Deutsche Welle, радио “Маяк” и др. Заголовки важнейших новостей размещаются на первой странице портала Rambler.ru и в блоке “Главные новости дня” на главной странице Rambler Mass Media. Наиболее актуальные новости могут читать и посетители других сервисов Рамблера – Рамблер Почты, Погоды на Рамблере.

2.4 Поисковая система Aport 

Поисковая система Апорт (Рис 2.5.) на сегодняшний день находится на 16 месте по популярности поисковых машин Рунета. Данная система осуществляет полнотекстовый поиск документов c учетом морфологии русского языка в поисковых запросах.

Рис. 2.5 Начальная страница поисковой системы Aport

К важным свойствам первой версии поисковой системы Апорт можно отнести перевод запроса и ответа на английский язык и обратно. Второе свойство – реконструкция проиндексированных страниц из собственной базы. Это дает возможность просмотра уже несуществующих страниц.

www.aport.ru – первым из поисковых систем Рунета реализовал базовые технологии Google. “Page rank” – характеристика популярности ресурса по формуле “обратных ссылок”: ссылки с других сайтов на данный ресурс. Причем учитывается не только количество, но и важность ссылок. В поисковой системе Aport впервые была реализована возможность поиска по новостным лентам.

В настоящее время возможности поисковой системы “Апорт” не так обширны, но все-таки значительны. На официальном сайте поисковика можно найти каталог, охватывающий добрую часть русскоязычных Интернет-ресурсов, с удобным рубрикатором и системой выдачи.

Также, на “Апорт” представлена актуальная информация различного рода: это и программа телевидения, и новости, и прогноз погоды, и котировки валют.

Особый блок сервисов поисковика составляют почта, справочная информация (в разделе “Словари”) и поиск объекта по адресу (для Москвы, Санкт-Петербурга, а также для федеральных округов РФ: Дальневосточного, Приволжского, Северо-Западного, Сибирского, Уральского, Центрального и Южного).

С помощью “Доски объявлений” от “Апорт” можно приобрести, продать, подарить или принять в дар все, что угодно: от котят до земельных участков. Данный сервис предлагает еще и поиск работы, однако найти здесь настоящие вакансии среди сомнительных объявлений довольно сложно.

2.5 Поисковая система Яндекс

На сегодняшний день Yandex ( Рис 2.6.) это одна из самых востребованных поисковых систем в Рунете. Поиск позволяет искать документы на русском, татарском, украинском, белорусском, казахском, английском, немецком и французском языках с учётом морфологии этих языков и близости слов в предложении.

Рис. 2.6 Начальная страница поисковой системы Yandex

Поисковый запрос от пользователя, после анализа загруженности поисковой системы, отправляется на наименее загруженный сервер. Для обеспечения такой возможности сервера Яндекса объединены в кластеры, и даже кластеры кластеров. Затем пользовательский запрос обрабатывается программой под названием «Метапоиск». Метапоиск осуществляет анализ запроса в реальном времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. д. Также, программа определяет, относится ли запрос к категории наиболее популярных или недавно заданных. Выдача на такие запросы некоторое время хранится в памяти (кэше) метапоиска, и в случае совпадения показываются заранее сохранённые результаты. Если запрос является редким и совпадений в кэше не найдено, система перенаправляет его на программу «Базового поиска». Тот анализирует индекс системы, также разбитый по разным дублирующимся серверам (это укоряет процедуру). Затем полученная информация снова попадает на метапоиск, данные ранжируются и показываются пользователю в готовом виде.

Основная особенность системы Яндекс, делающая популярной ее среди русскоязычных пользователей, – это способность определять различные словоформы с учетом морфологических особенностей русского языка.

В 2012 г. Был внедрен новый алгоритм «Калининград», который позволил сделать поиск персонализированным. Это значит, что теперь основным фактором ранжирования является сам пользователь, который формирует запрос для поисковой системы. Другими словами, результаты поиска по одному и тому же вопросу для двух разных пользователей теперь будет различаться в зависимости от нужд и предпочтений самих пользователей. Это новый шаг на пути эволюции поисковых систем.

В 2016 г. компания запустил сервис Яндекс Такси.

Кроме того, среди нововведений Яндекса можно отметить:

  • введение геозависимости запросов в зависимости от региональной принадлежности пользователя и сайта;
  • учет поведенческих факторов;
  • разработка механизма подсказок, исправления ошибок и распознавания аббревиатур;
  • активная борьба с продажными ссылками и переоптимизированными текстами;
  • введение персонализированного поиска;
  • учет добавочной смысловой стоимости сайта.

2.6 Поисковая система Mail. ru 

Поисковик Mail.ru остался позади известных Яндекса и Google. Сначала этот сервис работал, используя поисковые услуги Google, позже — Яндекса, и только в 2013 году Mail.ru стал применять свой поисковой движок. (Рис 2.7.)

Рис. 2.7 Начальная страница поисковой системы Mail.ru

Национальная почтовая служба Mail. ru – это не только поисковая система но и один из крупнейших порталов российского Интернета. Ежедневная аудитория Mail.ru – более 5 миллионов пользователей. Общее число регистраций со дня основания около 60 миллионов. Mail.ru – самый быстроразвивающийся российский Интернет-ресурс. Через почтовые ящики Mail.ru ежедневно проходит более 25 миллионов писем. Mail.ru занимает лидирующую позицию среди бесплатных почтовых сервисов, предоставляя своим пользователям почтовый ящик неограниченного размера с защитой от спама и вирусов, переводчиком, проверкой правописания, архивом для хранения фотографий и многое другое.

Нужно сказать, что разработчики поисковой системы изначально делали ставку не на поиск, а на различные сервисы: Агент, Почта, Мой Мир, Одноклассники, и самый главный способ монетизации — игры. Именно за счет этих услуг холдинг, по некоторым данным, является одним из самых посещаемых в России.

Выделить основные приоритеты в работе поисковых алгоритмов довольно сложно, но можно отметить несколько факторов:

  • качественный контент;
  • поведенческие показатели;
  • удобный и интуитивно понятный для посетителей сайт;
  • наличие естественных ссылок с других сайтов.

Соблюдение этих очевидных правил поможет сайту уверенно занять позиции в первой десятке. По сравнению с гигантами Яндексом и Google, продвигать сайт на Mail.ru гораздо легче и проще.

Какая из поисковых систем лучше?

Рейтинг мировых поисковых систем по данным 2016 г. представлен в следующей таблице.

Как мы видим лидерами по показателям качества представленной информации оказались Yandex, Google .

Мною был введен один и тот же «запрос» в несколько поисковых систем.

Yandex оказался одной из наиболее эффективных систем с точки зрения ее релевантности и соответствия выданных результатов заданному запросу. Хоть страниц было много, но нужная информация находилась на самых первых из них. Мало затраченного времени – необходимые результаты. При этом немаловажную роль сыграла также относительная новизна представленной информации. 

Google выдавал результаты страниц, на которых не всегда первое место занимали релевантные документы. Зато жалоб на разнообразие просто не было, т.к. в представленном количестве материала можно было найти что угодно (при этом было потрачено времени в два раза больше, по сравнению с поисками в других поисковых системах).

Система Aport оказалась менее эффективной, чем вышеназванные из-за ее чрезмерной ориентации на частные случаи, но результаты, которые она выдавала, значительно отличались от результатов других поисковых систем. Они были единственные в своем роде, не всегда релевантны, но неповторимы.

Rambler, несмотря на прочно занимаемое четвертое место в количественном рейтинге, оказался намного менее эффективной по релевантности системой. Здесь преобладает ориентация на российские источники информации, что снижает ее адекватность в оценке ситуации в других странах. К этой же категории по степени релевантности можно отнести и поисковую систему Google.

Поисковую систему Yahoo можно рассматривать как наиболее эффективную наравне с Yandex, но только в англоязычном поиске. На русском языке в данной системе имеется незначительное количество сайтов и их релевантность минимальна.

Заключение

По итогам сделанной мной работы я могу заключить что; поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

По моему мнению, самой лучшей иностранной поисковой системой является Google, так как для меня основное значение имеет точность и полнота предоставляемых данных. Но можно заключить также что, каждая поисковая система будь то Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно какой именно лучше пользоваться было бы неправильно. Поэтому для удобства поиска и полноты информации следует пользоваться несколькими поисковиками вводя в них нужные запросы. По моему мнению, из многих Российских поисковиков выделяются Яндекс и Рамблер, для них характерно постоянное обновление баз данных что, обеспечивает именно актуальность и точность предоставляемой информации.

Список литературы

      1. Экслер, А.Б., “Самоучитель работы в Интернете” – Москва.: NT Press, 2010г.
      2. Кузьмин А.В. Золотарева Н.Н. Поиск в Интернете – Санкт – Петербург.: Издательство НиТ, 2011г.
      3. Егоров, А.Б., ” Поиск в Интернете” – Санкт – Петербург.: НиТ, 2010г.
      4. Павел Храмцов “Поиск и навигация в Internet”. http://www.osp.ru/cw/1996/20/31.htm
      5. Андрей Аликберов “Несколько слов о том, как работают роботы поисковых машин”. http://www.citforum.ru/internet/search/art_1.shtml
      6. www. google.ru
      7. www.yandex.ru
      8. www.rambler.ru
      9. www.aport.ru
      10. www.mail.ru
      11. www.yahoo.ru

СПИСОК ДЛЯ ТРЕНИРОВКИ ССЫЛОК

  • Проектирование реализации операций бизнес-процесса .
  • Методы стимулирования и развития познавательного интереса, как необходимость в достижении педагогической цели
  • Аудиторская деятельность как вид предпринимательства: общая характеристика. Внутренний аудит
  • Способы прекращения обязательств)
  • Проектирование реализации операций процесса «Реализация билетов через розничные кассы
  • Регламент выполнения процесса «Реализация билетов через розничные кассы»
  • Управление товарооборотом и товарными запасами на предприятии с целью повышения эффективности коммерческой деятельности в ООО «ГарантЪ»
  • Управление процессом реализации изменений и нововведений
  • АНАЛИЗ ОРГАНИЗАЦИОННОЙ КУЛЬТУРЫ ООО «ИРИДА»
  • Сущность и значение Pr – коммуникаций в спорте
  • Цели и критерии оптимизации бизнес-процессов
  • Методы кодирования данных. Выбор способа кодирования

Знание тонкостей и нюансов работы поисковых систем, владение теоретической базой и навыками в получении необходимых данных критически важно для любого SEO специалиста, который решает ту или иную задачу, будь то продвижение сайта или составление семантического ядра. Язык запросов поисковых систем – это теоретический базис, который помогает эффективно работать со статистическими источниками данных, быстро получать нужные ключевые фразы.

Что такое язык поисковых запросов и операторы поисковых систем

Язык поисковых запросов – это специально разработанный для поисковых систем программный язык, который помогает пользователям более точно искать информацию. Учитывая, что всемирная паутина имеет невероятное количество документов и информации, умение не потеряться в ней экономит немало времени.

Для управления и использования гибкого поиска в языке поисковых запросов используются так называемые операторы – это символы и команды, позволяющие настраивать условия поиска запроса. Сам язык запросов максимально упрощен, чтобы любой пользователь мог с ним справиться и выбрать необходимый для его случая оператор.

Разбор и применение операторов Яндекс

Порядок слов

В некоторых случаях порядок слов меняет семантическую направленность. Например, выражение: “мать любит дочь” и выражение “дочь любит мать” имеют разные смыслы. Как видим, в русском языке в отличие от математики перестановка слагаемых может менять сумму.

В Яндексе для управления очередностью и порядком слов существует большое количество операторов. Наиболее популярные операторы из языка поисковых запросов представлены в таблице.

Оператор Что делает Пример запроса Какая будет выдача
“ “ Слова идут подряд “крокодил Гена” Только страницы где слова “крокодил” и “гена” идут друг за другом, точно как мы задали.
& Слова в одном предложении история & Руси Например: история Киевской Руси, история возникновения Руси.
&& Слова в одном документе починить & плиту && Томск В одном предложении будут даны результаты починить плиту и в любой части документа должно быть слово Томск.
[ ] Фиксирует порядок слов билеты [москва санкт-петербург] Выдача будет отражать билеты только этого направления, а не обратного как часто бывает.
( ) Используется для сложных запросов купить телевизор (samsung | philips | lg) Результаты будут показаны для указанных трех марок сразу, так как используется оператор | (или).

Морфология

Среди операторов, которые часто используются для уточнения морфологии можно выделить один наиболее значимый.

Оператор Что делает Пример запроса Какая будет выдача
! Фиксирует форму слова афиша !новая !опера Выдача преимущественно будет для театра “Новая опера” в Москве, а не анонс новых опер в любом театре.

Данный оператор используется для поиска точного запроса в Яндексе. Именно этот вспомогательный символ позволяет найти точную частоту запроса в Яндекс.Вордстат или через программу Кей Коллектор, которая автоматизирует проставление операторов.

Обратите внимание! Независимо от формы, Яндекс может по-разному учитывать регистр букв в словах. При проставлении операторов лучше учитывать, с большой или маленькой буквы пишется слово.

Добавление и исключение слов

Оператор Что делает Пример запроса Какая будет выдача
+ Выдача с указанными словами рено + дастер Покажет документы, где встречаются именно эти слова, то есть поможет нам найти определенную модель машины Рено.
– (он же ~~) Исключает слово из выдачи доставка еды -пицца Результаты по доставке еды без выдачи со словом пицца.
| Оператор равносилен слову “или” дом дерево | кирпич Покажет выдачу по запросу дом дерево и дом кирпич. Можно добавить большое количество слов “или”.
~ Исключает  попадание слов в одном предложении Кузькина ~ мать Информация о Кузькиной, как о матери, но не имея ввиду русское идиоматическое выражение.
* Пропускает слово в указанном месте Иван * Тургенев Выдача будет содержать заданную последовательность с добавлением какого-либо слова на месте *. В нашем случае это отчество писателя.
.. Указывает цифры в интервале телевизор за 2000..6000 рублей Покажет результаты выдачи с цифрами в диапазоне от 2000 до 6000.

Исключение слов очень часто используется в контекстной рекламе, чтобы сэкономить бюджет своей рекламной кампании. С помощью них мы фильтруем отображение нашего объявления в зависимости от слов в запросе.

Одной важной особенностью операторов является возможность их комбинирования. За счет комбинаций и оператора ( ) можно выстроить сложные запросы практически на любой вкус и цвет. Например, если нам необходимо найти информацию о лекарстве Нурофен для взрослых, но не нужны результаты интернет магазинов и коммерции, тогда запрос может выглядеть так: нурофен && (показания | лечение | болезнь) -(цена | детский | купить | аналоги). То есть мы получим результаты со словами показания, лечение и болезнь в любой части документа, но в выдаче не будут присутствовать запросы со словами цена, детский, купить и аналоги. Комбинирование операторов позволяет максимально гибко настроить поиск.

В помощь SEO-специалисту

В поисковой системе Яндекс есть ряд операторов, которые могут помочь SEO специалистам в их работе, например узнать проиндексирована та или иная страница, либо найти конкурентов по ключевой фразе из семантического ядра.

Оператор Что делает Пример запроса Когда используется
site: Ищет по определенному домену site: semyadro.pro Может использоваться для получения  результатов по определенному конкуренту или для поиска по конкретному сайту.
url: Ищет по указанному url url:semyadro.pro/osnovy/* Позволяет проверить индексацию той или иной страницы. В примере мы увидим все статьи нашего сайта в разделе “Основы”.
date: Определяет дату изменения документов site:semyadro.pro date:>20170412 Позволяет определить изменение документов за определенный период времени. Учитывает также добавление значений больше (>) и меньше (<), а также интервалы .. и замену месяца и дня *. Год указывается обязательно. В примере выдача покажет новые документы (т. к. >) от 12 апреля для нашего сайта.
title: Ищет сайты с указанными словами в тайтле title:(язык поисковых запросов) Полезно использовать для поиска конкурентов. Допустим, у нас есть ядро и мы можем узнать конкурентов по тому или иному высокочастотному запросу, который может оказаться в тайтле. Для написания нескольких слов необходимо использовать скобки.

Указанные операторы помогают легче проводить работу со своим сайтом, либо заниматься поиском конкурентов, например для анализа их СЯ.

Хотелось бы отметить такой интересные параметр как &how=tm. Этот параметр позволяет сортировать результаты выдачи по дате добавления, то есть покажет самые “свежие” результаты.

Его необходимо добавить в адресную строку при поиске.

Фото 1: Яндекс отранжирует результаты по дате первого появления документа в индексе.

Соответственно мы будем видеть самые новые результаты.

Фото 2: Яндекс показывает самые свежие документы, которые недавно попали в индекс.

Удобно использовать данный параметр для своего сайта в связке с оператором site:, мы можем посмотреть какой документ был проиндексирован последним. Либо это поможет при анализе конкурентов, для анализа скорости индексации или частоты появления новой информации.

Разбор и применение операторов Google

В целом, язык поисковых запросов Гугл немногим отличаются от Яндекса. Однако, данная поисковая система имеет ряд интересных возможностей. Операторы, которые не указаны в таблице имеют то же применение, что и операторы Яндекс.

Оператор Что делает Пример запроса Какая будет выдача
OR Альтернатива оператору | в Яндексе дом (дерево or кирпич) Результаты будут показаны для обоих заданных слов. Также поддерживается оператор | как в Яндексе.
cache: Показывает кэшированную версию страницы cache:semyadro.pro/sbor/ Покажет версию страница сохраненной в кэше. Помогает когда какой-либо документ изменили или заблокировали.
info: Получение сведений о сайте info:semyadro.pro Гугл предоставит список информации, которую он может показать по данному адресу. Как правило это: кэшированная версия, страницы похожие на указанную, страницы на указанном сайте, страницы упоминающие введенную ссылку.
related: Поиск сайтов с похожим контентом. related:semyadro.pro Выдача покажет сайты с похожим контентом по тематике. Алгоритм не всегда показывает похожие сайты, поэтому если вы увидите результат “ничего не найдено”, не удивляйтесь.
allintitle: Поиск по тайтлам аналогичный Яндексу allintitle:поисковые запросы Выдача покажет все сайты, содержащие заданные слова в тайтле. Для написания нескольких слов необходимо использовать скобки.
allinurl: Поиск по словам в URL allinurl:operatory yandeks Гугл покажет все сайты, которые содержат указанные параметры в URL. В эпоху ЧПУ позволяет также искать конкурентов по ключевым фразам.

Языки поисковых запросов других систем

Помимо Яндекса и Google существуют другие поисковые системы, которые не теряют популярность в некоторых кругах. В целом, язык запросов других систем не сильно отличается от популярных, поэтому достаточно будет выделить основные отличия и изменения в алгоритмах.

Язык поисковых запросов Рамблер

Рамблер не может похвастаться обилием операторов, однако у него есть свои особенности при работе с ними.

Оператор Что делает Пример запроса Какая будет выдача
& или AND Альтернатива оператору + в Яндексе и Гугле ребенок & кошкаребенок AND кошка Рамблер покажет в выдаче документы, которые содержат и слово ребенок и слово кошка.
~~ Альтернатива – в поисковых системах собака ~~ кошка Выдача будет содержать документы со значением собака, но без значения кошка. Используется как – в других ПС.
OR или | То же применение, что и в других ПС кошка OR собакакошка | собака Основным отличием от других ПС является то, что оператор OR имеет меньший приоритет, чем
“ “ Аналог точной формы запроса ! совместно с “ “ “купить дом в Сочи” Учитывается порядок слов и морфология запроса. Сокращенное применение ! и “ “ в других поисковых системах. В то же время в Рамблере есть оператор ! для сохранения морфологической формы.

Операторы поисковых запросов Mail

Операторы поисковых запросов Mail схожи с остальными и у них нет каких-либо отличий. Сама поисковая система дает краткую справку на этот счет – ссылка.

В ней приведены следующие операторы, которые по функциям не отличаются от других ПС:

  • “ “ – определяет порядок слов.
  • + – ищет документы с упоминанием указанных слов.
  • site: – поиск по определённому сайту.

Выводы

Знание языка поисковых запросов тех или иных поисковых систем может значительно облегчить и ускорить поиск информации в сети. Умение расставлять необходимые операторы в зависимости от запроса поможет не только при сборе семантического ядра для сайта или кампании в Яндекс.Директ, но и для задач по SEO аналитике, проверке сайтов конкурентов.