Язык поисковых запросов яндекс реферат

Поиск нужной информации в Сети не такой легкий процесс, как может показаться на первый взгляд. Поисковые системы с каждым годом «умнеют», но пока еще читать мысли пользователей они не научились.

Например, получая запрос «наполеон», «Яндекс» не знает, что именно интересует пользователя: историческая личность и его биография, рецепт торта или вообще разновидность установки гриль. Это всего лишь одно слово, имеющее множество значений.

Чтобы на странице результатов выдачи отображались правильные сайты, необходимо уточнять свой запрос, конкретизировать его. И для этого существует язык поисковых запросов «Яндекса». О том, что это такое и как им пользоваться, мы поговорим далее.

Операторы «Яндекса»

Язык запросов Яндекс

яндекс host:
яндекс host:

Поисковый язык «Яндекса» – это набор специальных инструментов (операторов), позволяющих уточнить запрос пользователя, сделать его более конкретизированным и направленным на определенную категорию данных.

В результате в выдаче нет лишних ссылок и документов, что значительно облегчает процесс поиска нужной информации.

Все операторы делятся на две группы:

  1. Простые – представлены в виде знаков препинаний и спецсимволов.
  2. Документные (или сложные) – представлены в виде вспомогательных слов.

К простым относятся:

  • + (плюс);
  • – (минус);
  • ! (восклицательный знак);
  • “ “ (кавычки);
  • [] (квадратные скобки);
  • * (звездочка);
  • | (прямая черта).

Обратите внимание, что больше не работают следующие операторы: тильда «~», скобки «()», одинарный «&» и двойной and «&&», двойной знак меньше «<<» и двойной восклицательный знак «!!».

К документным относятся:

  • url,
  • site,
  • domain,
  • host,
  • rhost,
  • mime,
  • lang,
  • date.

К документным операторам в конце всегда добавляется двоеточие («url:», «site:», «domain:» и т. д.), после чего указывается его значение.

На сегодняшний день это все работающие «помощники». Далее мы рассмотрим каждый из них более детально: какое значение имеют, как влияют на выдачу и как их применять.

+ (плюс)

Чтобы поисковая система искала только те страницы, которые обязательно содержат то или иное ключевое слово (предлог), необходимо поставить перед ним знак +. В одном запросе может быть использовано сразу несколько плюсов.

Остальные (неотмеченные) слова не всегда будут содержаться на страницах в выдаче.

Примеры:

  • как найти объем тетраэдра +по +координатам +вершин;
  • синдром +педжета-шреттера.

Поиск по страницам с ключевым словом (+)

Поиск по страницам с ключевым словом
Поиск по страницам с ключевым словом

– (минус)

В синтаксисе поисковых запросов «Яндекса» есть и знак исключения – минус. То есть вместо того, чтобы отметить интересующее слово, пользователь может отметить то, что его не интересует. Следовательно, поисковик будет исключать сайты с указанным ключевиком.

Вернемся к самому первому примеру данной статьи – к наполеону. Допустим, нас интересует именно рецепт торта. Чтобы исключить из выдачи все лишнее, достаточно дописать два слова со знаком минус:

  • наполеон -бонапарт -гриль.

Исключение сайтов с указанным ключевым словом (-)

Исключать сайты с указанным ключевиком
Исключать сайты с указанным ключевиком

В результате мы увидим только рецепты торта, хотя само слово «торт» не было употреблено.

Вот еще пара примеров применения данного оператора:

  • купить акустику -sven –microlab;
  • новости криптовалюты -биткоин.

! (восклицательный знак)

По умолчанию поисковая система ищет совпадения в любой морфологической форме (падеж, род, число, склонение и т. д.). Чтобы этого не происходило и словоформа сохранялась в заданном виде, необходимо поставить восклицательный знак перед словом.

Например:

  • девушка +в !белом !платье;
  • ТОП !краудфандинговых !бирж.

Поиск по определенной форме слова (!)

Поиск по определенной словоформе
Поиск по определенной словоформе

“ “ (кавычки)

Кавычки применяются тогда, когда необходимо найти точное совпадение фразы. Зачастую используются для поиска первоисточника по отрывку текста.

Например:

  • “Базаров поморщился. В маленькой и невзрачной фигурке эманципированной женщины не было ничего безобразного”;
  • “первая причина развития хронического бронхита”.

Точное совпадение ключевой фразы (кавычки)

Точное совпадение фразы
Точное совпадение фразы

[ ] (квадратные скобки)

Данный оператор языка поисковых запросов «Яндекса» позволяет сохранить порядок слов. То есть в результатах будут показаны только те площадки, где ключевые слова употреблены в точно таком же порядке.

Наиболее часто используется в географических запросах, где важно зафиксировать направление. Например, поиск билетов в одну сторону, но не в другую:

  • купить билеты [Москва Питер];
  • билеты на поезд [Воронеж Москва].

Сохранение порядка слов (квадратные скобки)

Сохранить порядок слов
Сохранить порядок слов

* (звездочка)

Наличие звездочки в запросе свидетельствует о пропущенном слове, которое необходимо найти поисковику. Если пользователь не помнит часть цитаты, он может заменить ее звездочкой (сколько пропущено слов столько и символов *).

Важно! Применяется только в сочетании с кавычками.

Примеры:

  • “лучше * в руках чем * в небе”;
  • “небоскреб бурдж-халифа высота * метров”.

Найти пропущенное слово (*)

Пропущенное слово
Пропущенное слово

| (прямая черта)

Прямая черта эквивалентна союзу «или». Она применяется, когда необходимо найти совпадения хотя бы по одному из перечисленных ключевых слов.

Например:

  • iphone 8 | iphone 8s | iphone 8plus;
  • кино | фильмы | сериалы.

Найти совпадения по одному из перечисленных ключевых слов (| – “или”)

Найти совпадения по одному из перечисленных ключевых слов
Найти совпадения по одному из перечисленных ключевых слов

Таким образом, если на сайте содержится хотя бы один из ключей, он попадет в выдачу.

url

Данный документный оператор позволяет осуществить поиск среди страниц, которые имеют указанный URL-адрес. Часть адреса при этом можно заменить символом *, что означает, что эта часть может изменяться.

То есть мы даем прямую подсказку «Яндексу», где именно нужно искать.

Например:

  • математический анализ url:ru.wikipedia.org/wiki/*;
  • смарт-ссылки url:rookee.ru/learn/*.

Оператор “URL” – поиск среди страниц, имеющих указанный адрес

Оператор "URL"
Оператор “URL”

site

Данный оператор аналогичен предыдущему, только поиск будет осуществляться не в определенном разделе, а по всему сайту (включая все поддомены и веб-страницы).

Допустим, у нас есть любимый ресурс, и мы хотим в первую очередь поискать информацию на нем. Тогда пишем:

  • site:econet.ru рецепт фондю из сыра;
  • как заключить договор купли-продажи авто site:ru.wikihow.com.

domain

Позволяет отфильтровать выдачу по доменной зоне веб-страниц.

То есть если, допустим, вам необходимо найти информацию на сайтах с доменом .ru, пишите «domain:ru». Ресурсы, заканчивающиеся на .com, .ua, .net и др. показаны не будут.

Примеры:

  • как прошли выборы в Украине 2019 domain:ua;
  • МГУ факультеты и специальности domain:edu.

Оператор “domain” – фильтр страниц по доменной зоне

Оператор "domain"
Оператор “domain”

host (rhost)

Два аналогичных по значению оператора – «host:» и «rhost:» – позволяют искать информацию на страницах, размещенных на указанном хосте.

Результат идентичен «url:», если задано имя хоста. Также можно дополнительно использовать *.

«host:» – запись осуществляется от домена нижнего уровня к домену верхнего уровня. Например:

  • поисковая система host:www.google.*;
  • поисковое продвижение host:rookee.ru.

«rhost:» – запись от домена верхнего уровня к нижнему. Например:

  • сервис яндекса rhost:ru.yandex.*;
  • новости rhost:com.livejournal.*.

mime

Язык запросов «Яндекса» также позволяет фильтровать выдачу по формату найденных документов (doc, pdf, rtf и др.). Делается это с помощью оператора «mime:». Достаточно добавить его к запросу и указать требуемый формат. Всё несоответствующее показано не будет.

Например:

  • планировка студии mime:pdf;
  • инфляция в россии 2018 mime:doc.

Оператор “mime” позволяет фильтровать выдачу по формату файлов

Оператор "mime"
Оператор “mime”

lang

Если необходимо найти сайты на определенном языке, данный «помощник» позволит это сделать. Сегодня «Яндекс» поддерживает следующие языки: ru (русский), uk (украинский), kk (казахский), be (белорусский), tt (татарский), en (английский), de (немецкий), fr (французский), tr (турецкий).

Примеры использования:

  • mobile-first index lang:en;
  • трудовой кодекс рф 2019 lang:ru.

Оператор “lang” поиск сайтов на определенном языке

Оператор "lang"
Оператор “lang”

date

Оператор «date:» позволяет отфильтровать выдачу в соответствии с указанной датой. Причем искать можно материалы, опубликованные как в конкретный день/месяц/год, так и за определенный интервал времени:

  • date:ГГГГММДД – в указанный день;
  • date:ГГГГММ* – месяц;
  • date:ГГГГ* – год;
  • date:ГГГГММДД..ГГГГММДД – в промежутке;
  • date:>ГГГГММДД – после (или до) указанной даты (можно использовать: >, >=, <, <=).

Например:

  • новости date:20190401..20190420;
  • топ сервисы для покупки ссылок date:>20190101.

Язык поисковых запросов «Яндекса» – это большой перечень различных «помощников», у каждого из которых есть свое предназначение. Возможно, некоторые из них вам никогда не пригодятся, но если хотя бы один упростит вам процесс поиска информации в Сети, эта статья была написана не зря.

Используйте вышеописанные операторы в своей работе. Не забывайте также и о других полезных инструментах «Яндекса»: расширенный поиск (настройка фильтров для лучшего результата), персональный поиск (когда система запоминает предпочтения авторизованных пользователей), поисковые подсказки и др.

Содержание:

Введение

Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети Интернет.

Всемирная сеть очень важна и полезна почти для всех! Любой пользователь Интернета может отыскать в нем много разной и интересной информации, а также использовать все широкие возможности сети. Для меня главными обстоятельствами в выборе темы «Анализ поисковых систем в сети Интернет», для моей курсовой работы, стали актуальность темы на сегодняшний день, а также достаточная открытость и известность мне этой темы, так как я часто пользуюсь всемирными сетями.

Ресурсы Интернета уже давно не просто игрушка, превратившаяся в незаменимый инструмент для каждодневной работы людей различных профессий. Количество данных в сети стремительно растет, и пропорционально им растет и объем. Ученые утверждают, что объем информации, передаваемой по Интернету, увеличивается в два раза каждые шесть месяцев.

В сети каждый день появляются множество новых документов, и что бы быстро и качественно находить нужную информацию появились специальные поисковые средства. Несколько лет назад говорили: в Интернете ничего невозможно найти, но там есть всё. Но когда появились поисковые программы, ситуация в корне поменялась, и сейчас в интернете информацию которая вам нужна, можно найти практически мгновенно.

Наиболее популярным способом поиска в Интернете является использование поисковых систем. Что же такое поисковая система? Поисковая система – портал, осуществляющий поиск, сбор и сортировку информации в сети Интернет. Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.

В данной курсовой работе рассматривается поиск информации во Всемирной паутине с помощью нескольких наиболее распространённых систем поиска (Рамблер, Яндекс и т.д.). Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от ваших личных пристрастий.

Глава 1. Теоретическая часть

1.1 Особенности поисковых систем

Поисковая система – это сайт, к которому пользователь обращается посредствам ключевого слова и находит интересующую его информацию. Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.

По пространственному масштабу поисковую систему можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные поисковые системы описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное – по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

Поисковой процесс представляет собой четыре этапа: формулировка (до начала поиска), действие (идет поиск), обзор результатов (выводится на экран), и усовершенствование (возвращаемся к поиску с той же потребностью, но уже иной формулировкой). Более удобная схема поиска состоит из следующих этапов:

  • Задание информационной потребности на естественном языке;
  • Выбор поисковых сервисов и точная запись информационной потребности;
  • Выполнение созданных запросов;
  • Предварительная обработка полученных ссылок на документы;
  • Обращение за искомыми документами;
  • Предварительный просмотр найденных документов;
  • Сохранение подходящих документов для изучения;
  • Извлечение из подходящих документов ссылок для расширения запроса;
  • Изучение всех сохраненных документов;
  • Если искомая информация не найдена, то возвращаемся к первому пункту.

1.2 Методы поискового запроса

Процесс поиска довольно прост: задавая ключевые слова, характерные для искомой информации, пользователь надеется максимально просто и быстро найти интересующую его информацию. Это значит, что поисковая система должна думать точно также как думает пользователь, когда ищет ту или иную информацию. Разработчики поисковых систем постоянно стараются совершенствовать алгоритмы и принципы поиска, пытаются всячески ускорить работу системы, добавляя новые функции и возможности, чтобы удовлетворить потребности пользователей.

Поисковая система состоит из поисковой машины, базы данных или индекса и точек входа в систему. Поисковая машина – это аппаратно-программный комплекс, который осуществляет быстрый поиск внутри сервера или Интернет-ресурса необходимой информации.

Поисковая машина состоит из:

  • паук или спайдер (spider) приложение, которое занимается скачиванием страниц интернет ресурсов.
  • индексатор (indexer). Индексатор производит первоначальный анализ содержимого скачанной страницы, выделяет основные части (название страницы, описание, ссылки, заголовки и т.д.) и раскладывает все это по разделам поисковой базы данных – помещает в индекс поисковой системы. На основе результатов первоначального анализа индексатор также может принять решение, что страница вообще “недостойна” находиться в индексе. Причины такого решение могут быть разными: страница не имеет названия, является точной копией другой, уже имеющейся в индексе страницы или содержит ссылки на запрещенные законодательством ресурсы.
  • краулер (crawler) программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета с целью занесения информации о них в базу данных поисковика. Краулер анализирует пути, ведущие с текущей страницы на другие разделы сайта, или на страницы внешних интернет ресурсов и определяет дальнейший порядок обхода пауком нитей всемирной паутины. Именно краулер находит новые для поисковой машины страницы и передает их пауку. Работа краулера построена на базе алгоритмов поиска на графах в ширину и глубину.
  • подсистема обработки и выдачи результатов (Search Engine and Results Engine ) самая важная часть любой поисковой машины. Алгоритмы работы этой подсистемы компании разработчики хранят в строгой секретности, поскольку они являют собой коммерческую тайну. Именно эта часть поисковой машины отвечает за адекватность ответа поисковой системы на запрос пользователя.

Вне зависимости от того, какой поисковой системой вы пользуетесь, примерный алгоритм поиска информации следующий:

  • Вы переходите на начальную страницу поисковой системы или на любую страницу, на которой находятся поля для ввода запроса и кнопка для начала поиска. В последнем случае после нажатия кнопки вы автоматически перейдёте на страницу поисковой системы. Отличий между собственно поисковой системой и страницей с полями для ввода запроса, который передаётся поисковой системе, нет. Главное – перейти на страницу, на которой вы можете ввести ваш запрос;
  • Если система позволяет последовательные уточнения области поиска, то вы переходите в разделы, определяющие границы поиска информации (например, поиск только в области науки или поиск среди европейских узлов Интернета). В таких системах, запрос в главном разделе, осуществляет поиск среди всех узлов Интернета. Если же вы, например, перейдёте в раздел «Новости», то поиск по запросу будет выполняться только среди узлов, посвящённых новостям. Таким образом, вы сначала определяете границы поиска, после этого отправляется запрос на поиск информации. Если выбранная вами система поиска не позволяет уточнить запрос, то это действие пропускается;
  • Вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. В простейшем случае это одно или несколько слов, например «Анекдоты», но возможны и сложные запросы с логическими операциями «И», «ИЛИ», «НЕТ»;
  • Если система поиска позволяет, то уточняются некоторые параметры запроса с помощью дополнительных полей, списков, флажков и переключателей, которые могут находиться на странице рядом с полем запроса. В большинстве случаев уточнение параметров не требуется. Составление сложных запросов чем-то похоже на программирование и пользуется популярностью у программистов, людей, не знакомых с программированием;
  • Нажимается кнопка для начала поиска. После некоторой паузы вы автоматически попадаете на страницу со списком документов, удовлетворяющих вашему запросу. Длительность паузы зависит от сложности запроса, скорости работы поисковой системы и качества вашей связи с данной системой;
  • Если ссылок много, и они не помещаются на одной странице, то после прочтения первой страницы с результатами поиска вы можете перейти к следующей, и так далее. Таким образом, вы просматриваете все найденные ссылки на документы;
  • После нахождения нужной ссылки вы щёлкаете на ней мышью и переходите на страницу, которую вы разыскивали. Если вы захотите посмотреть другие найденные страницы, то можно вернуться назад, к странице со ссылками на найденные документы, и перейти по другой ссылке.

Когда говорят о поисковых запросах, то часто упоминают слово «релевантность». Слово релевантность означает степень соответствия документа запросу. Чем больше релевантность, тем лучше результаты поиска. Релевантность определяется по следующим критериям:

  1. Проверяется, сколько раз заданное словосочетание (слово) встречается на отображенных страницах;
  2. Если введена фраза, то проверяется расстояние между словами;
  3. Индекс цитируемости (количество ссылок на данную страницу);
  4. Чем больше на страницу ссылаются, тем больше вероятность, что именно эта страница нужна пользователю;
  5. Каким стилем (шрифтом) написана на странице искомая фраза;
  6. Если фраза выделена жирным или написана крупным шрифтом; (заголовок), то это признак более высокой релевантности страницы;
  7. Возраст сайта (Чем старше сайт, тем лучше это влияет на релевантность).

Таким образом, можно отметить, что уровень релевантности – это целый комплекс параметров.

Итак, для того чтобы найти интересующую вас информацию в кротчайшие время, вам необходимо правильно составлять поисковой запрос.

Наиболее эффективным является следующий метод составления поискового запроса:

  1. Слова поискового запроса нужно писать грамотно. Так, например, запрос «пошив пальтов» нужного результата не даст;
  2. Если поиск нужных результатов не принес, нужно переформулировать запрос с помощью синонимов;
  3. Если результат поиска не удовлетворяет вас, то попробуйте включить в запрос уточняющие слова. Для запроса «стихи Пушкина» слово «стихи» является уточняющим;
  4. В сложных случаях нужно использовать язык запросов. С помощью языка запросов можно задавать комбинации разных критериев поиска.

1.3 Поисковая система Yandex

Подробнее рассмотрим язык запросов поисковой системы Yandex. Предположим, что нам нужно найти адрес проживания Мартиросяна С.Т. Если правильно сформулировать поисковой запрос, то это не составит нам труда. В языке запросов есть такая функция, как включение/ исключение определенных слов – знаки «+» и «-».

Попробуем сформулировать поисковой запрос. Для этого используем фамилию человека и пару уточняющих слов. В качестве уточняющего слова возьмем «адрес» и дату рождения человека. Получим:

Рис.1

Как видно на рисунке 1 нашлось 7 страниц, но с помощью языка запросов можно сократить их число до 1 страницы. Применим специальный символ «+» к уточняющим словам – это означает, что будут найдены те страницы, на которых в обязательном порядке присутствуют уточняющие слова. Получим:

Рис.2

На рисунке 2 видно, что мы нашли 1 страницу, без лишнего мусора. Этот поисковый запрос сформулирован правильно. Еще одним важным символом языка запросов является знак «|». Вертикальная черта позволяет задать альтернативы – система ищет хотя бы одно из перечисленных слов. Например запрос: «Физика лекции | конспекты» будет аналогичен как запросам «Физика лекции» и «Физика конспекты».

Обычно поисковики ищут все формы введенного слова. Например по запросу «Звукоизолирующая» будут выведены страницы со словом «звукоизолирующий» , «Звукоизолирующих» и т.д. Рисунок 3.

Рис. 3

Но чтобы найти именно ту форму слова, которая задана в поисковой строке, в языке запросов предусмотрен символ «!». Применение этого символа видно на рисунке 4.

Рис. 4

Если вам нужно найти точную фразу, то следует её заключать в кавычки: «»

В случае, когда вы хотите найти все варианты фразы: «очень (любое слово) девушка». То нужно поставить запрос так «очень /+2 девушка» , причем 1 – это означает отсутствие слова, а 3 означает, что между «очень» и «девушка» будут два любых слова:

Рис.5

На рисунке 5 видно, как между словами «очень» и «девушка» вставлено «любое слово».

Следует отметить, что при выполнении запроса поисковая система не ищет документ непосредственно в Интернете. Она обращается к своей базе данных, где в компактном виде собраны данные об информации в Интернете. Возможно, что реальное состояние Интернета несколько отличается оттого, что храниться в базе данных.

Поисковые системы постоянно пополняют и обновляют свои базы данных, чтобы минимизировать такое несовпадение. Существует способ пополнения информации в базы данных поисковых машин: Разработчик Web-страницы самостоятельно добавляет ссылку на неё в поисковую систему. Большинство систем позволяют это сделать совершенно бесплатно. Специальная программа, называемая роботом, находит ссылку на новую страницу во Всемирной паутине. Роботы запускаются поисковой системой, чтобы проверить, существуют ли ранее найденные документы и не появились ли новые.

Глава 2. Практическая часть.

2.1. Поиск с помощью Alta Vista

Поисковая система Alta Vista была открыта для свободного использования в конце 1995 года. Это система до сих пор является достаточно популярной, хотя в последнее время другие системы составляют ей значительную конкуренцию. Система обеспечивает поиск как во Всемирной паутине, так и в группах новостей. После ввода ключевых слов вы получаете информацию о количестве найденных документов и их краткие описания со ссылками на информацию в Интернете. Расширенный поиск позволяет использовать логические операторы для формирования сложных запросов. Рассмотрим возможности системы Alta Vista на конкретных примерах.

Рис.2.1 Начальная страница системы Alta Vista

На начальной странице (Рис.2.1) кроме поля для ввода запроса расположен открывающийся список. С его помощью можно выбрать интересующий вас язык искомого документа: any languache (Любой язык), Russian (Русский) или любой другой язык. По умолчанию ищется информация на любом языке. Выше поля ввода расположены несколько ярлычков, щелчком на которых можно выбрать область поиска: Web (Паутина) – во Всемирной паутине,  News (Новости) – в группах новостей и так далее.

Зададим несколько простых вопросов для поиска информации, чтобы продолжить знакомство с возможностями системы Alta Vista. Для поиска документов, содержащих некоторое слово, надо ввести это слово, а для поиска документов, содержащих искомое словосочетание, необходимо заключить несколько слов в двойные кавычки. Если слово содержит только строчные буквы, то ему сопоставляются также и слова, содержащие заглавные буквы.

Например, слову интернет будет поставлено в соответствие интернет, Интернет и ИНТЕРНЕТ. То есть, чтобы найти слово, написанное, как большими, так и маленькими буквами, надо в запросе использовать только маленькие буквы (строчные).

Наличие заглавных букв в слове, заданном в запросе, конкретизирует поиск. В результате поиска будет найдено точно такое слово с учётом регистра. Например, на запрос интерНЕТ будет найдено только слово интерНЕТ, если оно, конечно, имеется в базе данных. Слова же интернет, Интернет  и  ИНТЕРНЕТ по такому запросу найдены не будут.

В системе Alta Vista можно задавать только часть слова, используя для этого знак *.  Использование этого знака похоже на его использование в шаблонах файлов. Вместо переменной части слова ставится данный знак, например: на запрос интернет* будет найдены слова интернет, Интернета,  ИНТЕРНЕТОМ, и тому подобные. Данную возможность удобно использовать для поиска однокоренных слов.

Другой удобной возможностью является использование в запросах знаков + и -. Добавив такой знак перед словом или фразой, вы требуете обязательное их присутствие или отсутствие в документе. Если вы ставите знак + перед словом, то этим вы указываете, что данное слово обязательно должно присутствовать в найденном документе. Символ – указывает на то, что следующее за ним слово не должно присутствовать. Например: запрос +интернет* – интернет выдаст вам только склонения слова Интернет, но не само слово. Мы указали с помощью +интернет*, что в искомом документе должны быть все слова, начинающиеся с «интернет». С помощью же  -интернет мы задаём, что само слово «интернет» не должно присутствовать.

Ещё одним удобным способом уточнения поиска является использование специальных ключевых слов. Существуют различные ключевые слова, мы рассмотрим только два наиболее полезных слова. Ключевое слово link: позволяет ограничить поиск среди страниц, на которых расположены ссылки на заданную страницу. Например, для поиска страниц со ссылками на узел Microsoft, необходимо в качестве запроса ввести  link:www.microsoft.com.  Ключевое слово url: позволяет искать среди страниц, в адресе которых существует заданная в качестве аргумента часть. Если вы хотите найти все страницы, в адресе которых есть название фирмы Intel, то следует ввести запрос url:intel. Эти ключевые слова можно использовать вместе. Например, если мы хотим найти все страницы Российской части Интернета, на которых имеются ссылки на систему Alta Vista, следует в качестве запроса указать link:altavista.digital.com url:ru.

В подавляющем большинстве случаев вы сможете найти необходимую информацию с помощью простых запросов, но иногда могут потребоваться и более сложные. Система Alta Vista позволяет формировать запросы с использованием логических операций. Они называются сложными, или расширенными.

Для построения сложного запроса используются логические операторы и синтаксические выражения. Попытаемся пояснить, что это такое.

Синтаксические выражения – это любые слова и словосочетания, аналогичные рассмотренные в простых запросах. Логические операторы служат для выполнения операций «И», «ИЛИ», «НЕТ» и «ОКОЛО» над синтаксическими выражениями. Часто синтаксические выражения, над которыми производятся логические операции, называются аргументами. В синтаксических выражениях вы также можете использовать отдельные слова или фразы, заключая несколько слов в двойные кавычки. Правила использования заглавных и прописных букв в сложных запросах так же не отличаются от данных правил в простых запросах.

Главное, что отличает сложный запрос – это использование логических операторов и круглых скобок. С помощью операторов и скобок вы создаёте из отдельных синтаксических выражений необходимый запрос.

Рассмотрим несколько примеров. Перед примерами перечислим допустимые в расширенных запросах логические операторы:

  • Оператор AND для логической операции «И». Оператор гарантирует, что в документе присутствуют оба документа.
  • Оператор OR для логической операции «ИЛИ». Оператор гарантирует, что в документе присутствует хотя бы один из аргументов.
  • Оператор NEAR для операции «ОКОЛО». Данный оператор гарантирует, что аргументы стоят друг от друга в тексте не дальше, чем на десять символов.
  • Оператор NOT для логической операции отрицания, то есть для операции «НЕТ». Этот оператор гарантирует, что аргумент не присутствует в документе.

Чтобы в найденном документе отсутствовало какое-либо слово, надо перед ним в запросе поставить оператор отрицания. Полезно для удобства чтения запроса выделить слово с отрицанием круглыми скобками: (NOT описание).

Для задания одновременного присутствия в искомом документе сразу нескольких слов или словосочетаний используется логический оператор «и».

Например, если вы хотите, чтобы в документе было слово «провайдер» и словосочетание «очень дёшево», то следует в запросе указать провайдер AND «очень дёшево». В качестве аргумента можно использовать не только слова и словосочетания, но и логические выражения, например по запросу интернет AND (NOT описание) будут найдены документы, в которых имеется слово «интернет» и нет слова «описание». В простом запросе для этого мы использовали бы +интернет-описание. Если вы хотите, чтобы в искомом документе находилось хотя бы одно из нужных слов, то следует воспользоваться логической операцией «ИЛИ». Например, запрос телевизор OR радио ORвидео найдёт документы, в которых есть хотя бы одно из перечисленных слов.

Более сложный запрос «дешевый доступ в Интернет» OR  (провайдер END  «очень дёшево»)  задаст поиск документов, в которых есть словосочетание «дешевый доступ в Интернет» или встречаются одновременно слова «провайдер» и «очень дёшево».

Операция «ОКОЛО» не является классической логической операцией. С её помощью можно задать, то, чтобы слова находились рядом друг с другом. Например, провайдер AND «очень дёшево» указывает, что данные слова просто присутствуют, однако они могут располагаться в разных концах документа. Запрос же провайдер NEAR «очень дёшево» описывает, что слово «провайдер» и словосочетание «очень дёшево» должны находится друг от друга недалеко, то есть между ними не должно находиться более десяти слов.

С помощью логических операций можно создавать достаточно сложные запросы, например:

((провайдер* NEAR московск*) OR ((NOT описание) AND интернет*)) AND  «очень дёшево». Разберём этот запрос по частям. Выражение  (провайдер* NEAR московск*) описывает, что в искомом документе должно быть слово, начинающееся с «провайдер», то есть «провайдер», «провайдера», «провайдеру» и тому подобное, причём это слово должно находиться рядом со словом, которое начинается с «московск». Этим мы ограничиваем поиск московскими провайдерами. В других скобках выражении  ((NOT описание) AND интернет*) описывает, что в документе должно быть слово, начинающееся с «интернет», и недолжно присутствовать слово «описание». Рассмотренные два выражения соединяются логическим

оператором OR, то есть мы ищем документ, в котором или описываются московские провайдеры, или имеется информация об Интернете, которая не является описанием. Такой поиск осуществляется по запросу   ((провайдер* NEAR московск*) OR ((NOTописание) AND интернет*)). В нашем же запросе ещё присутствует последняя часть AND «очень дёшево». С её помощью мы задаём, что в дополнение к предыдущим условиям, необходимо, что бы в найденном документе присутствовало словосочетание «очень дёшево». Таким образом мы сформировали достаточно сложный запрос, хотя, скорее всего, по нему вы не найдёте не одного документа.

Пример: зададим более простой запрос. С помощью части запроса (интернет* OR internet) мы описываем русское название Интернета в любых склонениях или его английское название. Что бы искать провайдеров Интернета, мы описываем, что рядом со словом «Интернет», в любом виде, должно находиться слово «провайдер». Теперь наш запрос выглядит так: (провайдер NEAR (интернет* OR internet)). По нему мы найдём информацию о провайдерах Интернета. Если же мы хотим ограничить информацию только московскими провайдерами, то следует в запрос добавить AND моск*. Этим мы описываем, что в документе обязательно должно присутствовать слово, начинающееся с «моск*». В итоге мы получили запрос (провайдер NEAR(интернет* OR internet)) AND моск*.

В этом примере я искал русские слова в Интернете. Для этого можно воспользоваться системой Alta Vista, но более удобно использовать русские поисковые системы. Если же вы хотите найти зарубежную информацию, система Alta Vista становится просто незаменимой.

Здесь я подробно описал поисковую систему Alta Vista по двум причинам. Во-первых, она является крупнейшей в мире, и вам наверняка придётся воспользоваться её услугами. Кроме того, построение запросов в ней аналогично построению запросов для других систем поиска.

2.2. Использование системы Yahoo

Принципиальное отличие поисковой системы Yahoo (Яхо) от других систем в том, что вы можете найти необходимую вам информацию без использования запросов, а просто переходя по ссылкам разделов встроенного справочника и последовательно уточняя область ваших интересов. Yahoo является самой популярной системой в США, так как не требует специальной подготовки для поиска информации. Не надо знать правила формирования запросов, достаточно просто переходить по ссылкам в нужные разделы. Однако для русскоязычных пользователей эта система не слишком удобна, так как разбиение на разделы проводилась с учётом американской специфики. Кроме того, в справочнике Yahoo содержится намного меньше ссылок на русскоязычные документы, чем в базе данных Alta Vista. Однако для поиска информации по конкретной тематике данная система может оказаться достаточно полезной.

Заглавная страничка Yahoo! (Рис.2.2.) грузится очень быстро – хотя на ней очень много ссылок, но все они текстовые. При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу “Intelligent default”, то есть Yahoo! ищет наиболее подходящие результаты в таких областях: в категориях Yahoo, в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях.

Рис. 2.2 Начальная страница поисковой системы Yahoo

При задании критериев поиска для Yahoo! нужно помнить, что Yahoo! ищет эти слова только в названии и описании страницы, поскольку полнотекстового индекса на Yahoo! нет. Поэтому не следует указывать при поиске слишком много терминов или синонимов – количество результатов с Yahoo! снизится или даже будет нулевым.

Поиск в системе Yahoo реализован с использованием Alta Vista. Все описанные выше приёмы, которые мы применяли при работе с Alta Vista, применимы и к Yahoo. Таким образом, вы можете использовать поиск в Yahoo совершенно так же, как и в системе Alta Vista.

Систему Yahoo удобно использовать для поиска спортивных событий, новостей, прогнозов погоды, развлечений и тому подобной информации. Это обусловлено особенностями разбиения информации на разделы в данной системе. Если вам удобнее не составлять запрос, а выполнять последовательные уточнения, то эта система вас должна устроить.

Поисковая система Google

Рис. 2.3 Начальная страница поисковой системы Google

За почти 20 лет существования корпорации Google, он приобрел статус крупнейшей поисковой системой в мировом масштабе.

Google (Рис 2.3.) осуществляет поиск по документам на более чем 35 языках, в том числе русском. В настоящее время многие порталы и специализированные сайты предоставляют услуги поиска информации в Интернете на базе Google, что делает задачу успешного позиционирования сайтов в Google еще более важной.

Поисковая система Google выглядит стабильнее своих конкурентов в плане смены алгоритма и апдейтов. Информация, только что размещенная на сайте, может в считанные минуты попасть в основную выдачу. Поисковые роботы Google в три раза быстрее, чем роботы других поисковых систем.

Google первым применил новую технологию поиска и выдачи результатов – релевантность интернет-страниц – то, что не лежит на данной конкретной странице, но тем ни менее влияет на ранг ее выдачи. Поисковая система Google учитывает гипертекстовую структуру Интернета, и какие страницы на какие ссылаются. Google сама определяет релевантность интернет-страниц Страница, на которую ссылаются чаще, более релевантна и значит более популярна.

Особенность Google заключается в том, как и по какому критерию эта поисковая система классифицирует результаты поиска на своей странице. Используемый алгоритм PageRank сортирует все веб-страницы по критерию смыслового соответствия.
Алгоритм PageRank зависит от нескольких факторов:

  • От частоты повторения и местоположения ключевых слов на веб-странице – если искомое слово или фраза только один раз встречается на сайте, то страница получает низкий бал.
  • От времени существования страницы – каждый день в Интернете появляются новые сайты, но не многие задерживаются надолго. Поэтому преимущество отдается уже зарекомендовавшим себя сайтам, существующим долгое время.
  • От количества веб-станиц, связанных с «главной страницей» – Google «смотрит» на количество веб-страниц, относящихся к определенному сайту и определяет ее рейтинг среди всех остальных. 

Помимо просто поиска, здесь можно сравнивать цены на товары в интернет-магазинах, читать новости и многое другое. Есть и служба блокировки назойливой интернет-рекламы

2.3 Поисковая система Rambler

Рамблер — одна из первых поисковых систем российского интернет-пространства. Несмотря на свой солидный «возраст», конкуренции с сильными соперниками она не выдерживает, сегодня система охватывает только 0,4% поиска. ( Рис 2.4.)

Рис. 2.4 Начальная страница поисковой системы Rambler

Название «Рамблер» как нельзя лучше отражает суть деятельности компании («rambler» – по-англ. «бродяга»). Rambler позволяет искать документы на английском, русском, украинском и многих других языках, а при формировании списка к выдаче учитываются не только ключевые запросы, но и их разнообразные словоформы. Полученные в результате поиска данные структурируются по степени соответствия запросу (релевантности) и распределяются по сайтам. 
В июне 2003 года компания запустила новую версию поисковой машины, которая отличается от предыдущей по двум основным параметрам. Первое и главное – значительно увеличилась скорость поиска; второе, благодаря новой архитектуре системы, обновление поискового индекса происходит несколько раз в день.

Теперь поисковик всегда находит самые свежие документы и последние новости. Рамблер знаком с русским языком, понимает термины типа «б/у», «у.е.» и «а/я». Как дань моде, открылась лаконичная версия поисковой системы по адресу «r0.ru». Содержание ее стандартно – строка поиска, почта и новости.

Еще одна особенность поисковика Rambler, это механизм ассоциаций. Помимо стандартной ответной страницы, в которой найденные документы расположены в порядке убывания релевантности, появляется строка – «У нас также ищут». В ней приведены слова и словосочетания, тематически связанные с запросом. Новый механизм также исправляет ошибки запросов. На введенное gjujlf пользователь получит теперь положительный результат: сведения о погоде (gjujlf – это слово «погода» набранное латиницей).

Необходимо отметить проекты Rambler-Группы и Rambler-Фото. Оба этих проекта предоставляют пользователям сети возможность использования заложенных в проекты программных алгоритмах в собственных целях. Проект Rambler-Группы дает людям возможность начинать обсуждения самых разных тем, которые существуют не только в виде форумов, но также и в виде открытых списков рассылки. Проект Rambler-Фото представляет пользователям сети возможность создания фотоальбомов в объеме до 20 мегабайт, причем это дисковое пространство зарегистрированные пользователи поисковой системы Rambler получают в дополнение к тем мегабайтам почты, на которые они могут претендовать по новым условиям e-mail обслуживания (15 мегабайт).

Rambler Mass Media – первый и по-прежнему лидирующий на рынке информационный дайджест. Помимо текстовых материалов и фоторепортажей, ставших визитной карточкой проекта, Rambler Mass Media представляет пользователям аудио и видеосюжеты. В числе поставщиков – ВГТРК и BBC, Deutsche Welle, радио “Маяк” и др. Заголовки важнейших новостей размещаются на первой странице портала Rambler.ru и в блоке “Главные новости дня” на главной странице Rambler Mass Media. Наиболее актуальные новости могут читать и посетители других сервисов Рамблера – Рамблер Почты, Погоды на Рамблере.

2.4 Поисковая система Aport 

Поисковая система Апорт (Рис 2.5.) на сегодняшний день находится на 16 месте по популярности поисковых машин Рунета. Данная система осуществляет полнотекстовый поиск документов c учетом морфологии русского языка в поисковых запросах.

Рис. 2.5 Начальная страница поисковой системы Aport

К важным свойствам первой версии поисковой системы Апорт можно отнести перевод запроса и ответа на английский язык и обратно. Второе свойство – реконструкция проиндексированных страниц из собственной базы. Это дает возможность просмотра уже несуществующих страниц.

www.aport.ru – первым из поисковых систем Рунета реализовал базовые технологии Google. “Page rank” – характеристика популярности ресурса по формуле “обратных ссылок”: ссылки с других сайтов на данный ресурс. Причем учитывается не только количество, но и важность ссылок. В поисковой системе Aport впервые была реализована возможность поиска по новостным лентам.

В настоящее время возможности поисковой системы “Апорт” не так обширны, но все-таки значительны. На официальном сайте поисковика можно найти каталог, охватывающий добрую часть русскоязычных Интернет-ресурсов, с удобным рубрикатором и системой выдачи.

Также, на “Апорт” представлена актуальная информация различного рода: это и программа телевидения, и новости, и прогноз погоды, и котировки валют.

Особый блок сервисов поисковика составляют почта, справочная информация (в разделе “Словари”) и поиск объекта по адресу (для Москвы, Санкт-Петербурга, а также для федеральных округов РФ: Дальневосточного, Приволжского, Северо-Западного, Сибирского, Уральского, Центрального и Южного).

С помощью “Доски объявлений” от “Апорт” можно приобрести, продать, подарить или принять в дар все, что угодно: от котят до земельных участков. Данный сервис предлагает еще и поиск работы, однако найти здесь настоящие вакансии среди сомнительных объявлений довольно сложно.

2.5 Поисковая система Яндекс

На сегодняшний день Yandex ( Рис 2.6.) это одна из самых востребованных поисковых систем в Рунете. Поиск позволяет искать документы на русском, татарском, украинском, белорусском, казахском, английском, немецком и французском языках с учётом морфологии этих языков и близости слов в предложении.

Рис. 2.6 Начальная страница поисковой системы Yandex

Поисковый запрос от пользователя, после анализа загруженности поисковой системы, отправляется на наименее загруженный сервер. Для обеспечения такой возможности сервера Яндекса объединены в кластеры, и даже кластеры кластеров. Затем пользовательский запрос обрабатывается программой под названием «Метапоиск». Метапоиск осуществляет анализ запроса в реальном времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. д. Также, программа определяет, относится ли запрос к категории наиболее популярных или недавно заданных. Выдача на такие запросы некоторое время хранится в памяти (кэше) метапоиска, и в случае совпадения показываются заранее сохранённые результаты. Если запрос является редким и совпадений в кэше не найдено, система перенаправляет его на программу «Базового поиска». Тот анализирует индекс системы, также разбитый по разным дублирующимся серверам (это укоряет процедуру). Затем полученная информация снова попадает на метапоиск, данные ранжируются и показываются пользователю в готовом виде.

Основная особенность системы Яндекс, делающая популярной ее среди русскоязычных пользователей, – это способность определять различные словоформы с учетом морфологических особенностей русского языка.

В 2012 г. Был внедрен новый алгоритм «Калининград», который позволил сделать поиск персонализированным. Это значит, что теперь основным фактором ранжирования является сам пользователь, который формирует запрос для поисковой системы. Другими словами, результаты поиска по одному и тому же вопросу для двух разных пользователей теперь будет различаться в зависимости от нужд и предпочтений самих пользователей. Это новый шаг на пути эволюции поисковых систем.

В 2016 г. компания запустил сервис Яндекс Такси.

Кроме того, среди нововведений Яндекса можно отметить:

  • введение геозависимости запросов в зависимости от региональной принадлежности пользователя и сайта;
  • учет поведенческих факторов;
  • разработка механизма подсказок, исправления ошибок и распознавания аббревиатур;
  • активная борьба с продажными ссылками и переоптимизированными текстами;
  • введение персонализированного поиска;
  • учет добавочной смысловой стоимости сайта.

2.6 Поисковая система Mail. ru 

Поисковик Mail.ru остался позади известных Яндекса и Google. Сначала этот сервис работал, используя поисковые услуги Google, позже — Яндекса, и только в 2013 году Mail.ru стал применять свой поисковой движок. (Рис 2.7.)

Рис. 2.7 Начальная страница поисковой системы Mail.ru

Национальная почтовая служба Mail. ru – это не только поисковая система но и один из крупнейших порталов российского Интернета. Ежедневная аудитория Mail.ru – более 5 миллионов пользователей. Общее число регистраций со дня основания около 60 миллионов. Mail.ru – самый быстроразвивающийся российский Интернет-ресурс. Через почтовые ящики Mail.ru ежедневно проходит более 25 миллионов писем. Mail.ru занимает лидирующую позицию среди бесплатных почтовых сервисов, предоставляя своим пользователям почтовый ящик неограниченного размера с защитой от спама и вирусов, переводчиком, проверкой правописания, архивом для хранения фотографий и многое другое.

Нужно сказать, что разработчики поисковой системы изначально делали ставку не на поиск, а на различные сервисы: Агент, Почта, Мой Мир, Одноклассники, и самый главный способ монетизации — игры. Именно за счет этих услуг холдинг, по некоторым данным, является одним из самых посещаемых в России.

Выделить основные приоритеты в работе поисковых алгоритмов довольно сложно, но можно отметить несколько факторов:

  • качественный контент;
  • поведенческие показатели;
  • удобный и интуитивно понятный для посетителей сайт;
  • наличие естественных ссылок с других сайтов.

Соблюдение этих очевидных правил поможет сайту уверенно занять позиции в первой десятке. По сравнению с гигантами Яндексом и Google, продвигать сайт на Mail.ru гораздо легче и проще.

Какая из поисковых систем лучше?

Рейтинг мировых поисковых систем по данным 2016 г. представлен в следующей таблице.

Как мы видим лидерами по показателям качества представленной информации оказались Yandex, Google .

Мною был введен один и тот же «запрос» в несколько поисковых систем.

Yandex оказался одной из наиболее эффективных систем с точки зрения ее релевантности и соответствия выданных результатов заданному запросу. Хоть страниц было много, но нужная информация находилась на самых первых из них. Мало затраченного времени – необходимые результаты. При этом немаловажную роль сыграла также относительная новизна представленной информации. 

Google выдавал результаты страниц, на которых не всегда первое место занимали релевантные документы. Зато жалоб на разнообразие просто не было, т.к. в представленном количестве материала можно было найти что угодно (при этом было потрачено времени в два раза больше, по сравнению с поисками в других поисковых системах).

Система Aport оказалась менее эффективной, чем вышеназванные из-за ее чрезмерной ориентации на частные случаи, но результаты, которые она выдавала, значительно отличались от результатов других поисковых систем. Они были единственные в своем роде, не всегда релевантны, но неповторимы.

Rambler, несмотря на прочно занимаемое четвертое место в количественном рейтинге, оказался намного менее эффективной по релевантности системой. Здесь преобладает ориентация на российские источники информации, что снижает ее адекватность в оценке ситуации в других странах. К этой же категории по степени релевантности можно отнести и поисковую систему Google.

Поисковую систему Yahoo можно рассматривать как наиболее эффективную наравне с Yandex, но только в англоязычном поиске. На русском языке в данной системе имеется незначительное количество сайтов и их релевантность минимальна.

Заключение

По итогам сделанной мной работы я могу заключить что; поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

По моему мнению, самой лучшей иностранной поисковой системой является Google, так как для меня основное значение имеет точность и полнота предоставляемых данных. Но можно заключить также что, каждая поисковая система будь то Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно какой именно лучше пользоваться было бы неправильно. Поэтому для удобства поиска и полноты информации следует пользоваться несколькими поисковиками вводя в них нужные запросы. По моему мнению, из многих Российских поисковиков выделяются Яндекс и Рамблер, для них характерно постоянное обновление баз данных что, обеспечивает именно актуальность и точность предоставляемой информации.

Список литературы

      1. Экслер, А.Б., “Самоучитель работы в Интернете” – Москва.: NT Press, 2010г.
      2. Кузьмин А.В. Золотарева Н.Н. Поиск в Интернете – Санкт – Петербург.: Издательство НиТ, 2011г.
      3. Егоров, А.Б., ” Поиск в Интернете” – Санкт – Петербург.: НиТ, 2010г.
      4. Павел Храмцов “Поиск и навигация в Internet”. http://www.osp.ru/cw/1996/20/31.htm
      5. Андрей Аликберов “Несколько слов о том, как работают роботы поисковых машин”. http://www.citforum.ru/internet/search/art_1.shtml
      6. www. google.ru
      7. www.yandex.ru
      8. www.rambler.ru
      9. www.aport.ru
      10. www.mail.ru
      11. www.yahoo.ru

СПИСОК ДЛЯ ТРЕНИРОВКИ ССЫЛОК

  • Проектирование реализации операций бизнес-процесса .
  • Методы стимулирования и развития познавательного интереса, как необходимость в достижении педагогической цели
  • Аудиторская деятельность как вид предпринимательства: общая характеристика. Внутренний аудит
  • Способы прекращения обязательств)
  • Проектирование реализации операций процесса «Реализация билетов через розничные кассы
  • Регламент выполнения процесса «Реализация билетов через розничные кассы»
  • Управление товарооборотом и товарными запасами на предприятии с целью повышения эффективности коммерческой деятельности в ООО «ГарантЪ»
  • Управление процессом реализации изменений и нововведений
  • АНАЛИЗ ОРГАНИЗАЦИОННОЙ КУЛЬТУРЫ ООО «ИРИДА»
  • Сущность и значение Pr – коммуникаций в спорте
  • Цели и критерии оптимизации бизнес-процессов
  • Методы кодирования данных. Выбор способа кодирования

Обновлено: 04.05.2023

Язы́к запро́сов — это искусственный язык, на котором делаются запросы к базам данных и другим информационным системам, особенно к информационно-поисковым системам.

Примеры

Язык поисковых запросов

Язык, на котором формулируются запросы к поисковым системам называется языком поисковых запросов или информационно-поисковым языком.

В различных поисковых системах язык запросов может различаться, однако обычно он является некоторым подобием языка регулярных выражений с дополнениями, связанными со спецификой работы той или иной поисковой системы. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации.

Язык поисковых запросов состоит из логических операторов, префиксов обязательности, возможности учёта расстояния между словами, морфологии языка, регистра слов, расширенных операторов, возможностей расширенного поиска, уточнения поиска. Сравнительная таблица языка запросов по этим параметрам для четырёх поисковых систем рунета здесь.

См. также

Языки запросов
.QL · CQL · CODASYL · COQL · D · DMX · Datalog · ERROL · ISBL · LDAP · MQL · MDX · OQL · OCL · Poliqarp Query Language · QUEL · SMARTS · SPARQL · SQL · SuprTool · TMQL · XQuery · XPath · XSQL · YQL
  • Поисковые системы
  • Языки разметки
  • Информационные языки

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое “Язык запросов” в других словарях:

ЯЗЫК ЗАПРОСОВ — (query language) Целевой язык программирования (programming language), используемый для извлечения информации из базы данных (database). Как правило, любая система управления базой данных обладает собственным языком запросов. Бизнес. Толковый… … Словарь бизнес-терминов

язык запросов — užklausų kalba statusas T sritis automatika atitikmenys: angl. query language vok. Abfragesprache, f rus. язык запросов, m pranc. langage de demandes, m … Automatikos terminų žodynas

язык запросов (в СУБД) — — [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в целом EN query languageQL … Справочник технического переводчика

Структурированный язык запросов — основанный на реляционной алгебре язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа. SQL является стандартным средством доступа к серверу… … Финансовый словарь

MDX (язык запросов) — Эту статью следует викифицировать. Пожалуйста, оформите её согласно правилам оформления статей. У этого термина существуют и другие значения, см. MDX. MDX (англ … Википедия

функциональный язык запросов — — [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в целом EN function query languageFQL … Справочник технического переводчика

Особенности языка запросов различных поисковых систем

В зависимости от поисковой системы язык запросов может отличаться.

  • Яндекс. Правила запросов в Яндекс имеет следующие особенности: список операторов и морфологию, сложные запросы, описание порядка слов, исключение и ограничение расстояния между словами.
  • Рамблер. У Рамблера в языке запросов реализовано применение регистра, метасимволов, кавычек, стоп-слов, скобок, описание операторов, морфология, ограничение расстояния и специальные операторы.
  • Google. Язык запросов поисковой системы Google включает описания операторов, по которым написан подробный Faq на английском языке, и встроенные функции дополнительного расширенного поиска.

Значение языка запросов

Несмотря на богатство возможностей и эффективность языка запросов Yandex или других поисковых систем, их используют меньше 2 % пользователей. Поэтому специалисты, занимающиеся раскруткой сайтов, должны учитывать, что язык запрос практически не оказывает влияния на посещение сайтов. Согласно предоставляемой поисковыми системами статистике большинство пользователей интернета стремятся к естественному использованию языка, т.е. составлению запросов из более длинных фраз и словосочетаний, а не к овладению языком запросов.

Язык запросов поисковой системы – это набор операторов, на основе которых строятся правила для алгоритма поиска.

Правильно указанная шаблонизированная фраза позволяет сократить в результатах выдачи количество ссылок на сайты, не отвечающие запросу пользователя.

Вспомните столы справок в торговых центрах или на вокзалах. Все сотрудницы делятся на две категории:

  • Милые приветливые девушки, терпеливо уточняющие ваш вопрос и искренне желающие помочь.
  • Закаленные в боях с клиентами суровые женщины со стальным стержнем, которые выдают информацию строго в соответствии с тем, что вы спросите. И не важно, что желает узнать посетитель. Каков вопрос, таков ответ.

Поисковые системы (ПС) по эффективности результата ближе ко второй категории. Это не искусственный интеллект, а сложные алгоритмы, действующие в строго заданной последовательности. Чем более размыто сформулирован текст, тем менее релевантную выдачу получает пользователь. Для уточнения в интернете используется язык запросов. Каждая ПС разработала свои правила.

Как ищут Яндекс и Google

В Yandex слова рассматриваются отдельно с двух позиций:

  1. Морфологическая форма (число, падеж, склонение, род).
  2. Часть речи (глагол, существительное, прилагательное).

Google действует по тому же принципу. При этом порядок слов и в том и другом случае не соблюдается.

Без использования уточняющих операторов ни в одном из указанных сервисов Василий не сможет найти желаемое. Яндекс предложил ему 65 страниц выдачи, но ни одна ссылка не удовлетворяет контексту.

Что такое язык поисковых запросов

Классическое определение мы найдем в Википедии.

Это набор операторов и определенных для них правил использования. Основаны они на булевой алгебре – логических операциях:

  • объединение (конкатенация);
  • пересечение;
  • отрицание;
  • исключение.

К этому добавляются правила для морфологической формы слов и в итоге получается нехитрая система.

В обычной речи человек просто уточняет что-то дополнительными фразами. Для поисковой системы это не сработает. Поэтому и были введены специальные операторы, которые позволяют машине объяснить, какая же информация нужна пользователю.

Общие правила ПС для слов:

  • Минус-слово. Будут выданы все результаты, не включающие его.
  • Любое. Подстановка любых символов между указанными ключами.
  • Фиксация. Обязательно должно присутствовать.
  • ИЛИ. Хотя бы одно из указанных слов должно быть в тексте.

В остальном оба набора имеют различия.

Язык поисковых запросов Яндекса

Отечественный продукт показывает себя с лучшей стороны. Помимо свода правил разработчики продумали и создали отличную справочную систему, в которой пользователь быстро и легко найдет все необходимое.

Правила подразделяются на две части: морфология и поисковый контекст, документные операторы. Первое отвечает за уточнение вопросов к ПС.


Поиск по цитате

Заключите фразу в кавычки и в результатах будут представлены только ресурсы с точным вхождением.


Перечисляем слова через этот оператор и получаем ресурсы с вхождением одного из них.

Минус перед набором символов означает запрет на включение их в результаты выдачи.

яблочный сок –польза –вред

Документные правила полезны всем seo-специалистам. Они позволяют фильтровать информацию для анализа ключей.

По заданному адресу URL:

поисковые запросы url: semantica.in

Если в самом запросе используются другие операторы, следует заключить его в кавычки.

По указанному сайту (доменам и поддоменам).

По страницам с заданного хоста host:

В аналогичном операторе rhost запись хоста указывается в обратном порядке: in.semantica.www

В файлах заданного типа mime:

Формы бухгалтерского баланса в файле Excel.


Ресурсы с заданным языком lang:

Удобно вводить английский термин и искать русскоязычные ресурсы.

jacob nielsen lang:ru

По дате последнего изменения сайта date:

По категориям ЯндексКаталога cat:

Нужно знать идентификатор региона или темы.

31 января 2017 года команда Яндекс в блоге опубликовала команды, которые перестали поддерживаться.

  • & – в одном предложении.
  • && и 20.02.2018 4561

Рассмотрим, что такое лонгрид на простом примере. Гарри Поттер держит в руках старинный свиток, в котором рассказывается, как освоить 1000 заклинаний. Каждое заклинание размещено в отдельном блоке и снабжено движущейся картинкой, на которой показано, как оно работает. В сноске рассказано, как усилить его действие. Вокруг юного волшебника тут же собирается толпа приятелей. Почему? Потому что это интересно! Согласитесь, изучать магию…

Меньше слов и больше нарративов в Яндекс.Дзене, или Как освоить новый источник монетизации

Это Pinterestно! Всё, что вы хотели знать о популярном ресурсе

Фотосоциальные сети так тесно вошли в нашу жизнь, что мы используем их повсюду: дома, на работе и даже в продвижении бизнеса. Сегодня наше внимание привлёк один из самых влиятельных ресурсов. Итак, что такое Pinterest и как им пользоваться? Pinterest. com — что это за сайт? Визуальная социальная сеть, в которой пользователи делятся понравившимися фотографиями. Все публикации разделены на отдельные блоки…

Поисковый запрос – это слово или словосочетание, которое вводит пользователь поисковой системы, желая получить определенную информацию. После получения запроса система автоматически выводит наиболее подходящие – по её мнению – страницы. Все запросы можно условно разделить на несколько видов и типов.

Для владельцев и оптимизаторов сайтов данная информация является обязательной к пониманию и изучению, т. к. основным источником трафика для большинства ресурсов по-прежнему остаются поисковики. Именно поэтому серьезное продвижение того или иного сайта требует серьезного подхода и ряда действий: составления семантического ядра и определения всех типов поисковых фраз, на которые стоит ориентироваться.

Виды поисковых запросов

Как уже говорилось выше, все поисковые запросы можно условно разделить на типы и виды. Виды выделяют в зависимости от следующих параметров: частотность, конкурентность, ценность, геозависомость. А к типам относят навигационные, информационные, мультимедийные, транзакционные и общие (нечеткие) запросы. Рассмотрим типы и виды запросов подробнее.

Виды поисковых запросов можно условно разделить на 4 категории.

1. По частотности

vidy_zaprosov_po_chastote

2. По конкурентности

  • ВК – высококонкурентные;
  • СК – среднеконкурентные;
  • НК – низкоконкурентные.

При работе над новым проектом предпочтение лучше отдать низко- и среднеконкурентным запросам. Как определить степень конкурентности, мы поговорим в следующих статьях.

3. По степени ценности

  • Коммерческие. К данной категории относятся запросы, прямо или косвенно призывающие купить некоторый продукт.
  • Некоммерческие. В противовес коммерческим, к покупке не побуждают, а носят скорее информационный характер. Соответственно, активно используются на информационных и развлекательных порталах.

4. По геозависимости

Существуют также и другие виды поисковых запросов: сезонные, по времени суток и т.д. Но большинство оптимизаторов не выносит их в отдельную категорию при построении стратегии развития проекта.

Типы поисковых запросов

tipy_poiskovyh_zaprosov

Язык поисковых запросов

Каждая поисковая система имеет свой язык запросов. Это помогает более точно сформулировать свой вопрос и получить, соответственно, более точный на него ответ. Ниже приведены наиболее популярные операторы языка поиска Google и Яндекс.

Язык поисковых запросов Google

Базы данных
Концепции
Назначение Оператор
Поиск по определенному сайту или его страницах Site:(url сайта)
Поиск обратных ссылок link:
Поиск страниц с похожим или аналогичным содержанием related:
Поиск по нескольким запросам. К примеру, Дата крещения Руси 988 OR899 OR
Информация о ссылке info:
Информация из кэша (последняя индексация сайта) cache:

Язык поисковых запросов Яндекса

Назначение Оператор
Сортировка или поиск по заголовкам документа. title:
Поиск по URL url:
Поиск по хосту host:
Поиск по определенному сайту или странице site:
Сортировка с ограничением по языку lang:
Поиск по домену domain:
Поиск по дате date:

Кроме того, Google и Яндекс предоставляют функцию расширенного поиска, где пользователь на интуитивном уровне может ввести дополнительные критерии: язык, регион, дата обновления и формат документа.

Что такое язык запросов

Язык запросов – это искусственно созданный язык, с помощью которого осуществляют запросы к поисковым системам, база данных или другим информационным системам. На данный момент таких языков немало. Все они существенно отличаются между собой и созданы для автоматизации разных процессов. Нас же интересует их применение в поиске информации.

Язык поисковых запросов

Информационно-поисковый язык (Information retrieval query language) – это набор операторов, которые позволяют формировать запросы для поисковых машин. Работа поисковых запросов сводится к манипуляциям в поисковой строке и отправке их поисковой машине на выполнение. Главная цель – улучшение и упрощения процесса поиска информации пользователем.

Применяя логические операции, префиксы для ключевых слов и других символы языка поисковых запросов может существенно сузить поисковую выдачу конкретного запроса и находить информацию по определенной фильтрации, что позволяет находить нужное, убирая лишнее.

Для того чтобы применить возможность языка поисковых запросов необязательно обладать специальными знаниями. Основные поисковые операторы, представлены на панели расширенного поиска во всех популярных поисковиках. Как правило, эта панель находиться под или над поисковой строкой. Однако в ней реализованы не все информационно-поисковые возможности. При необходимости можно прибегнуть к дополнительным операторам, которые делятся на три группы: морфологические, поискового контекста, документные. Важно понимать, что операторы в разных поисковиков имеют некоторые отличия и обозначаются по-разному. Для сравнения разберем языки поисковых запросов Google и Яндекс.

Морфология

Поисковый контекст

Google: OR (ИЛИ) – поиск любого слова разделенного оператором.
Яндекс: & (И) – слова запроса объединены в одном предложении; && – слова запроса объеденные в одном документе; | (ИЛИ) – поиск любых из запрашиваемых слов разделенных данным оператором; ~ (И-НЕ) – поиск слова перед оператором в предложение, которое не имеет слово после оператора; ~~ (И-НЕ) – поиск слова перед оператором в документе, которой не имеет слово после оператора.

Документные операторы

  • filetype: поиск заданных слов, которые находятся в документе заданного типа;
  • site: поиск заданных слов на заданном сайте;
  • movie: поиск видеоматериалов;
  • allintitle: поиск документов в заголовках, которых присутствуют указанное выражение;
  • allinurl: поиск страниц, в адресе которых находится указанное выражение;
  • define: поиск страницы, на которой данной определение указанного значения;
  • link: поиск страниц, которые ссылаются на страницу указанного адреса.

Проще говоря, с помощью языка поисковых запросов пользователь может настроить, КАК ему искать информацию, но для этого необходимо точно знать, ЧТО искать. Иначе нагромождать выражение операторами в поисковой строке нет необходимости.

Читайте также:

      

  • Сообщение на тему юнона и авось краткое
  •   

  • Сообщение на тему классика
  •   

  • Сообщение про эмилиано сапата
  •   

  • Как повторить сообщение устранение проблем
  •   

  • Дорожное сообщение с финляндией

Время прочтения: 5 минут

Тэги:  Яндекс,SEO, продвижение сайтов, поисковое продвижение

О чем статья?

  • Правила поиска в Яндексе
  • Как использовать операторы 
  • Информация о сайте с помощью операторов
  • Поиск по типу файла, языку и дате изменения 
  • Рекомендованные запросы в Яндексе 
  • Выводы

Кому полезна статья?

  • Пользователям поисковой системы Яндекс;
  • Оптимизаторам, веб-мастерам.

Проводя поиск запросов, Яндекс не учитывает разницу форм слова, не различает синонимы и за счет этого может выдать много ненужной информации. Сузить выдачу и получить более релевантный результат помогут различные виды поиска и операторы Яндекса.

Правила поиска в Яндексе

Разнообразные возможности уточнить запрос предоставляет сама поисковая система.

Расширенный поиск Яндекс позволяет настроить фильтры по региону и временному периоду.

Персональный поиск подключается, когда пользователь авторизован в Яндексе. Просто в Яндексе, подтверждать права через мета тег в Вебмастере не надо. Поисковая система собирает статистику и улучшает качество поиска для конкретного аккаунта. Показывает поисковые подсказки по запросам, которые он вводил ранее. Если пользователь часто заходит на определенный сайт, то выдача включает его в первую очередь, даже если он не находится в топе.

Поисковые подсказки экономят время пользователей, предлагая варианты поисковых фраз непосредственно во время ввода запроса. Основаны на информации сети о том, что ищут пользователи.

Фильтрация поиска. Главная страница поисковика внизу справа выводит кнопку «Настройки» , а в ней «Настройки портала». Здесь можно выбрать режим фильтрации поиска: без ограничений, умеренный, семейный. Умеренный стоит по умолчанию. В этом режиме «взрослый» контент показывается только при явном поисковом запросе. В семейном режиме не показывается никогда, его стоит выбирать, если компьютером пользуются несовершеннолетние. В режиме «без ограничений» выдача показывает контент для совершеннолетних наравне с другим.

До августа 2020 года работал также «Поиск людей» по открытым профилям социальных сетей. В настоящее время эта страница закрыта, функционал перенесен в обычный поиск Яндекса.

Как использовать операторы

Язык запросов Яндекса включает в себя операторы. Это символы и команды, при помощи которых пользователь задает некоторые условия. Ставятся, если не указано иначе, перед отмечаемым словом без пробела.

Поиск слова в заданной форме — оператор !

По умолчанию весь поиск ведется без учета морфологии языка, т.е. слово ищется в любом падеже, склонении и числе. ! помогает найти слово в определенной форме.

Учтите, что оператор надежно разделяет единственное и множественное числа имен существительных. Если же значение имеет существительное в форме какого-либо падежа, даже с оператором в выдачу попадает также именительный падеж. То же и с поиском глагола в определенном спряжении – в выдаче будут страницы с инфинитивом.

Поиск по цитате — оператор « »

Помогает найти точную фразу или отрывок текста. Полезен, когда вы например, проверяете данные в статье или докладе, взятые из открытых источников и приведенные без его указания. Включите в скобки требуемый запрос. Формат кавычек ” ” или « » неважен. Если поисковая система не нашла точный отрывок, появится предупреждение, что точного совпадения не нашлось, показан результат поиска без кавычек.

Поиск по цитате с пропущенным словом — оператор *

Позволяет найти совпадения, когда в цитате пропущена часть текста. Применяется только в сочетании с предыдущим оператором, ставится в месте пропущенных слов. Пример: «В декабре 2017 рост индекса заработной платы составил * в Москве». 

Поиск с обязательным словом — оператор +

Если задан многословный запрос, в выдачу попадают страницы, где присутствуют не все слова. Поставьте + перед теми из них, которые вам необходимы. Например, пользователи +административная панель +Битрикс. Это заметно сузит поиск и избавит вас от огромного количества страниц с абстрактными «пользователями» в выдаче.

Поиск без определенного слова — оператор –

Работает по аналогии с предыдущим, но исключает слова из поиска. Помогает найти страницы, на которых есть запрос, но без некоторых уточнений. Минус можно ставить как с основной, так и с цифровой клавиатуры.

Поиск на выбор — оператор |

Сообщает Яндексу, что надо искать страницы, на которых присутствует хотя бы одно слово из запроса, не обязательно все вместе. В отличие от предыдущих операторов, отделяется пробелом.

Учтите, что с января 2018 года Яндекс перестал поддерживать  ~ & && << () !!

Информация о сайте с помощью операторов

Веб-мастера и seo-специалисты могут в работе использовать операторы-команды, при помощи которых информация по запросам выводится с конкретных сайтов. В их конце всегда ставится двоеточие. При вводе запроса указывайте главное зеркало сайта, его можно определить в Вебмастере Яндекс.

Поиск по страницам, размещенным по определенному адресу — url:

Запрос url:полный URL
— найдет страницы, содержащие запрос и размещенные по данному url

Запрос url:имя хоста/категория/* — поиск запроса на страницах, чем адрес называется с указанного.

Поиск по поддоменам и страницам сайта — site:

Запрос site: адрес сайта ищет все документы с запросом, которые есть на страницах данного сайта.

Поиск по домену — domain:

Значение аналогично предыдущим и ищет по страницам на заданном домене. Может быть как домен верхнего уровня, так и любой другой.

Поиск по хосту — host:

Записывается следующим образом: запрос host:www.домен второго уровня.домен верхнего уровня
(например, запрос host:www.ashmanov.com).

Ищет страницы на конкретном хосте. Точно такие же данные дает оператор url: с именем хоста.

Поиск по хосту — rhost:

Похож на оператор host:, но необходим обратный порядок записи. Например, запрос rhost:com.ashmanov.www покажет все страницы с запросом на домене. А запрос rhost:com.ashmanov найдет их на всех поддоменах домена.

Поиск по типу файла, языку и дате изменения

  • Оператор mime: помогает найти слово в документах, которые размещены не на странице, а в файлах. Укажите нужный формат. Доступны форматы: doc, docx, xls, xlsx, rtf, ppt, pdf, odt, swf, odp, odg, pptx, html, ods. Пример: mime:rtf

  • Оператор lang:
    ищет текст на нужном языке. Языки, доступные для поиска: русский (ru), немецкий (de), украинский (uk), казахский (kk), белорусский (be), татарский (tt), английский (en), турецкий (tr), французский (fr). Пример: lang:fr

  • Оператор date: ищет документы и страницы, которые соответствуют определенным временным промежуткам. Сопровождается  атрибутами, представленными на рисунке:

Рекомендованные запросы в Яндексе

Летом 2017 г. в панели Вебмастера появился новый инструмент для seo-оптимизаторов «Рекомендованные запросы». Его цель — помочь мастерам сосредоточиться на целевых поисковых запросах, по которым страница с большей вероятностью попадет в топ выдачи.

В панели Яндекс.Вебмастера перейдите в раздел «Поисковые запросы», выберите «Рекомендованные запросы» и подтвердите. Система будет около недели собирать статистику. После чего в панели появится информация о четырех показателях: прогноз показов; прогноз кликов; прогноз цены клика; текущая позиция страницы в поиске.

Полученные данные используйте в seo-оптимизации и для контекстной рекламы.

Выводы

  • Язык запросов — специально созданный язык для обращения к поисковой системе. Язык Яндекса обрабатывает запросы без учета морфологии, но исправляет ошибки и опечатки, работает с операторами.

  • В Яндексе работают несколько видов поиска: расширенный, семейный, персональный. Для быстроты поиска созданы поисковые подсказки.

  • При поиске используйте операторы, которые ведут поиск запросов в заданной словоформе или без заданных слов, ищут полные и неполные цитаты.

  • Для работы можно использовать операторы, которые помогают искать слова в пределах одного домена, поддомена, хоста, урла, временного промежутка.

  • Доступен поиск по временным параметрам, а также по файлам одного типа или на одном из 9 языков.

  • Используйте инструмент Вебмастера «Рекомендованные запросы» для оптимизации страниц и увеличения траффика на сайт.

Авторы:

Минина Татьяна, копирайтерТатьяна Минина, профессиональный журналист, копирайтер, член Союза Журналистов России. Сфера профессиональных интересов: digital, журналистика, SEO, здоровый образ жизни.

Алексей ГуберманАлексей Губерман, руководитель отдела SEO в «Ашманов и партнеры».

Алексей Губерман

Лого АиП

Руководитель отдела оптимизаторовЭксперт

Работает в сфере SEO с 2014 года. Контролирует качество проектов отдела, отвечает за аналитику и разработку стратегии для ключевых клиентов. Спикер вебинаров и отраслевых конференций.

Татьяна Минина

Лого АиП

Татьяна Минина

Редактор блога

Профессиональный журналист, копирайтер, член Союза Журналистов России. Сфера профессиональных интересов: digital-маркетинг, журналистика, SEO, здоровый образ жизни.

Поисковая система ‘Яндекс’

Министерство
образования и науки Российской Федерации

Федеральное
государственное автономное образовательное учреждение высшего профессионального
образования

Национальный
исследовательский ядерный университет “МИФИ”

Факультет
Кибернетики и информационной безопасности

Кафедра
Финансового мониторинга

Реферат

Поисковая
система “Яндекс”

Выполнил

студент группы Р01-75М

А.П. Шереметьев

Преподаватель Н.А. Евстифеева

Москва
2014

Содержание

Введение

Раздел
I. Обработка запроса и архитектура ответа на вопрос

.1
Архитектура ответа на вопрос

.2
Определение языка

.3
Морфология

.4
Расширение запроса

.5
Выделение объектов

Раздел
II. Результаты поиска

.1
Формирование результатов поиска

.2
Оформление результатов поиска

.3
Дополнительная информация в сниппете

Заключение

Список
использованной литературы

Введение

В наши дни наша жизнь настолько разнообразна и
разносторонняя и мы не можем ее себе представить без интернета, при условии,
даже если мы используем его на самом минимальном уровне (т.е. не уделяем время
социальным сетям, не используем в работе и т.д.), наверняка каждый из нас
задавался каким либо вопросом, на который можно получить ответ только после
того, как пересмотришь ряд источников из той или иной области и проинспектируешь
не один том энциклопедий. Но эта задача упрощается с появлением интернета, как
проявлением научно-технического прогресса в нашей жизни. И одним из самых
используемых ресурсов интернета являются поисковые системы, которые
способствуют нахождению самой разнообразной информации, в соответствии с
заданными запросами.

Темой моего реферата является поисковая система
“Яндекс”, принадлежащая российской компании ООО “Яндекс”,
предоставляющая наравне с услугой поиска ряд других сервисов и услуг. В теле
реферата рассматриваются принципы поисковой системы и процедура проведения
поиска по запросам пользователей “Яндекса”.

Актуальна эта тема тем, что скорость развития
сервисов, аналогичных Яндексу, очень велика, и они играют очень важную роль в
нашей жизни и в нашем обществе. Необходимо донести важность развития, изменений
и оптимизации систем работы Яндекса.

Задачей работы является рассмотрение Яндекса,
как сложной системы поиска, и показать необходимость существования и
использования сервисов компании, а также их постоянное совершенствование.
Рассмотрение структуры запросов в Яндексе, вспомогательные программы принципы
поиска, распределение задач, модули и этапы их преобразования с течением
времени. Реферат состоит из введения, трех разделов, выводов и заключения.

Раздел I. Обработка запроса и
архитектура ответа на вопрос

поиск яндекс информация программа

1.1 Архитектура ответа на запрос

Каждый день пользователи задают Яндексу десятки
миллионов запросов, и поисковая система должна не только точно отвечать, но и
быстро обрабатывать весь этот поток. Для этого Яндекс использует заранее
подготовленные данные – индекс. Безусловно, поиск с помощью индекса ускоряет
процесс ответа пользователю, как, например, предметный указатель в книге
помогает быстрее найти нужное слово. Но размеры самого “предметного
указателя” в поиске – огромны. Чтобы обрабатывать такие объемы данных и
делать это быстро, Яндекс использует тысячи серверов. Сервера объединены в
кластеры и даже в кластеры кластеров.

Все пользовательские запросы сначала попадают в
компьютерную систему “метапоиск”. Метапоиск обрабатывает каждый
запрос в реальном времени – выясняет все необходимые данные про запрос (из
какого региона он был задан, к какому классу относится и т.п.), проводит
лингвистическую обработку. Затем метапоиск проверяет, формировались ли в
последнее время результаты поиска для этого запроса. Результаты поиска по часто
задаваемым запросам некоторое время хранятся в памяти метапоиска, а не
формируются каждый раз заново. И если вновь пришедший запрос оказался
популярным, метапоиск покажет пользователю заранее сохраненные результаты.

Если же ответа в памяти нет, то метапоиск
передаёт запрос на сервера другой компьютерной системы – “базового
поиска”. На базовом поиске хранится слепок интернета, по которому ищет
Яндекс, – поисковая база. Она разбита на части, которые хранятся на разных
серверах – искать ответ одновременно по нескольким частям базы данных быстрее,
чем по всей базе целиком. Кроме того, у каждого сервера есть несколько копий.
Это позволяет распределять нагрузку и не терять данные – если один из серверов
не сможет своевременно ответить, информация всё равно найдется на дублирующих
серверах. Из тысяч серверов базового поиска метапоиск выбирает наименее
загруженные – таким образом, чтобы вместе они содержали целую поисковую базу.

Каждый из серверов отдаёт список документов, в
которых есть слова из запроса, обратно в метапоиск. Там они объединяются,
ранжируются с помощью технологии Матрикснет и попадают на страницу результатов
поиска.

Благодаря такой организации поиск Яндекса может
отвечать пользователю за доли секунды.

.2 Определение языка

Анализ запроса начинается с определения языка.
Например, слово “дружина” в русском языке означает “военная
рать”, а в украинском – “военная рать” и “жена”. Чтобы
понять, что имеет в виду пользователь, нужно выяснить, на каком языке он общается
с поисковой системой. Для этого Яндекс смотрит, какой алфавит использует
человек, какие в запросе есть характерные слова и сочетания букв.

Так, по запросу [дружина князя игоря] Яндекс
будет искать информацию о войске, а по запросу [дружина князя iгоря] – еще и о
жене полководца, княгине Ольге.

Кроме того, при определении языка поисковая
система обращает внимание на регион пользователя и язык интерфейса. Например,
если человек задает вопрос из Украины и использует интерфейс на украинском
языке, это будет дополнительным фактором, чтобы посчитать запрос
украиноязычным. Яндекс умеет работать с кириллическими запросами на русском,
украинском, белорусском, казахском, татарском и башкирском языках.

1.3 Морфология

Определив язык запроса, Яндекс переходит к
морфологии и определяет, к какой части речи относятся написанные слова.

Это позволяет находить документы, содержащие
разные формы одних и тех же слов. Например, по запросу [стали для ножей] Яндекс
будет искать документы, в которых есть не только это словосочетание, но и
варианты: “сталь для ножа”, “ножи сталь” и т.д. Анализируя
запрос, Яндекс составляет список возможных словоформ для каждого слова.

По словоформе, которая есть в запросе, не всегда
можно точно сказать, какое слово имел в виду человек. Например, в запросе
[стали для ножей] слово “стали” – это не только существительное
“сталь”, но и глагол “стать”. И в случае [стали для ножей]
нужно искать формы существительного, а в случае [стали выпадать волосы что
делать] – формы глагола.

Нужно избавиться от неоднозначности, снять
омонимию – совпадение слов с разным лексическим значением.

Чтобы выбрать для поиска наиболее вероятный
список форм, система проверяет – как часто слова из запроса встречаются вместе,
для этого она обращается к собственной статистике.

Например, в морфологическом разборе по запросу
[стали для ножей] система выберет для поиска слово “сталь”.

Во-первых, по статистике слово “сталь”
чаще встречается со словом “нож”, чем “стать”. А во-вторых,
существительное в именительном падеже “сталь” часто сочетается с
существительным в родительном падеже “ножей”.

Для сбора статистики Яндекс использует
Национальный корпус русского языка, где собрано огромное количество текстов в
электронном виде.

.4 Расширение запроса

После снятия омонимии поисковая система не будет
искать слова, которые пользователь точно не имел в виду. Но если ограничить
поиск только словами из запроса, в поле зрения поисковой системы не попадут
многие нужные документы. Ведь для одного и того же понятия в разных текстах
могут использоваться разные слова, например на одном сайте может стоять
аббревиатура, а на другом – полное наименование.

Для того чтобы учесть все возможные варианты,
Яндекс дополняет запрос, добавляя новые формулировки с тем же смыслом.
Например, вместе со сложносокращенным [физтех] Яндекс будет искать и
официальное “Московский физико-технический институт”, а по запросу
[установка скайп] – ещё и skype. Точно так же Яндекс добавляет в запрос разные
написания чисел – “Пётр I” и “Пётр Первый”, близкие по
смыслу однокоренные слова, варианты написания и синонимы. Если в запросе есть
“воронежский”, система может добавить к нему однокоренное
“воронеж”, к [авто-сервис мицубиши] – “автосервис
мицубиси”, а к [ветерок] – похожее “бриз”. Выбирая, какое слово
добавить, а какое нет, Яндекс смотрит, как часто это слово встречается с
другими словами в запросах пользователей и вообще в текстах. Однокоренные слова
и синонимы система берет из собственных словарей, которые Яндекс составляет
специально для таких случаев.

.5 Выделение объектов

Анализируя запрос, поисковая система выделяет в
нём различные объекты – географические названия, имена людей, названия
организаций и т.д. Например, если поисковая система поймет, что [Сергей Зубов]
– это человек, она не будет дополнять запрос словоформой “зубным” или
искать стоматологические клиники. А если в запросе [аптеки на парке культуры]
система обнаружит, что “Парк культуры” – это место, она учтёт это при
ранжировании: в результатах поиска первые строчки займут документы, в которых
слова “парк” и “культуры” идут подряд. Для выделения
устойчивых фраз и объектов Яндекс тоже составляет различные словари:
географических названий – топонимов, имен и фамилий, названий организаций и
другие. Получив запрос, система каждый раз проверяет по словарям, есть ли в нём
устойчивые словосочетания.

.6 Работа над ошибками

По статистике Яндекса, около 12% запросов
содержат ошибки. Это опечатки, орфографические ошибки или абракадабра, которая
получается при неправильной раскладке клавиатуры. Если искать ровно то, что
указано в поисковой строке, человек так и не получит нужный ему ответ – на
большинстве сайтов слова написаны грамотно. Поэтому поисковая система проверяет
запрос на грамотность.

В некоторых случаях сложно определить, ошибся
пользователь или нет. Например, ресторан “фуджияма” очень похож на
вулкан “фудзияма”, а фамилия футболиста “Массад” на
“Моссад”, “массаж” и крепость “Массада”. В таких
случаях, показывая ответ на исходный вопрос, Яндекс спрашивает, не ошибся ли
человек и не хочет ли он увидеть ответ на исправленный запрос. Есть ещё один
вариант – когда система не уверена, опечатался человек или нет. Тогда она
покажет на странице результатов поиска ответы сразу на два вопроса – на
заданный, в котором предположительно есть опечатка, и на исправленный.

На работу с ошибками и весь лингвистический
анализ уходят доли секунды. За это время система успевает определить язык
запроса, разобрать каждое слово, найти синонимы и устойчивые сочетания и в
конечном счете решить, документы с какими словами нужно искать.

Раздел II. Результаты поиска

2.1 Формирование результатов поиска

Страница результатов поиска – это ответ Яндекса
на вопрос, который пользователь задал в поисковой строке. Яндекс находит и
показывает все подходящие ответы: колдунщики своих сервисов, контекстные
объявления Яндекс.Директа, и, конечно, сами результаты поиска по интернету.

Результаты поиска по интернету – это ссылки на
найденные документы с краткой информацией о них. Информация подбирается так,
чтобы помочь пользователю понять – какой из ответов подходит ему лучше всего.
Яндексу важно не просто показать релевантный ответ, но и описать его
максимально информативно.

Для заголовка результата поиска Яндекс чаще
всего использует заголовок самого документа. Если он слишком длинный, Яндекс
выбирает фрагмент, который больше всего подходит по смыслу к заданному запросу.

Бывает, что у документа нет заголовка или
заголовок не соответствует содержанию. Например, названия файлов в формате doc
или pdf часто короткие и малоинформативные. В таких случаях Яндекс создаёт
заголовок самостоятельно, основываясь на текстах ссылок на документ, заголовках
в самом тексте документа и его содержании.

Для формирования описания страницы, которое
помещается в сниппете, программа выбирает все фрагменты текста документа со
словами из запроса. Каждый из таких фрагментов разбивается ещё на несколько
частей – например, со словами из запроса в начале, в конце и в середине. Затем
программа сравнивает их все между собой и выбирает лучшие – они и попадают в
сниппет.

При выборе программа учитывает несколько
десятков факторов. Некоторые из них повышают шансы попадания фрагмента в
сниппет, а некоторые – наоборот. Например, если слово содержится в длинном
предложении, больше вероятность, что это часть повествования, а не навигационная
ссылка. Это хороший фрагмент для сниппета. Также в сниппет скорее попадут
фрагменты из разных частей текста – так можно полнее описать содержание
страницы. А вот фрагмент, схожий с заголовком текста страницы, вряд ли попадёт
в сниппет – чтобы не дублировать информацию.

Для каждого фактора компьютерная система
рассчитывает коэффициент. С помощью машинного обучения система учится сама
понимать значимость факторов, основываясь на данных от специалистов-асессоров
(они просматривают некоторые наборы сниппетов, вручную разделяют их на хорошие
и плохие и сообщают эти оценки системе). Затем компьютерная система уже без
помощи людей строит формулу, по которой создает сниппеты.

.2 Оформление результатов поиска

Результат поиска оформляется так, чтобы пользователю
было легче его воспринимать. Заголовки выделены синим цветом и подчеркнуты –
так на веб-страницах традиционно выделяются ссылки. Узнать знакомый ресурс
помогает фавиконка – небольшой фирменный значок сайта – слева от заголовка
результата поиска. Если заголовок или текст описания содержит прописные буквы,
Яндекс старается сделать их строчными – так проще читать.

А чтобы было легче “зацепиться
глазом”, все слова из запроса в результатах поиска выделены жирным
шрифтом. При этом Яндекс умеет сопоставлять аббревиатуры и их расшифровки,
полные имена, сокращения и инициалы, числа и их текстовое написание. Например,
по запросу [петр 1] Яндекс найдет документы, которые содержат и “Петр
I”, и “Петр первый”, и выделит в сниппетах разные варианты
написания имени.

Чтобы помочь пользователю быстрее понять
содержание документа, Яндекс может выделить некоторые слова, которых нет в
запросе. Это происходит при ответе на общие, многозначные запросы. Например,
для запроса [снежная королева] в разных сниппетах будут дополнительно выделены
слова “мультфильм”, “сказка”, “магазин”.
Дополнительные слова Яндекс узнаёт, анализируя переформулировки запросов.
Специальная программа следит за тем, как пользователи уточняют свои запросы, и
рассчитывает значимость таких уточнений. Затем эти знания используются при
формировании сниппета.

.3 Дополнительная информация в сниппете

Яндекс старается сделать так, чтобы пользователи
могли быстро найти ответ – иногда даже сразу на странице результатов поиска.
Для разных ответов нужна разная дополнительная информация. Например, если
человек задаёт в запросе название организации, возможно, ему нужно узнать, где
она находится или как с ней связаться. Чтобы не пришлось тратить время на
поиски страницы с контактами на сайте организации, Яндекс добавляет её телефон
и физический адрес с ссылкой на карту в сниппет.

Если Яндексу известна структура сайта, он
показывает её пользователю. Над текстом сниппета сайта появляются ссылки на его
наиболее посещаемые страницы – чтобы при желании пользователь мог перейти в
нужный раздел, тратя меньше кликов и трафика. А адрес документа Яндекс
преобразует в навигационную цепочку – названия разделов и подразделов сайта, из
которых состоит путь до документа.

Для некоторых предметных областей Яндекс создаёт
специальные сниппеты. Например, для страниц с описаниями товаров или для сайтов
гостиниц, ресторанов, кинотеатров. Основная информация появляется в сниппете –
цена товара, “звёздность” гостиницы, кухня ресторана, количество
залов кинотеатра. Благодаря таким специальным сниппетам пользователь экономит
время и трафик, а организация получает посетителя сайта, заинтересованного
именно в её услугах.

За помощью к системе “Яндекс”
ежедневно обращается миллионы человек со всего мира, и отчасти никто не
задумывается, как это все работает. Ведь все операции производятся за считанные
доли секунд. В реферате рассмотрены основные поисковые технологии системы и
показано, что для каждого поискового запроса применяется ряд отдельных,
последовательных процедур, которые технически очень сложные. К тому же огромное
количество серверов компании могут обеспечивать бесперебойное выполнение всех
вышеуказанных процедур, обеспечивая удобные и комфортные условия своим
пользователям. Также “Яндекс” обеспечивает своих пользователей удобной
навигацией, что позволяет гораздо быстрее найти точный ответ на запрос.
Показывая более посещаемые источники с более точной информацией, поисковая
система обеспечивает экономию трафика своих пользователей.

Каждый день Яндекс отвечает на десятки миллионов
запросов. Около четверти из них – неповторяющиеся. Поэтому невозможно написать
для поисковой системы такую программу, в которой предусмотрен каждый запрос, и
для каждого запроса известен лучший ответ. Поисковая система должна уметь
принимать решения самостоятельно, то есть – сама выбирать из миллионов
документов тот, который лучше всего отвечает пользователю. Для этого нужно
научить ее обучаться.

В связи с постоянным и непрерывным развитием
комплекса предоставляемых услуг и сервисов “Яндекс” находится на
первом месте среди пользователей рунета. Поисковая система компании является
самой популярной в России. Также одна из систем Яндекса предлагает самим
пользователям улучшить поисковую систему с помощью сервиса Яндекс.Вэбмастер.

То есть в итоге имеет место утверждение, что, не
смотря на то, что для большинства людей – пользователей Яндекса, это всего лишь
“поисковик”, нужно понимать, что это сложный технический комплекс,
который непрерыввно развивается и один запрос – это целый механизм устройства,
которое не прекращает свою работу.

Список использованной литературы

1.      https://company.yandex.ru/technologies/search/

.        http://www.yandex.ru

.        https://company.yandex.ru/about/history/

.        http://ru.wikipedia.org/wiki/Яндекс

.        http://www.seoded.ru/istoriya/internet-history/istoriya-yandeksa.html

.        https://tech.yandex.ru

.        http://company.yandex.ru/technologies/crypta/

.        https://academy.yandex.ru/events/kit/