веб поиск это что такое
Что такое поисковая система, как работает поиск
Наиболее популярным веб сервисом современности является именно поисковая система. Тут всё объяснимо, ведь те времена, когда представители первых пользователей интернета могли наблюдать новинки в сети уже давным-давно ушли.
Информации появляется и скапливается так много, что человеку стало очень трудно найти именно ту, которая ему была бы необходима. Представьте, как бы обстоял бы поиск в интернете, если бы рядовому пользователю пришлось бы искать информацию не пойми где. Именно не пойми где, потому как ручным поиском много информации не найдёшь.
Поисковая система, что это такое?
Хорошо если пользователю уже известны сайты, на которых возможно есть нужная информация, но что делать в противном случае? Для того, чтобы облегчить жизнь человеку в поиске нужной информации в интернете и были придуманы поисковые системы или просто поисковики. Поисковая система выполняет одну очень важную функцию, без которой интернет был бы не таким как мы его привыкли видеть – это поиск информации в сети.
Поисковая система – это специальный веб узел или по-другому сайт, который предоставляет пользователям по их запросам гиперссылки на страницы, сайтов, отвечающие на заданный поисковой запрос.
Если быть немного точнее, то поиск информации в интернете, осуществляющийся благодаря программно-аппаратному функциональному набору и веб интерфейсу для взаимодействия с пользователями.
Для взаимодействия человека с поисковой системой и был создан веб интерфейс, то есть видимая и понятная оболочка. Данный подход разработчиков поисковиков облегчает поиск многим людям. Как правило, именно в интернете осуществляется поиск при помощи поисковых систем, но также существуют системы поиска для FTP-серверов, отдельных видов товаров во всемирной паутине, либо новостной информации или же другие поисковые направления.
Поиск может осуществляться не только по текстовому наполнению сайтов, но и по другим типам информации, которые человек может искать: изображения, видео, звуковые файлы и т.д.
Как осуществляется поиск поисковой системой?
Сам поиск в интернете, ровно так же как просмотр веб сайтов возможен при помощи интернет обозревателя – браузера. Только после того, как пользователь задал свой запрос в строке поиска, осуществляется непосредственно и сам поиск.
Релевантность поиска – поиск наиболее отвечающих запросу пользователя материалов и расположение на них гиперссылок на странице выдачи с более точными результатами выше других. Само распределениерезультатов называется ранжированием сайтов.
Так как же поисковик подготавливает для выдачи свои материалы и как происходит поиск информации самим поисковиком? Сбору информации в сети способствует уникальный для каждой поисковой системы робот или по-другому бот, обладающий так же рядом других синонимов как краулер или паук, а саму работу системы поиска можно разделить на три этапа:
К первому этапу работы поисковой системы можно отнести сканирование сайтов в глобальной сети и сбор на свои собственные серверы копий веб страниц. Это образует огромное количество пока ещё не обработанной и не пригодной информации для поисковой выдачи.
Второй этап работы поисковика сводится к приведению в порядок полученной ранее, на первом этапе информации от сайтов. Производится такая сортировка, которая за наименьшее время будет благоприятствовать тому самому качественному поиску, которого собственно и ждут пользователи от поисковой системы. Этап называют индексацией, это значит, что страницы уже являются подготовленными к выдаче, а актуальная база будет считаться индексом.
Как раз третий этап и обуславливает поисковую выдачу, после приёма запроса от своего клиента, опираясь на ключевые или около ключевые слова, указанные в запросе. Это способствует отбору наиболее соответствующей запросу информации, и последующей её выдачи. Так как информации, очень и очень много, поисковая система выполняет ранжирование в соответствие со своими алгоритмами.
Лучшей поисковой системой считается та, которая сможет предоставить наиболее корректно отвечающий на запрос пользователя материал. Но и тут могут встречаться результаты, на которые повлияли люди, заинтересованные в продвижение своего сайта, такие сайты хоть и не всегда, но зачастую появляются в результатах поиска, но не на долго.
Хоть мировые лидеры уже во многих регионах определены, поисковые системы продолжаются развивать свой качественный, поиск. Чем качественней поиск они смогут предоставить, тем больше людей будут им пользоваться.
Как пользоваться поисковой системой?
А вот получить правильный ответ на запрос поиска, с первого раза удаётся не всегда. Для того, чтобы поиски желаемого не становились мучительными, необходимо правильно составлять поисковый запрос и следовать нижеописанным рекомендациям.
Составляем поисковый запрос правильно
Далее будут указаны советы по использованию поисковой системы. Следование некоторым хитростям и правилам при осуществлении поиска информации в поисковой системе даст возможность получить нужный результат гораздо быстрее. Следуйте данным рекомендациям:
Так что такое поисковая система – это ни что иное, как возможность найти интересующую информацию и обычно совершенно бесплатно ей воспользоваться, чему-то научиться, что-то понять или сделать правильный для себя вывод. Многие уже не представляют своей жизни без голосового поиска, при котором текст не приходится набирать, свой запрос нужно всего лишь произнести, а устройством ввода информации тут является микрофон. Всё это свидетельствует о постоянном развитие поисковых технологий в интернете и необходимости в них.
Как работает поисковый сервер
Сложно представить современную жизнь без поисковиков – как бы иначе мы искали и находили информацию? Однажды придуманная технология навсегда упростила процесс работы с данными.
Сегодня я расскажу, что же представляет собой поисковый сервер, а также объясню принцип его работы.
Что такое поисковая машина
Мы знаем, что поисковый сервер (его еще называют поисковой системой или поисковой машиной) – это сайт, на котором можно быстро найти любую информацию, будь то текст, картинку, видео и многое другое. Но это только красивая обертка. На самом деле это сложный механизм, комплекс программ и алгоритмов, который обрабатывает сотни миллионов пользовательских запросов в минуту. И при этом конкретному человеку результат всегда выводится за доли секунды.
Архитектура большинства поисковых машин включает в себя, грубо говоря, три элемента:
Так работает поисковая машина, использующая специального робота. Но есть и другие виды поисковых машин:
Во всем мире наиболее популярен поисковый сервер Google (92%). В России лидирующую позицию занимает Яндекс (52,56%).
Как работает поисковый сервер
Вроде бы все просто – ввели слово или фразу по интересующей теме, запустили поиск, получаете результаты. Но за всем этим стоят тысячи алгоритмов – они анализируют миллиарды страниц, убирают лишнее и ранжируют сведения в списки по наиболее точному соответствию запросу.
Но кто сказал, что машина сразу же ищет в интернете информацию после введения запроса пользователем? Картина обстоит совсем иначе – поисковый сервер (сказать точнее, его индексатор) по определенным правилам обрабатывает содержимое сайтов в интернете и собирает по ним сведения в собственную базу данных. А уже потом, когда пользователь введет запрос, сервер обратится к этой самой базе и выведет из нее наиболее релевантную информацию. Отсюда и высокая скорость вывода результатов (пример на скриншоте ниже).
И вот ведь в чем вся соль – все, что делается для SEO-продвижения, направлено именно на то, чтобы «угодить» индексатору. Эта штука при выводе сайта учитывает кучу параметров, в числе которых:
Существуют, конечно, способы управления индексацией, например, теги noindex и nofollow закрывают определенное содержимое на сайте от роботов. Еще можно выставить запрет на индексацию всей страницы – для этого используется файл robots.txt с директивами Disallow, Allow, Crawl-delay, User-agent и т.д.
Со временем содержимое сайта может меняться, а индексатор не всегда успевает обрабатывать и вводить в свою базу данных эти самые изменения. Кроме того, на индексацию порой уходит несколько недель, иногда и больше – это зависит от алгоритма обработки информации на конкретном сервере. Соответственно, «свежие» страницы сразу в выдаче появляться не будут.
Поисковые сети борются с этим явлением разными способами. Например, новостные ленты анализируются чаще. В Яндекс.Вебмастере и Google Search Console есть специальный инструмент для переобхода страниц.
Теперь вернемся к пользователю – вот он ввел запрос и отправил его на обработку. Далее за дело берется система выдачи результатов. Она анализирует ключевые слова и ищет в базе данных подходящие страницы. Все параметры, которые я указала ранее, типа индекса цитирования и заспамленности, тоже учитываются при ранжировании.
Как искать информацию в поисковых системах
Суть работы машины – найти по конкретному запросу пользователя наиболее точные (релевантные) страницы. Но чтобы вышло именно то, что нужно, необходимо максимально правильно сформулировать ключевое слово. Можно воспользоваться несколькими такими словами, составлять из них фразы, также применять различные фильтры и инструменты в интерфейсе поисковика.
Как правильно формулировать запрос? Тут все неоднозначно. Вы можете в половине слов допустить ошибки, но поисковые системы, благодаря использованию современных языковых технологий, все равно распознают, что именно надо найти, и предоставят верные результаты. Еще нет разницы, в каком регистре вводится запрос – результаты во всех случаях будут идентичными.
Для поиска информации на русском языке идеально подойдут Яндекс и Google. А вот если потребуется найти что-то на иностранном языке, то с этим лучше справится Google.
Поисковая система
Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Улучшение поиска — это одна из приоритетных задач современного Интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина).
По данным компании Net Applications, [1] в ноябре 2011 года использование поисковых систем распределялось следующим образом:
Содержание
История
Хронология | ||
---|---|---|
Год | Система | Событие |
1993 | W3Catalog | Запуск |
Aliweb | Запуск | |
JumpStation | Запуск | |
1994 | WebCrawler | Запуск |
Infoseek | Запуск | |
Lycos | Запуск | |
1995 | AltaVista | Запуск |
Daum | Основание | |
Open Text Web Index | Запуск | |
Magellan | Запуск | |
Excite | Запуск | |
SAPO | Запуск | |
Yahoo! | Запуск | |
1996 | Dogpile | Запуск |
Inktomi | Основание | |
HotBot | Основание | |
Ask Jeeves | Основание | |
1997 | Northern Light | Запуск |
Яндекс | Запуск | |
1998 | Запуск | |
1999 | AlltheWeb | Запуск |
GenieKnows | Основание | |
Naver | Запуск | |
Teoma | Основание | |
Vivisimo | Основание | |
2000 | Baidu | Основание |
Exalead | Основание | |
2003 | Info.com | Запуск |
2004 | Yahoo! Search | Окончательный запуск |
A9.com | Запуск | |
Sogou | Запуск | |
2005 | MSN Search | Окончательный запуск |
Ask.com | Запуск | |
GoodSearch | Запуск | |
SearchMe | Основание | |
2006 | wikiseek | Основание |
Quaero | Основание | |
Ask.com | Запуск | |
Live Search | Запуск | |
ChaCha | Запуск (бета) | |
Guruji.com | Запуск (бета) | |
2007 | wikiseek | Запуск |
Sproose | Запуск | |
Wikia Search | Запуск | |
Blackle.com | Запуск | |
2008 | DuckDuckGo | Запуск |
Tooby | Запуск | |
Picollator | Запуск | |
Viewzi | Запуск | |
Cuil | Запуск | |
Boogami | Запуск | |
LeapFish | Запуск (бета) | |
Forestle | Запуск | |
VADLO | Запуск | |
Powerset | Запуск | |
2009 | Bing | Запуск |
KAZ.KZ | Запуск | |
Yebol | Запуск (бета) | |
Mugurdy | Закрытие | |
Goby | Запуск | |
2010 | Яндекс (англ.) | Запуск |
Cuil | Закрытие | |
Blekko | Запуск (бета) | |
Viewzi | Закрытие | |
2012 | WAZZUB | Запуск |
Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray ) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала [2] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Популярные поисковые системы
Согласно данным LiveInternet в 2012 году об охвате русскоязычных поисковых запросов:
Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
Необычные поисковые системы
См. также
Примечания
Литература
Ссылки
Ask.com (Ask Jeeves, механизм Teoma) • Blekko • Cuil (закрыт) • DuckDuckGo • Exalead • Gigablast • Google • Bing (Live Search/MSN Search) • Yahoo! Search (Inktomi • AltaVista • Alltheweb) • Яндекс
AskNet.ru • Brainboost • Clusty • Dogpile • FarSEER • exactus.ru • Excite • HotBot • Info.com • Ixquick • Krozilo • Mamma • Metacrawler • MetaLib • Нигма • Myriad Search • SideStep • Surfwax • Turbo10 • WebCrawler • GlobalFileSearch
DataparkSearch • Egothor • Gonzui • Grub • Ht://dig • locust • Isearch • Lucene • Lemur Toolkit & Indri Search Engine • mnoGoSearch • Namazu • Nutch • OpenFTS • Sciencenet (научная, на технологии YaCy) • Wikia Search • Sphinx • SWISH-E • Terrier Search Engine • Xapian • YaCy • Zettair
AGAKIDS (Россия) • Ask Kids (Великобритания) • Frag Finn (Германия) • Kids AOL (США) • Kids Yahoo! (США) • Quintura Дети (Россия) • Семейный Яндекс (Россия) • Гогуль (Россия)
Самые популярные поисковые системы в интернете
Сейчас трудно представить свою жизнь без поисковых систем. Абсолютно все пользователи сети интернет ежедневно ищут информацию в таких поисковиках, как Яндекс и Google. Но помимо известных поисковых систем существуют и другие достойные кандидаты.
На данный момент в России наибольшей популярностью пользуются всего два поисковика – Google и Яндекс. Однако помимо них существуют и другие всемирно известные системы поиска, которым два упомянутых лидера в чем-то даже уступают. Но прежде, чем рассматривать все существующие варианты, стоит понять, как вообще развивались поисковые системы.
Поисковики в интернете — краткая история
В начале 90-х годов, когда об интернете знали далеко не все люди, поисковики отсутствовали вовсе. Доступа к интернету у большей части населения не было, а сайтов было всего несколько сотен. В связи с этим было вполне достаточно обычных каталогов. Но позже количество сайтов начало стремительно увеличиваться и поиск в интернете стал затруднительным. Проблему нужно было как-то решать, поэтому начали появляться первые поисковые системы.
Кто был первопроходцем? Первая поисковая система — Wandex
Первой более-менее удобной и полезной поисковой системой стала разработанная в 1993 году платформа Wandex. Первый поисковик был далеко не идеален, так как в поисковую выдачу попадало все подряд. Ни о каких алгоритмах ранжирования речи не шло.
Сайтов в то время было немного больше, чем 600. В связи с этим не было необходимости в мощных серверах и каких-то сложных алгоритмах. Результаты поиска были очень неточными, поэтому каталоги составляли Wandex существенную конкуренцию.
Самые популярные поисковые системы в России и мире
Ответить на вопрос о том, какие поисковые системы наиболее популярны в России и мире сможет практически каждый человек. Их всего две – Google и Яндекс. Многие любят поспорить на тему о том, какой поисковик лучше, но в этом нет смысла, так как каждый из них имеет свои преимущества и недостатки.
Яндекс — самый популярный поисковик в России
Яндекс – это поисковая система, которая принадлежит одноименной российской корпорации и является ее основным продуктом. Одним из главных преимуществ российского поисковика является возможность осуществления поиска по конкретным регионам. В топ поисковой выдачи попадают те сайты, которые больше всего подходят каждому конкретному пользователю исходя из его местоположения. Также стоит отметить хорошую скорость работы службы поддержки.
К недостаткам относится контекстная реклама, которую вставляют куда только можно. Еще один недостаток – это капча, которая демонстрируется при большом количестве запросов, поступивших за короткий промежуток времени.
Google – самая крупная поисковая система в мире, которая была основана еще в конце 90-х годов. Она обрабатывает порядка 42 миллиардов пользовательских запросов в месяц и занимает более 90% мирового рынка. К преимуществам данной поисковой системы можно отнести:
Однако и здесь без недостатков не обошлось:
Другие поисковые системы
На Яндекс и Google поисковые системы не заканчиваются. Многие будут удивлены, когда узнают, что существует еще 14 поисковых систем. Они, конечно, не так популярны, но некоторые из них имеют очень даже весомые преимущества.
Mail.ru
Мало кто знает, но на портале Mail.ru есть не только сервис «Ответы», почта и «Мой мир», но и поисковая система, которая работает на собственном движке. Ее характерная особенность заключаются в возможности поиска по социальным сетям.
Преимущество заключается в том, что прямо из поисковика вы можете перейти к сервису «Ответы». Из недостатков стоит отметить сравнительно небольшой поисковый индекс.
Rambler
Многие считают, что Rambler чуть ли не одна из худших поисковых систем, но на самом деле все иначе. К ее преимуществам стоит отнести продвинутую систему ассоциаций. К недостаткам можно отнести то, что в ленту часто попадают новости, которые абсолютно не интересны пользователю. Также есть некоторые проблемы с работой службы поддержки.
Данная поисковая система существует чуть больше 10 лет. Чаще всего она используется в качестве основного поисковика владельцами смартфонов, работающих на базе операционной системы Windows. Большая часть пользователей Bing – это граждане США.
Nigma
Данная поисковая система ищет информацию по индексам трех крупных поисковиков – Google, Яндекс и Bing, а также применяет свои собственные поисковые алгоритмы. Благодаря этому результаты поиска получаются наиболее релевантными. Большим плюсом является то, что прямо в этом поисковике можно решать задачи по математике и химии. Среди недостатков стоит выделить отсутствие отображения иконок сайтов, низкая скорость загрузки и пользовательский интерфейс, в котором можно легко запутаться.
WebAlta
Данная поисковая система относительно молодая, поэтому о ней слышали далеко не все.
Но есть и недостатки, которые куда более весомее преимуществ:
Yahoo
Yahoo – это один из наиболее старых поисковиков. Данная поисковая система использует те же алгоритмы поиска, что и Bing, поэтому претензий к поисковой выдаче нет. Среди недостатков стоит отметить большое количество рекламы, а также относительно низкую скорость поиска.
DuckDuckGo
Разработчики сделали все возможное, чтобы обеспечить своим пользователям максимальную приватность и конфиденциальность. В этом и заключается основное преимущество – в отсутствии сбора и хранения пользовательских данных. Также здесь минимум рекламы. Среди недостатков стоит отметить отсутствие голосового поиска и поиска по изображениям.
Not Evil
Данный поисковик осуществляет поиск по анонимной сети Tor. К его преимуществам можно отнести уникальность найденной информации и интуитивно понятный пользовательский интерфейс. Ключевой недостаток заключается в том, что этот поисковик можно использовать только в рамках браузера Tor.
Данная пусковая система является свободно распространяемой. Ее ключевая особенность заключается в отсутствии центрального сервера. YaCy не подвергает результаты поиска какой-либо цензуре, что для многих является важным преимуществом. Из недостатков стоит отметить относительно низкую скорость поиска, а также то, что этот поисковик не ищет различные словоформы.
Данная поисковая система позволяет искать информацию о людях и справляется с этим намного лучше других поисковиков. Среди недостатков стоит отметить ограниченные возможности этой поисковой системы на территории России. Пока что полноценно использовать ее можно только на территории США.
FindSounds
Эта поисковая система специализируется на поиске конкретных звуков в открытых источниках. Она уникальна в своем роде, поэтому пользуется большой популярностью. К ее недостаткам можно отнести перегруженный пользовательский интерфейс, а к преимуществам — возможность настроить качество звука и скачать найденное аудио.
WolframAlpha
Данный поисковик подойдет тем, кто профессионально занимается различными вычислениями. В ответ на конкретный вопрос эта поисковая система выдаст вам массу графиков, таблиц, диаграмм и т.д. В ней удобно искать информацию об известных личностях, работать с датами и проводить сравнительный анализ. К сожалению, поисковик полностью на английском языке.
Dogpile
Dogpile работает с индексами сразу нескольких поисковых систем, что улучшает качество предоставляемых результатов. Иногда с ее помощью можно найти то, чего не нашлось в том же Яндексе. К преимуществам этой платформы можно отнести минимум рекламы. Недостатком является то, что Dogpile не исключает повторы в предоставляемой поисковой выдаче.
BoardReader
С помощью этого поисковика удобно искать информацию в социальных сетях, на форумах и сервисах вроде «Ответы» от Mail.ru. Результаты поиска можно фильтровать по различным критериям. Такая система поиска подойдет далеко не всем, но будет настоящим кладом для людей, которые работают в сфере SMM.
Советы и выводы
На сегодняшний день в мире существует 16 действующих поисковых систем, и каждая из них предназначена для каких-то определенных задач. Нельзя однозначно сказать, какая из них самая лучшая. Среднестатистическому пользователю наиболее удобным поисковиком покажется Яндекс или Google, а некоторые предпочтут DuckDuckGo из-за ее приватности.
Пожалуйста, оставляйте свои отзывы по текущей теме материала. За комментарии, отклики, подписки, дизлайки, лайки низкий вам поклон!
Пожалуйста, оставьте ваши мнения по текущей теме материала. Мы очень благодарим вас за ваши комментарии, дизлайки, отклики, лайки, подписки!