Навигация
Главная
Новости
Информация
Web Мастеру
Софт
Игры
Фильмы
Музыка mp3
Книги
Игры Online
Flash Игры
Каталог сайтов
Видео приколы
Фото приколы
Анекдоты
Обои
Магазин CD дисков





купить сайт в зоне me


 


       World Wide Web (WWW) - одна из наиболее динамично развивающихся технологий передачи и представления данных в глобальных сетях. Число Web-серверов постоянно увеличивается, и разбираться в этом многообразии все труднее. Шансы отыскать нужную информацию, просто двигаясь по гиперссылкам со странички Internet-провайдера, очень малы, плохим помощником является реклама в газетах и на телевидении, мало помогают и разговоры с друзьями - всей этой информации просто недостаточно. Короче говоря, если вы вошли в город WWW без карты, вы уже заблудились... Что же является такой "картой"?
       Помочь пользователю найти нужную информацию, призваны поисковые системы (Search engines). Пользователь вводит одно или несколько ключевых слов, которые по его мнению лучше всего отражают суть интересующего вопроса, поисковая система же за считанные секунды просматривает свой каталог web-страниц, состоящий из десятков и сотен гигабайт информации. В результате пользователю предлагается список страниц, в которых встретились указанные слова. Эта базовая схема поиска реализована с разнообразными улучшениями и расширениями на всех рассмотренных поисковых системах. В частности, есть системы, позволяющие вводить запрос на естественном языке ("Что известно об освоении Аляски"), системы, в которых реализованы тематические каталоги для облегчения поиска, и т.д. Кроме того, почти все системы предпринимают попытки интеллектуального анализа содержимого страниц для улучшения качества поиска.

       Все поисковые системы (поисковые службы, поисковые серверы) делятся на поисковые машины (роботы, указатели) и поисковые каталоги. Понимание разницы между ними очень поможет при выборе инструмента поиска. Поисковые машины - это системы, состоящие из 2 частей. Одна из них (с ней работает пользователь) осуществляет поиск в своем справочнике Web-страниц (он называется индексом). Другая часть - это сложная программа, которая постоянно связывается с Web-серверами во всем мире, загружает с них все доступные документы, анализирует содержимое и включает документы в индекс. Эта часть системы называется краулером (crawler- "ползун"). В отличие от поисковых машин, информация в поисковые каталоги добавляется только по инициативе человека. Страница добавляется в строго определенный раздел каталога, который связан с темой, освещаемой на странице. Из таких разделов образуется мощный рубрикатор, двигаясь по которому можно обнаружить страницы почти по любой популярной теме. Впрочем, не обязательно двигаться по темам, в любом солидном каталоге есть система поиска, в которой также можно ввести ключевые слова. Когда нужно пользоваться каталогами, а когда машинами? Если разыскивается популярная информация общего назначения, например "какая-нибудь программа для чтения почты", то лучше подойдет каталог - в нем можно найти десятки сайтов, посвященных таким программам, кроме того, на многих каталогах существуют краткие обзоры сайтов и программ на них. Когда тема поиска достаточно нетривиальна, например "методы машинного доения коров", лучше воспользоваться поисковой машиной - она индексирует все подряд, в том числе то, что интересно лишь узкому кругу людей. Еще одним преимуществом поисковых машин является огромный объем их индексов - в то время как лучшие из каталогов содержат десятки и сотни тысяч страниц, многие поисковые машины индексируют более 50 миллионов страниц, причем эта информация пополняется и обновляется достаточно часто. Поисковые машины с полнотекстовым индексом учитывают все слова на странице, даже не относящиеся к ее теме. Для определения, относятся ли слова к теме страницы (т.е. являются ли они релевантными), анализируется частота встречаемости слов и их месторасположение в тексте страницы. Машины с другими типами индексов используют сложные эвристические методы для определения темы страницы и подходящих ключевых слов.

Поисковая оптимизация сайта, продвижение и раскрутка сайта.

Поисковая оптимизация сайта - это комплекс работ по подготовке и размещению информации на сайте, направленный на достижение максимального результата в поисковых системах по определенным поисковым запросам.

• Шаг 1 - ключевые слова.
Составление списка востребованных ключевых слов. Это можно осуществить с помощью специальных сервисов поисковых систем. Таким образом проводится анализ спроса услуг и товаров в Интернет.

• Шаг 2 - контент.
Учитывая собранный материал по спросу в Интернет пишется тематическое текстовое наполнене сайта.

• Шаг 3 - заголовки.
К написанным текстам подбираются заголовки и описания, опять же на основе анализа спроса в Интернет и в соответствии с контентом написанных текстов.

• Шаг 4 - внутренняя структура.
Разработка (переработка) структуры и навигации сайта. Очень важно рационально расставить внутренние ссылки, выделив ключевые страницы. Правильное использование ссылок в разделах и подразделах способствует увеличению Page Range.

Продвижение сайта - комплекс мероприятий, направленный на достижение максимального результата в поисковых системах по определенным поисковым запросам.

• Шаг 1 - подготовка текстов
Для размещения в Интернете информации о сайте важно составить описания. Поисковые системы, рейтинги, каталоги, сайты-партнеры по обмену ссылками ограничивают количества символов, допустимое в описании, зачастую оно разное, поэтому рекомендуется заранее составить соответствующие заголовки и описания разного объёма. Это могут быть просто логические тексты с включением поисковых фраз и выражений, а также простые и составные текстовые ссылки. Информация в этих текстах должна соответствовать содержимому страниц вашего сайта.

• Шаг 2 - регистрация сайта в поисковых системах.
Когда основные работы по созданию сайта завершены, большая часть контента доступна для обозрения, только тогда наступает очередь регистрации сайта в поисковых системах. Не рекомендуется регистрировать недоделанный сайт, некоторые поисковые системы дают фору новичкам (Яндекс, например, любит новичков в течении одного месяца)

• Шаг 3 - регистрация сайта в каталогах.
Каталоги принесут на ваш сайт целевую аудиторию, а также поднимут индекс цитирования (PR - кому он важнее) в большинстве случаев.

• Шаг 4 - подбор авторитетных сайтов.
Определение сайтов близкой тематики с вісиким индексом цитирования или Page Rank и размещение на нём информации о своём сайте. Может быть осуществлено как на платной, так и на бесплатной основе, в последнем случае обычно необходимо поставить обратную ссылку.

• Шаг 5 - обмен ссылками.
Обмен ссылками с тематическими ресурсами способствует росту индекса цитирования и Page Rank сайта, увеличивая количество внешних ссылок на сайт. Рекомендуется наличие специального раздела для размещения ссылок на сайты-партнёры.

Обзор наиболее известных систем

В данном обзоре рассмотрены крупнейшие системы поиска, обеспечивающие быстрый и высококачественный поиск документов со всего мира. Именно ими пользуется подавляющее большинство пользователей. Каждая из систем обеспечивает многогранный и качественный сервис, причем совершенно бесплатно и без регистрации. Обзор призван помочь вам выбрать инструмент, с помощью которого вы найдете нужную информацию наиболее быстро с минимальными затратами сил.

Altavista

Тип: поисковая машина с полнотекстовым индексом
URL: http://www.altavista.digital.com
Индексируемые ресурсы: WWW, UseNet, файлы изображений, JAVA и OCX ресурсы
Поиск русских ресурсов: отличный, есть даже русская версия интерфейса
Владелец: Digital Equipment Corporation.

Одна из наиболее популярных поисковых систем Altavista Search появилась в декабре 1995 года. Первоначально она задумывалась как демонстрация мощи 64-разрядного сервера Alpha APX корпорации Digital Equipment, однако быстро приобрела самостоятельное значение как эффективное и мощное средство поиска. По последним данным, на сегодняшний день в индексе Altavista зарегистрировано до 100 миллионов URL. Система поражает своим быстродействием - в сутки она обслуживает более 20 миллионов запросов, при этом она отвечает на запросы незамедлительно, без всякого "притормаживания". Благодаря таким характеристикам система используется не только конечными пользователями, но и другими службами поиска, в частности, каталогом Yahoo. Система обновления индекса - краулер - посещает WWW сервера во всем мире, не испытывая проблем с языковым многообразием, поскольку Altavista поддерживает поиск на 25 языках. Странички, обновляемые редко, посещаются краулером реже чем популярные и часто обновляющиеся страницы. К сожалению, автоматически из индекса никогда не удаляются "мертвые" ссылки, поэтому по некоторым запросам количество недействующих ссылок может быть довольно велико (до 12 %). Дизайн у системы простой и удобный - в центре экрана находится окно с полем ввода запроса и кнопками "Search" и "Refine", немного ниже - ссылки на расширенный поиск, помощь, информацию о системе и страницу с настройками. Сервер не перегружен рекламой и графикой, поэтому все странички загружаются очень быстро. Даже начинающий пользователь мгновенно освоит технологию построения простого запроса к Altavist'e. К сожалению, на этом список преимуществ системы Altavista для неискушенного пользователя заканчивается. На простой запрос она выдает огромное количество результатов, многие из которых совершенно не имеют отношения к интересующей пользователя теме, а составление сложных (расширенных) запросов требует освоения специального языка, что для многих пользователей неприемлемо. Результаты поиска отсортированы с учетом частоты встречаемости ключевых слов в документе, учитывается также раздел, в котором встречается ключевое слово (заголовок, название страницы, и т. д.), однако не производится сортировка по тематике - Altavista попросту не поддерживает концепцию темы. Поэтому, например, в результатах поиска по слову Scala будут соседствовать странички, посвященные известной бухгалтерской программе и странички об одноименной мультимедийной системе. Несколько улучшает ситуацию с простым поиском имеющаяся в системе Altavista функция Refine (уточнить). На страничке с результатами поиска нужно нажать Refine, после чего появится список терминов, которые наиболее часто встречаются в одном контексте с ключевым словом. Возле каждого термина есть выпадающий список, в котором можно выбрать, относится ли это слово к теме поиска или нет. После такого уточнения, как правило, релевантность верхних ссылок в результатах поиска резко повышается. Из всего вышесказанного следует, что Altavista не является оптимальным средством для простого поиска. Хотя результат, безусловно, будет достигнут, затраты времени на его получение будут довольно велики. Сильные стороны этой системы проявляются, когда пользователю необходимо осуществить сложный поиск с указанием многих критериев отбора или поиск редких терминов (например, поиск слова Antropomorphic). В этом случае Altavista предоставляет наиболее мощные и изощренные средства поиска среди всех рассматриваемых систем, среди которых такие уникальные средства как поиск документов на конкретном языке, поиск по названию страницы, поиск среди гиперссылок (можно узнать, например, есть ли в WWW ссылки на вашу страницу и если есть, то где), поиск объектов Java/ActiveX, поиск в "якорях" и т.д. Кроме того, Altavista обеспечивает набор более стандартных, но очень ценных критериев отбора, таких как логические операции над ключевыми словами, поиск с учетом вариантов написания слов, поиск целых фраз, поиск документов только на определенных серверах (или доменах), ограничения по дате создания документа, и т.д. Многие из этих возможностей доступны даже с основной страницы Altavista, но для задания большой группы условий придется перейти на страницу расширенного поиска, где пользователю предоставляется большое поле для ввода условий. Одним из существенных для российского пользователя факторов оценки поисковых систем является поддержка ими русских ресурсов. В этом смысле Altavista является лидером среди всех зарубежных систем - уже давно происходит активное индексирование документов на русском языке, система имеет и русский вариант интерфейса, доступный на сервере http://altavista.telia.com. Кроме того, относительно недавно стал доступен поиск с учетом русской морфологии на сервере http://www.comptek.ru/alta.html, действующий на основе поискового механизма Яndex.

Резюме: Поисковую службу Altavista целесообразно использовать для поиска редких терминов, русских ресурсов и для создания сложных запросов. Новичкам не рекомендуется, так как результаты простого поиска не слишком хороши, а для осуществления сложного нужно выучить специальный язык.

InfoSeek

Тип: каталог + поисковая машина с полнотекстовым индексом
URL: http://www.infoseek.com
http://ultra.infoseek.com
Индексируемые ресурсы: WWW, UseNet, новости, компании
Поиск русских ресурсов: удовлетворительно
Владелец: Infoseek Corp.

Поисковый сервер Infoseek начал свою работу в конце 1994 года. На сегодняшний день он содержит около 54 миллионов страниц. Одно время за доступ к полной базе данных нужно было платить, однако, сегодня это бесплатный сервис. Система является одной из наиболее универсальных - создатели самостоятельно поддерживают индексы WWW-страниц, сообщений UseNet, горячих новостей (по тематике), информацию о компаниях и корпоративных новостей. Кроме того, поддерживаются: поиск людей и даже пропавших родственников, поиск географических карт и проч. Эти возможности интегрированы в единый интерфейс, простой и понятный. Кроме того, на Infoseek находится очень неплохой каталог (его разделы называются "каналами"), в котором можно найти лучшие страницы по интересующей пользователя тематике. В хорошо продуманном интерфейсе Infoseek легко разобраться и новичку. Помимо ссылок, связанных с поиском и рекламой, есть довольно любопытный раздел "Достойно нажатия" ("Worth a click"), в котором ежедневно дается несколько ссылок на новые сайты с полезной информацией. Запросы можно формулировать на естественном языке, правда, только на английском. Возможности поиска довольно ограничены - кроме запросов с логическими операциями над терминами, других возможностей расширенного поиска нет. Одной из особенностей формирования запроса является использование спецсимволов для осуществления логических операций над терминами. Если ввести стандартные для других поисковых систем слова-связки AND и OR, то Infoseek выведет миллионы страниц, поскольку эти слова есть почти на каждой странице. Результаты поиска выводятся в очень удобной форме - результаты с одного сайта сгруппированы (выводится только один и появляется кнопка "другие результаты"), выводится "процент релевантности", отражающий вероятность того, что данный документ содержит необходимую информацию. Кроме того, в окне вывода результатов отражаются не только результаты поиска, но и ссылки, нажатием на которые можно провести поиск по ключевым словам в новостях, просмотреть связанные темы (Related topics), а также настроиться на канал, освещающий данную тему. В форме повторного поиска (Search again) есть полезная опция "искать только в уже найденных результатах", которая позволяет уменьшить количество результатов поиска, указав термины которые должны присутствовать или отсутствовать в новых результатах. Поиск русских ресурсов на Infoseek работает посредственно. Во-первых, количество русских ресурсов, проиндексированных InfoSeek'ом, довольно невелико. Во-вторых, никак не решается проблема перекодировки из одной русской кодировки в другую. Таким образом, если вы введете по-русски свои ключевые слова в кодировке Win1251, то в результатах поиска не будет ни одного документа в кодировке KOI-8. Поэтому для получения качественного результата нужно будет формулировать запрос как минимум 2 раза (в кодировках Win1251 и KOI-8). В индексе поисковой машины Infoseek функционирует механизм удаления "мертвых" ссылок, количество недействующих ссылок в результатах поиска очень мало.

Резюме: Infoseek является хорошим выбором для начинающего пользователя, хорошо владеющего английским языком - возможность формировать запрос на естественном языке, высокая релевантность верхних результатов и ссылки на сопутствующие методы поиска позволят быстро найти интересующую информацию. Система не может быть рекомендована для поиска русских ресурсов из-за отсутствия поддержки перекодировки русского текста. Обладая отличной подборкой бизнес-информации, Infoseek является хорошим выбором для поиска информации о компаниях, их местонахождении и информации о контактах.

Excite

Тип: поисковая машина + каталог
URL: http://www.excite.com
Индексируемые ресурсы: WWW, новости, Usenet, города в Internet
Поиск русских ресурсов: отсутствует
Владелец: Excite Inc.

Стартовав позже других мощных систем - в конце 1995 года - система быстро завоевала популярность, поскольку предлагает множество средств поиска в самых разных информационных средах. Среди них - WWW, новости из электронных журналов и газет, E-mail адреса, географические карты и атласы дорог, погода, котировки акций, а также такие средства как поиск и резервирование мест в отелях, транспортных средствах и т.д. Кроме того, Excite поддерживает несколько полезных служб, не связанных с поиском, среди них - система общения в реальном времени Excite Pal, бесплатный E-Mail провайдер MailExcite, служба гороскопов и многое другое. Каталог Excite содержит более 80 тысяч отобранных вручную ссылок, представляющих лучшие Internet-ресурсы в большинстве областей человеческой деятельности, каждая ссылка сопровождается кратким комментарием (3-4 строки). Именно на Excite было впервые введено понятие тематических "каналов" (см. описание Infoseek). Поисковая машина Excite индексирует более 50 миллионов документов, индексация производится по полному тексту. Среди всех зарубежных систем, Excite дает самую высокую релевантность результатов для простого поиска. Это связано с тем, что в Excite реализована уникальная эвристическая система обработки запросов Intelligent Concept Extraction (tm) - по введенным ключевым словам Excite пытается определить, что пользователь имел ввиду и ищет по смыслу, а не только по словам. Благодаря этому, пользователь может получить качественные результаты поиска, даже если искомые страницы не содержат введенных ключевых слов. К сожалению, система эта работает только для английского языка и является уникальной - российских аналогов не существует. Из такой особенности Excite вытекает два интересных следствия. Во-первых, можно осуществлять поиск на естественном языке, например, ввести "What is the biggest library in New-York" ("Какая библиотека является самой большой в Нью-Йорке"). Excite не только найдет нужные страницы, но и предложит несколько карт и справочников по Нью-Йорку. Во-вторых, Excite может помочь пользователю в необычных видах поиска, например можно ввести (приблизительно) цитату, чтобы получить ссылки на страницы, посвященные ее автору. На странице результатов поиска Excite выводит найденные документы с группировкой по сайту, для каждого результата выводится процент релевантности. Возле каждого результата есть ссылка "приблизительно это" ("More Like This"), которая позволяет уменьшить количество результатов, оставив среди них только "похожие" на выбранный. Кроме того, под строкой для нового поиска выводятся несколько слов, наиболее часто встречающихся в найденных документах - можно выбрать некоторые из них (отметить релевантные) для уменьшения количества результатов. Интересной особенностью Excite является адресная реклама - рекламный баннер на странице с результатами поиска зачастую связан с темой поиска. Возможности расширенного поиска на Excite реализованы на базовом уровне. Помимо стандартных логических операций над терминами, присутствует только ограничение области поиска одной из категорий (3-4 региональных базы Excite, Usenet, News, WWW). С помощью скобок и спецсимволов прямо в строке ввода на основной странице можно ввести слова и фразы, которые должны присутствовать, должны НЕ присутствовать в документе, альтернативные ключевые слова и тому подобное. Для тех, кто не хочет разбираться в сложностях синтаксиса запроса, есть "Мощный запрос" ("Power Query"), на страничке с которым можно построить свой запрос, выбирая условия и логические операции из выпадающих списков. К сожалению, все это великолепие поисковых ресурсов и интеллектуальных возможностей поиска ориентировано только на английский язык. Excite вообще не поддерживает русского языка. Очень интересной возможностью Excite является возможность персонализации страницы. Зарегистрировавшись, пользователь получает персональную страничку, на которой присутствует панель поиска Excite, свежие новости по темам, интересующим подписчика и проч. Внешний вид страницы можно менять по своему вкусу.

Резюме: Эта богатая поисковая система является идеальным выбором для простого поиска на английском языке или для поиска по темам, в которых ключевые слова не очень хорошо отражают суть темы поиска.

HotBot

Тип: поисковая машина с полнотекстовым индексом + каталог
URL: http://www.hotbot.com
Индексируемые ресурсы: WWW, файлы изображений, аудио, Shockwave
Поиск русских ресурсов: отсутствует
Владелец: HotWired

Новичок среди сверхмощных поисковых систем, Hotbot как и AltaVista, представляет собой еще один плод исследований в области сверхбыстрой масштабируемой архитектуры серверов: здесь применяется кластеризация стандартных рабочих станций, суммарная вычислительная мощность которых позволяет достичь скорости суперкомпьютера. Система индексирует более 55 миллионов страниц, получив начальную базу данных, краулер и систему поиска от известной корпорации Inktomi. HotBot объединяет поиск различных видов данных и различных ресурсов - UseNet, горячие новости, E-Mail адреса и проч. Однако при этом используются базы данных других поисковых служб - сам HotBot поддерживает только индексы по WWW страницам и мультимедийным файлам данных. В HotBot сосуществуют поисковая машина и каталог, что является наиболее эффективной системой - если пользователь не уверен в том, какие ключевые слова отражают тему поиска, он может с помощью тематического дерева найти лучшие ресурсы по заданной тематике, классифицированные и откомментированные специалистами из Hotwired. Если же нужная информация с трудом поддается классификации или довольно редка, используются возможности поисковой машины. Краулер Slurp, используемый на HotBot, может обновлять до 10 миллионов страниц в сутки, поэтому данные на HotBot, как правило, довольно свежи. Многоцветный дизайн, используемый на HotBot, чересчур стилизован, но хорошо продуман - пользователь не "потерятся" на странице. Для осуществления расширенного поиска нужно использовать маленькую текстовую гиперссылку SuperSearch. По сравнению с Altavista, результаты простого поиска на HotBot зачастую более релевантные и свежие, кроме того, за счет автоматического поиска словоформ этих результатов по многим запросам несколько больше, чем на Altavista и на Infoseek. Результаты с одного сайта, а также одинаковые документы с разных "зеркал" объединены в одну группу, что существенно облегчает навигацию. Возле каждого результата стоит число, которое показывает степень релевантности результата теме поиска. Расширенный поиск в HotBot не обладает мощью Альтависты, но для повседневных потребностей его более чем достаточно. В отличие от Altavista, все возможности поиска реализованы с помощью полей ввода и выпадающих списков, а не с помощью специального языка, поэтому составление сложных запросов для HotBot гораздо более доступно для начинающего пользователя - все возможности на виду. Среди них такие возможности как включение и исключение ключевых слов и фраз в поиск, ограничения по дате и типу документов (например, только аудиофайлы), локализация поиска (определенный домен или сервер) и проч. Скорость HotBot несколько ниже чем у Altavista или Infoseek, иногда сервер даже не отвечает 15-20 секунд, поэтому сложный поиск, когда производится неоднократное уточнение ключевых слов и повторный поиск, может затянуться. Одним из основных недостатков HotBot является отсутствие поддержки русских ресурсов - единственная поддерживаемая кодировка это ISO-8859-1, поэтому в индекс попадают только документы на европейских языках.

Резюме: Данная служба эффективна для не очень сложного поиска среди зарубежных ресурсов, кроме того, HotBot будет полезен новичкам при необходимости задать несколько сложных условий для поиска, поскольку это делается в удобной и наглядной форме. Система неприемлема для поиска русских ресурсов.

Lycos

Тип: поисковая машина + каталог
URL: http://www.lycos.com
Индексируемые ресурсы: WWW, файлы изображений, аудио, многое другое
Поиск русских ресурсов: плохо
Владелец: Lycos, Inc. (child company of Carnegie Mellon University)

Поисковая система Lycos объединяет поисковую машину с объявленным объемом индекса в 66 миллионов страниц и каталог, содержащий превосходную подборку аналитических обзоров, приобретенных у компании Point Communications. Краулер Lycos индексирует документы не по полному тексту, а с помощью оригинального алгоритма, разработанного в Carnegie Mellon University, основанного на использовании специальных методов статистического анализа. Этот алгоритм довольно успешно решает задачу определения, какие слова в документе относятся к его тематике, а какие нет. Благодаря этому даже простой поиск на Lycos как правило дает высокорелевантные результаты. Но если полученные результаты не устраивают пользователя, то уточнение терминов не приводит к существенному повышению релевантности. Еще одним недостатком системы поиска на Lycos является ее низкое быстродействие - среди всех рассмотренных систем Lycos работает наиболее медленно. С помощью Lycos можно искать довольно широкий спектр ресурсов - прямо с титульной страницы можно выбрать область поиска: WWW, top 5% (сайты, снабженные обзорами), картинки, звуки, Web сайты (поиск в URL), личные странички, книги, группы новостей (Usenet). Выбрать из списка можно только 1 вариант, т.е. нельзя, например, одновременно искать в WWW и Usenet. Следует отметить, что Lycos рассматривает введенные слова как корни терминов, поэтому при поиске, например, слова "graph" (граф) Lycos покажет и результаты, содержащие слова "graphics", "graphical" и т.д. Для блокировки этой функции надо заканчивать слова точкой. В результатах поиска Lycos выводит ссылки, отсортированные по релевантности. Иногда оказывается, что большинство ссылок, которые Lycos считает таковыми, на самом деле вовсе не относятся к теме поиска. К счастью, такая ситуация встречается не очень часто. Для группировки результатов с одного сайта необходимо нажать на соответствующую ссылку. После результатов поиска Lycos предлагает целых две панели для ввода ключевых слов. Первая называется "refine" ("уточнить") и предназначена для уменьшения количества результатов. Можно вводить слова, которые должны присутствовать в документе и слова, которых там НЕ должно быть. Вторая панель предназначена для задания условий нового поиска. Относительно недавно на Lycos появился "расширенный поиск", в связи с этим на страничке результатов поиска появились 3 ссылки, нажав на которые можно поискать введенные ключевые слова в названиях страниц, в URL, и т.д. Довольно оригинальной особенностью Lycos является то, что он предлагает пользователю "Расширенный поиск" и "Мощный поиск" (Advanced Search & Power Search) одновременно. Расширенный поиск включает: поиск в URL, поиск в названиях страниц и поиск в пределах одного сайта. Последнюю возможность вебмастер может использовать для создания системы поиска внутри своего сайта. Мощный поиск на Lycos предлагает немного необычные средства сужения запроса - пользователю предлагаются такие критерии для ключевых слов как "Слова появляются в названии", "Слова расположены в тексте достаточно близко", "Слова расположены точно в указанном порядке", "Слова часто употребляются", причем для каждого из этих критериев нужно указать его значимость по 3-балльной шкале (от "min" до "max"). Таким образом, за целыми двумя (!) страницами расширенного поиска скрывается не так уж много средств уменьшить количество результатов, более того, с помощью этих средств довольно трудно повысить релевантность результатов после простого поиска. Поэтому использование Lycos для сложного поиска нецелесообразно. Поскольку краулер в Lycos ориентирован на английский язык, поиск русских ресурсов в этой системе "хромает". Количество проиндексированных русских ресурсов очень невелико. Никак не решается проблема перекодировки запроса из одной русской кодировки в другую. И, конечно, результаты статистического анализа текста неверны, поскольку Lycos не знает ничего о русской морфологии.

Резюме: Система Lycos обладает широким спектром средств для поиска разнообразных данных в Internet. Высококачественный каталог и индекс таких ресурсов как личные странички, изображения и звуки, позволяют рекомендовать ее для поиска специальных видов данных.

Webcrawler

Тип: поисковая машина с полнотекстовым индексом + каталог
URL: http://www.webcrawler.com
Индексируемые ресурсы: WWW
Поиск русских ресурсов: плохо
Владелец: Excite Inc.

Webcrawler - старейшина среди полнотекстовых поисковых систем. Его создатель - знаменитая компания America Online (AOL), одна из первых создала краулер, обследующий WWW, и смогла приложить достаточное количество усилий, времени, денег, чтобы наполнить его базу миллионами ссылок. Однако на сегодняшний день Webcrawler уже не является собственностью AOL, система была куплена Excite. Система Webcrawler широко известна среди ветеранов WWW, особенно в Америке. Webcrawler осуществляет поиск не только в WWW, он является интерфейсом к поиску Gopher и поиску по FTP. Интерфейс у Webcrawler очень простой и понятный. Он несколько напоминает Excite. На основной странице помимо поля ввода запроса присутствуют: список каналов (рубрик каталога), четыре кнопки для получения помощи, отправки E-Mail и т.д, а также несколько "новостей дня". Каталог у Webcrawler по структуре схож с каталогом на Excite, хотя и имеет больше разделов, существует и аналогичная Excite возможность настройки, создания "своего канала", где будут выводиться только интересующие пользователя новости и т.д. Система поддерживает не только запросы с полным набором логических операций над словами, но и запросы на естественном языке. Объем индекса на Webcrawler меньше чем у других рассмотренных систем, однако, на простые запросы Webcrawler выдает гораздо больше релевантных результатов, чем, например, Altavista. При составлении запроса для Webcrawler следует помнить, что по умолчанию он использует логический оператор ИЛИ, т.е. запрос "Максим Фрай" интерпретируется как "Максим ИЛИ Фрай" - на странице должно присутствовать ХОТЯ БЫ одно из этих слов. Хотя документы, в которых присутствуют оба слова, появляются первыми, такой подход снижает релевантность результатов. Результаты поиска на Webcrawler по умолчанию выдаются в очень компактной форме - выводится только заголовок страницы, являющийся гиперссылкой на нее и процент релевантности. Для того чтобы изменить вид вывода результатов, надо перейти на отдельную страницу, эту операцию приходится повторять после каждого поиска. Если критерию поиска удовлетворяют страницы из каталога, то возле ссылки на страничку появляется ссылка "обзор" ("review"). Кроме того, в правой части страницы с результатами поиска выводится несколько иконок, нажав на которые, можно поискать ключевые слова в базе данных книг, просмотреть карту (если было упомянуто географическое название), и т.д. Для тех, кто не нашел необходимой информации, в самом низу страницы есть ссылка "Искать на Excite" ("Search on Excite"). Поиск русских ресурсов на Webcrawler теоретически возможен, но количество проиндексированных страниц так мало, что складывается впечатление, что они туда попали по чистой случайности.

Резюме: Система Webcrawler используется в основном ветеранами Internet в силу привычки. Очень малое количество русских ресурсов и схожесть каталога с Excite делают нецелесообразным освоение этой системы начинающим российским пользователем.

Yahoo!

Тип: каталог
URL: http://www.yahoo.com
http://www.yahooligans.com
Индексируемые ресурсы: WWW, Usenet, новости, специальные виды ресурсов
Поиск русских ресурсов: удовлетворительно
Владелец: Yahoo Inc.

Удивительно, но эта невероятно популярная система, обслуживающая миллионы запросов ежеденевно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг. На сегодняшний день Yahoo, это уже не просто каталог, это целая группа разнообразных сервисов, среди которых такие как каталог Yahooligans - Yahoo для детей, система персональых каналов My Yahoo, бесплатный E-mail сервис, система "Shop with Yahoo" (покупайте с Yahoo), совместный с MTV проект MTV unfURLed и многое другое. Среди всех рассмотренных систем, Yahoo - единственная чисто каталоговая, на Yahoo нет собственной поисковой машины. Зато список категорий на Yahoo является наиболее полным и простым - в отличие от других каталогов, на Yahoo всегда легко определить, в каком разделе находится нужная информация. Заглавная страничка Yahoo грузится очень быстро - хотя на ней очень много ссылок, но все они текстовые. Центральная часть страницы, конечно, занята окном поиска и списком категорий. Ссылки вверху страницы (графические) обеспечивают доступ к такой информации, как "что нового", "что хорошего", "More Yahoos". Последнюю ссылку рекомендуется посетить - она приводит на страницу с огормным количеством ссылок на разнообразные Yahoo-каталоги и сервисы. В нижней части основной страницы Yahoo расположено большое количество ссылок на наиболее популярные разделы Yahoo. При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу "Intelligent default", то есть Yahoo ищет наиболее подходящие результаты в таких областях: в категориях Yahoo; в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях. Такой интеллектуальный поиск занимает довольно много времени. При задании критериев поиска для Yahoo нужно помнить, что Yahoo ищет эти слова только в названии и описании страницы, поскольку полнотекстового индекса на Yahoo нет. Поэтому не следует указывать при поиске слишком много терминов или синонимов - количество результатов с Yahoo снизится или даже будет нулевым. При вводе ключевых слов со страницы каталога, нужно выбрать область поиска - весь каталог Yahoo или только его текущий раздел. Это делается с помощью радиокнопок под полем ввода. На странице с результатами поиска выводятся сначала удовлетворяющие критерию поиска категории, а потом сайты. Возле каждой категории в скобках стоит число - это количество сайтов в данной категории. В случае если на Yahoo нет результатов, сразу выводятся результаты с Altavista. Вверху и внизу страницы выводится маленькая табличка, с помощью которой можно одним нажатием кнопки мыши произвести поиск в категориях Yahoo, на Altavista, в новостях и событиях. Количество результатов поиска на Yahoo, естественно, невелико, зато большинство из них являются релевантными. Возможна проблема с отсутствующими страницами, поскольку вебмастера обычно забывают удалить свои сайты с поисковых систем, а на Yahoo нет механизма автоматического обновления. Для расширенного поиска Yahoo предлагает не очень большой, но очень полезный набор инструметов. Чтобы попасть на страничку расширенного поиска, надо перейти по ссылке "options" с основной страницы Yahoo. Среди средств расширенного поиска - ограничение результатов по дате, поиск в Yahoo, Usenet и среди E-mail адресов, использование логических операций над терминами и поиск конкретной фразы. Также присутствует возможность искать слова с произвольными окончаниями, указывать слова, которые должны или НЕ должны присутствовать в документе, и т.д. Чисто русские ресурсы в Yahoo не добавляются, потому что в Yahoo Inc. просто некому смотреть и оценивать их содержимое. Но те запросы, которые не дали результатов на Yahoo передаются на Altavista, а там есть хороший индекс русских ресурсов.

Резюме: Yahoo - идеальное средство для новичка в Internet. Понятный каталог и множество дополнительных ресурсов сделают поиск общеупотребительной информации быстрым и несложным делом, а результаты с Altavista помогут найти русские и редкие ресурсы. Искать по-русски Все вышеописанные системы имеют огромные индексы, высокое быстродействие, разнообразный набор средств для задания критериев поиска. Но весь этот арсенал становится частично или даже полностью неэффективным, когда приходится искать ресурсы на русском языке. Это связано с многочисленными отличиями русского языка от языков романской группы (особенно английского), на которые ориентированы эти системы. Среди проблем - множество кодировок для русского языка и особенности русской морфологии. Неудивительно, что как только объем информации в российской части Internet стал достаточно большим, появились на свет российские каталоги и поисковые машины.

Rambler

Тип: поисковая машина с полнотекстовым индексом
URL: http://www.rambler.ru
Индексируемые ресурсы: WWW, Usenet (Relcom)
Владелец: Stack Ltd.

Rambler - одна из самых молодых поисковых машин (осень 1996 г), авторы которой учли опыт и ошибки предыдущих попыток создать поисковую машину. На сегодняшний день это самая мощная и самая популярная поисковая машина в российской части Internet. Объем ее индекса - более 2 миллионов страниц, ежедневно добавляется и обновляется более 10 тысяч новых документов и статей из бесплатных групп Relcom. Rambler поддерживает все кодировки русского языка, обладает высоким быстродействием, кроме того, в последнее время система функционирует постоянно и работает очень стабильно, что для российских систем такого типа пока является достижением а не нормой. На Rambler функционирует также рейтинговая система Rambler's Top 100 (http://www.rambler.ru/top100), в которой можно найти наиболее посещаемые сайты по определенной тематике. Возможно, это когда-нибудь станет полноценным каталогом. Интерфейс у Рэмблера простой и понятный - в центре экрана находится поле ввода и две большие кнопки - "Go" и "Advanced" (почему-то не переведенные на русский язык), с их помощью можно начать поиск по запросу и перейти к расширенному поиску. Слева несколько ссылок позволяют перейти к справочной информации, ссылки вверху страницы позволяют сменить кодировку для русского текста. Запросов на естественном языке Рэмблер не поддерживает, поэтому надо вводить ключевые слова, желательно без окончаний. К услугам пользователя ввод масок (?- любая буква, * - любое окончание слова). На странице результатов поиска Рэмблер выводит исчерпывающую информацию по каждому результату - ссылка, название страницы, размер страницы, кодировка, контекст в котором встречается слово и процент релевантности. Кроме того, выводится количество результатов для всех частичных поисков (совпадение 1 слова), нажав на соответствующую ссылку эти результаты можно просмотреть. К сожалению, релевантность результатов для простого поиска на Rambler оставляет желать лучшего. Средства для сложного поиска на Rambler довольно многообразны - Rambler является лучшим кандидатом на звание "Русская Альтависта". Помимо стандартных логических операций над терминами, предлагаются такие средства как назначение весовых коэффициентов словам (для этого перед словом нужно поставить несколько плюсов - очень желательно присутсвие слова - или минусов - слово нежелательно), поиск только в определенной части документа, поиск по URL.

Резюме: Поисковая система Rambler является лучшим выбором для осуществления сложного поиска в российской и экс-СССР части Internet. Для поиска высококачественной информации по общей тематике можно воспользоваться рейтингом Rambler's Top 100.

Russia On the Net

Тип: каталог (на английском языке)
URL: http://www.ru
Индексируемые ресурсы: WWW
Владелец: Demos Co. Ltd.

Один из первых каталогов в российском Интернете, создан и подерживается компанией Демос. Как ни странно, до недавнего времени этот каталог выполнен на английском языке, хотя представленные в нем ресурсы - русскоязычные. Список категорий в каталоге довольно небольшой - всего 9 основных разделов: "Культура и искусство", "Бизнес", "Хобби, отдых и развлечения", "Компьютеры и Интернет", "Средства массовой информации", "Наука и образование", "Справочная информация", "Политика и право", "Персональные страницы". Русская и английская версия каталогов различаются по содержанию, поэтому надо просматривать обе версии. Поиск работает и в английский и в русской базе данных одновременно, надо только включить соответствующую опцию возле поля ввода запроса. Система поиска очень простая - не поддерживается расширенный поиск и логические операции над терминами. В связи с тем, что база данных каталога не очень большая, можно вводить одно два ключевых слова и не бояться утонуть в тысячах ссылок.

Резюме: Эта система очень полезна при поиске серверов солидных российских компаний, популярных электронных средств массовой информации и проч.

Апорт + Ау

Тип: поисковая машина с полнотекстовым индексом + каталог
URL: http://www.aport.ru
http://www.au.ru
Индексируемые ресурсы: WWW
Владелец: Agama Ltd.

Новая двойная звезда на небосклоне российского Интернета - поисковая машина Апорт (более 1.2 миллионов документов) и каталог Ау (6000 страниц + 4000 в работе) являются пока молодыми проектами, которые претерпевают много изменений, поэтому рассказывать о них довольно трудно. Но уникальные возможности этих систем делают их полезнейшими инстументами для исследования российской части Internet. Простой поиск на Апорт осуществляется с учетом русской морфологии (разыскиваяются все формы введенных слов) и включает в себя такое уникальное средство, как перевод запроса и результатов поиска. Эта система, созданная при помощи фирмы ПроМт, позволяет искать документы на двух языках сразу и выводить все результаты на русском языке. Существует 3 формы вывода результатов, даже "минимальная" форма вывода кажется несколько громоздкой - помимо названия и URL документа, выводится его размер и графическое представление релевантности в виде полосы. Для каждого результата доступна функция "реконструкция документа", которая позволяет получить представление о его содержании, даже если сам документ недоступен, например, уничтожен. Расширенный поиск позволяет осуществлять все логические операции над ключевыми словами и даже указывать максимальное расстояние (в словах или предложениях) между терминами.

Резюме: Апорт и АУ являются перспективными разработками для поиска в российской части Internet, полезность которых будет расти по мере наполнения их баз данных.

Яndex

Тип: поисковая машина с полнотекстовым индексом
URL: http://yandex.ru
Индексируемые ресурсы: WWW
Владелец: CompTek

Фирмой CompTek довольно давно разработана система Яndex, позволяющая создавать поисковые службы, учитывающие особенности русской морфологии. Но только недавно этой фирмой была открыта своя поисковая машина, демонстрирующая мощь этой технологии. Сегодня в индексе системы содержится около 2 миллионов URL. Простой поиск, доступный с главной страницы, позволяет формулировать запрос на естественном языке (примеры запросов приведены под полем ввода), не утруждая пользователя необходимостью ломать голову над построением запроса. Результаты такого поиска имеют высокую релевантность, что еще раз доказывает эффективность анализа документов в Яndex. Тем кому нужно построить сложный запрос, придется выучить довольно сложный язык задания запросов, но эта затрата времени будет оправдана. Среди возможностей Яndex - указание расстояния между словами (расстояние в словах, предложениях, абзацах), назначение словам весовых коэффициентов, задание уточняющих выражений, ограничение поиска только фрагментом документа и проч. Результаты поиска выводятся в очень компактной форме, но при этом выводится вся необходимая информация - название и URL документа, размер и кодировка, контекст, дата и время создания. Кроме того, возле каждого результата есть ссылка "найти похожие документы", помогающая уточнить тему поиска.

Резюме: Яndex является хорошей отправной точкой для простого поиска в российском Интернете. Кроме того, эта система незаменима, когда нужно задать сложные связи между ключевыми словами в качестве критерия поиска.





 
 
 
Copyright © 2005 all Rights Reserved.