Методы поиска и анализа информации
Методы поиска и анализа информации
1. За чем мы ходим в Internet?"
В этом разделе мы ответим на следующий вопрос: если мы используем Internet для поиска информации, то какую именно информацию мы можем там найти?
Что говорит статистика?
Вновь обратимся к опыту тех, кто уже использует Internet в своей деятельности. Один из ресурсов сети, специализирующийся на проведении опросов по заказам пользователей (этот же ресурс может оказаться полезным и для Вас, если Вы когда-нибудь решите сами провести опрос), провел исследование с целью узнать, информацию по каким направлениям пользователи чаще всего ищут через Internet? Ответы приведены в алфавитном порядке и напротив каждого из них указан процент участников (из общего числа 100%), которые отметили данное направление.
Какая информация в Internet для Вас наиболее интересна?
Бизнес |
31% |
Дом, семья |
18% |
Интернет |
42% |
Компьютеры |
29% |
Культура и искусство |
20% |
Медицина и здоровье |
19% |
Наука и образование |
25% |
Общество |
27% |
Развлечения, отдых |
44% |
Информация справочного характера (погода, курсы валют, расписание движения поездов, самолетов и др.) |
23% |
Другое |
5% |
Необходимо заметить, что это мнение достаточно активно "живущей" в Internet аудитории, так как опрос проводится на сервере голосований. Для участия в голосовании требуется заполнить соответствующую анкету, что уже предполагает некоторую заинтересованность и активность участников опроса.
Ниже приведены данные статистики посещений одной из популярных русскоязычных поисковых систем Rambler - рейтинг популярности ресурсов, где информация о посещаемости соответствующих разделов собирается и обрабатывается автоматически. Эти данные Вы можете увидеть в разделе TOP100 (данные приведены на 18.06.2001). Здесь мы привели первые 10 позиций рейтинга.
Раздел |
Популярность, % |
Развлечения |
12,90 |
СМИ и периодика |
11,29 |
Бизнес и финансы |
5,95 |
Сервисы |
4,97 |
Классификаторы |
4,13 |
Спорт |
3,58 |
Игры |
3,40 |
МР3 (компьютерные музыкальные записи) |
2,86 |
Политика |
2,76 |
Компьютеры |
2,70 |
Приведенная статистика, дает Вам некоторую возможность понять круг интересов и рейтинг пристрастий пользователей Internet, а если Вы вспомните приводившиеся выше цифры о том, что число пользователей русскоязычной части Internet превышает 3 миллиона, то легко сможете перевести проценты в абсолютные показатели в интересующем Вас сегменте рынка.
А вот данные о распределении ресурсов по разделам каталога одной из самых популярных поисковых систем Яндекс (по данным на 18.06.2001).
Раздел каталога |
Число зарегистрированных ресурсов |
Компьютеры и связь |
3 500 |
Дом и семья |
2 792 |
Наука и образование |
2 472 |
Организация бизнеса |
2 232 |
Культура и искусство |
1 882 |
Производство и поставки |
1 843 |
Общество и политика |
1 751 |
Развлечения и отдых |
1 683 |
СМИ |
1 617 |
Инфраструктура экономики |
1 471 |
ВСЕГО: |
21 243 |
Необходимо отметить, что владельцем ресурса обычно является весьма активно ведущая деятельность, в том числе и в Internet фирма. Поэтому, анализируя данную статистику, Вы сможете реально оценить количество предприятий и организаций, с которыми Вы можете эффективно контактировать, используя Internet.
Таким образом, Вы видите, что каким бы вопросом Вы ни задались (в зависимости от направления Вашего бизнеса), вы наверняка сможете в той или иной степени получить на него ответ через Internet. А если учесть, что за каждым ресурсом стоят конкретные специалисты, то Вы еще и получаете возможность обратиться к ним с вопросом (например, используя электронную почту).
Это все, что касается «вопросов широкого профиля». А если Вам нужна специализированная информация? Ну что ж, в этом случае Internet может оказаться вообще единственным источником сведений (в особенности, для малого бизнеса). Дело в том, что специалисты узкого профиля разбросаны по всему миру достаточно «разреженно». Кроме того, у них не всегда есть возможность, регулярно публиковать свои материалы в научной или специальной литературе. Поэтому иногда бывает достаточно трудно найти интересующего Вас специалиста, используя традиционные печатные источники информации. Через Internet сделать это гораздо проще, поскольку существуют специализированные телеконференции, листы подписки и т.д. Да и публикация материалов обходится специалистам значительно дешевле, так как существуют ресурсы, бесплатно предоставляющие пользователю место для размещения своей странички.
Но ведь часто бывает важно не только найти необходимую информацию или специалиста, но и иметь возможность задавать вопросы! В этом случае Вам на помощь придет электронная почта, которая гарантирует Вам не только оперативность, но и надежность связи. Кроме того, психологически гораздо легче ответить на почтовое сообщение «невидимому собеседнику», чем в беседе по телефону или при личной встрече.
Итак, в Internet можно найти либо уже готовый ответ на любой интересующий Вас вопрос либо, по крайней мере, специалистов, которые смогли бы ответить Вам на него (а чаще всего и то и другое).
2. Что такое поиск информации в сети?
Итак, что же такое поиск информации в сети и чем он отличается от поиска информации в других источниках?
Поиск информации в сети - это последовательность действий, от определения предмета поиска, до получения ответа на имеющиеся вопросы с использованием всех поисковых сервисов, которые предоставляет сегодня Internet.
Перечислим основные преимущества использования сети Internet при поиске информации.
Использование максимально возможного «пространства поиска» информации. Ни один из существующих на сегодня несетевых ресурсов не обладает тем объемом информации, который представлен в Internet;
Ни один другой источник не обладает такой оперативностью и доступностью. Internet предоставляет Вам доступ круглосуточно вне зависимости от Вашего места нахождения;
Информацию, полученную через Internet можно легко переслать своим коллегам для обсуждения или, например, распечатать в нужном числе экземпляров.
Только эти, перечисленные свойства, уже показывают, что в большинстве случаев себестоимость получения информации в сети будет заведомо ниже, чем при ее получении из любого другого источника. А в случае, если информация редкая (например, в узкоспециализированной области) или нужна срочно, то Internet может вообще оказаться единственно возможным источником ее получения.
И если крупный бизнес может себе позволить содержание целых информационно-аналитических служб, то для малого бизнеса Internet оказывается уникальным инструментом информационного обеспечения.
В целом поиск информации в сети - это достаточно специфическая и кропотливая работа, требующая определенных знаний и навыков. Для проведения поисковых работ Вам пригодятся: знания основных информационных ресурсов и умение хорошо в них ориентироваться, практические навыки работы - это приходит со временем, хорошая зрительная память и умение быстро читать, а так же некоторые навыки аналитической работы.
Приготовьтесь к тому, что при проведении поиска необходимой Вам информации, Вы вынуждены будете просмотреть и обработать достаточно большой объем документов. Конечно, бывает и так, что ответ на Ваш вопрос находится в первом же документе и заключен в рамки одного абзаца, состоящего из трех строк. Но чаще всего - ответ формируется Вами на основе «тридцати трех» разноплановых документов, хотя состоит все из тех же трех строк. В основном сказанное касается поиска различных сведений достаточно общего характера или при необходимости составления аналитического отчета по интересующему Вас вопросу. Поиск более конкретных сведений - например, составление списка адресов Ваших потенциальных партнеров - потребует от Вас значительно меньше времени и усилий.
Основной проблемой при поиске можно назвать неумение пользователя эффективно искать информацию в сети.
Как правило, у начинающих поисковиков или у пользователей, которые только начинают «жить» в сети, существует несколько ошибочных мнений:
Поисковые машины ищут информацию по всему Internet;
Не составляет большой проблемы еще раз найти заинтересовавший Вас материал;
Если начальный поиск закончился неудачей, то данной информации в сети нет.
Остановимся несколько подробнее на каждом из этих моментов.
А. Поисковые машины ищут информацию по всей сети Internet. На самом деле это не совсем верно. Если бы при реализации алгоритма работы поисковых машин был использован такой подход, то для обработки только одного запроса и выдачи результатов потребовалось бы несколько дней.
Поэтому, практически реализована иная схема работы поисковой машины. Каждая поисковая машина имеет и постоянно пополняет свою (локальную) базу данных. База данных поисковой машины содержит основные параметры (индексы) каждого известного данной машине (проиндексированного) документа. Каждая поисковая машина использует свои методы индексации. Кроме того, различные поисковые машины имеют разные объемы базы данных.
В результате, механизм обработки запроса пользователя поисковой машиной выглядит следующим образом:
в соответствии с заданным в запросе ключевым словом или словосочетанием, машина проводит поиск в своей локальной базе данных, сверяя ключевое слово с наборами ключевых слов, соответствующих каждому документу из её базы данных;
затем, используя соответствующие алгоритмы, поисковая машина сортирует результаты поиска и выдает их пользователю;
в результате сортировки результатов, в начало списка помещаются наиболее соответствующие (с точки зрения поисковой машины) ключевым словам документы.
В связи с огромным количеством информации, размещенной в сети, ни одна из поисковых машин не в состоянии просмотреть все документы. Каждая поисковая машина индексирует только часть их. Все остальные документы, а к сожалению это большая часть ресурсов, найти с ее помощью не удастся.
Б. Не составляет большой проблемы еще раз найти заинтересовавший Вас материал. Это второе очень большое заблуждение начинающих пользователей, приносящее немало вреда и значительно осложняющее жизнь. Достаточно часто бывает так, что интересные Вам материалы встречаются совершенно случайно, в процессе поиска по другой теме или при просмотре указанных в материалах сервера ссылок. А Internet, "увлекая и заманивая" иногда лишает Вас возможности вернуться. Отвлекаясь на более интересную информацию, Вы забываете адреса, которые вам нужны и тратите немало времени на их повторный поиск. И надо отметить, что не всегда Вы вновь сможете найти именно ту, потерянную информацию.
Для того чтобы избежать подобных ошибок, стоит сразу записывать адреса заинтересовавших Вас ресурсов в раздел "Избранное" браузера, либо в текстовый файл. Если Вы все же не смогли сохранить адрес, то постарайтесь вспомнить какое-либо "кодовое" слово или словосочетание, которое точно было на "потерянном" сайте. Главное - чтобы эта информация была оригинальной, так как использование сочетаний вида "стиральный порошок" или "коврик для мышки" не сильно продвинет Вас на пути повторного поиска. Если же, например, Вы используете запомнившееся Вам название заголовка статьи "Храните Ваши денежки по банкам и углам!", то у Вас есть шанс найти сайт с помощью поисковой машины. Задайте соответствующий запрос и помните - фразу надо вводить в кавычках. В том случае, если ничего очень оригинального и своеобразного Вы не запомнили, попробуйте следующий вариант: в окне браузера найдите кнопку "журнал" и нажмите её. В левой части окна возникнет колонка, в которой будут надписи "сегодня, вчера, …5 дней назад". Выберите мышкой надпись "сегодня" и нажмите на неё. В результате Вы получите список серверов, которые Вы посетили за сегодняшний день. Если их число не слишком велико, то Вы можете заново просмотреть все страницы.
В. Если начальный поиск закончился неудачей, то данной информации в сети нет. Еще одно заблуждение, обусловленное в основном малым опытом поиска. В Internet найти можно практически любую информацию, главное знать, что, где и как необходимо искать. Кроме того, очень важно научиться грамотно формулировать запрос поисковой машине. И если на начальном этапе Вы не можете найти то, что Вам необходимо это вовсе не означает, что данная информация отсутствует. Это значит, что Вы либо не достаточно четко формулируете запрос поисковой машине, либо ищете необходимую информацию не там где её стоит искать.
3. Полнота, достоверность и скорость поиска
Для того, чтобы найденная Вами информация действительно отражала реальное положение дел, поиск должен удовлетворять следующим критериям:
полнота охвата ресурсов;
достоверность информации;
высокая скорость проведения поиска.
Почему важна полнота охвата и достоверность информации, видимо, объяснять не нужно. По поводу скорости проведения поиска можно сказать лишь то, что чем меньше времени Вы затратите на проведение поисковых мероприятий, тем меньшими будут Ваши издержки (на оплату услуг сети, на оплату времени работы специалистов и т.д.).
Гораздо сложнее вопрос проверки: насколько Вам удается достигнуть полноты охвата и достоверности информации? Ответить на этот вопрос заранее и со стопроцентной уверенностью вряд ли возможно. Можно лишь дать рекомендации, основанные на опыте тех специалистов, которые занимаются поиском профессионально - что надо делать, чтобы вероятность достижения заданных критериев была максимальной.
Контроль полноты охвата ресурсов - достаточно серьезная проблема, в том случае если Вам необходимо не просто найти любую информацию об интересующем Вас предмете, а Вы хотите иметь полное представление о предмете поиска и состоянии дел по данному вопросу. В этом случае лучше не ограничиваться использованием только одной поисковой машины или просмотром одного, пусть даже самого любимого Вашего каталога. Для того чтобы провести полномасштабный сбор информации необходимо работать со всеми известными Вам каталогами, поисковыми машинами, базами данных, региональными телеконференциями, электронными досками объявлений и листами рассылок. Только в этом случае Вы будете уверены, что нашли если не всю, то хотя бы большую часть существующей информации. При этом не стоит забывать и об электронных СМИ.
Контроль достоверности информации. Еще одна важная и достаточно сложная часть процесса поиска. В силу своей специфики, Internet содержит достаточное количество устаревшей либо не достоверной информации. Во многом это объясняется возможностью анонимного размещения материалов, особенно на бесплатных сервисах. В основном, контроль достоверности информации - это аналитическая работа. При этом важно произвести сверку найденного Вами фактического материала, выяснить статус документов, получить информацию о компетентности автора материала и т.д.
Но есть и более очевидные вещи. Например, вряд ли стоит доверять фирме, на сайте которой нет других координат связи, кроме адреса электронной почты, но которая предлагает товар по предоплате. Либо сайту, который не встречается в рейтингах популярности в первой сотне, но авторы которого утверждают, что он имеет грандиозный успех и пытаются продать Вам рекламное место по баснословным расценкам.
Результаты поиска.
Как уже отмечалось выше, при поиске в Internet важны:
полнота охвата - ничего не потеряно из имеющейся информации
точность - не найдено лишней или недостоверной информации.
Получив нужную информацию по сети, постарайтесь для начала ее проверить.
Если это цены на товарную продукцию или услуги, - обязательно свяжитесь с продавцом и уточните их (а заодно проверьте наличие необходимой продукции на складе в достаточном количестве). Так же проверяется любая адресная информация: какими бы возможностями ни обладала современная техника, но заносят информацию в сеть люди, а им свойственно ошибаться, проявлять неаккуратность, не оперативность и т.д.
Аналитическую информацию проверяют, сравнивая данные, полученные из нескольких источников. Таким же способом проверяют разнообразные статистические данные.
Если Вы предполагаете использовать полученную информацию для публичного обозрения, не сочтите за труд точно записать источник (адрес в сети), имя автора (или название организации) и дату публикации используемых Вами сведений. Обратите внимание на возможное наличие особых указаний относительно соблюдения авторских прав.
Помните о том, что если некоторую информацию смогли получить Вы, то таким же образом ее может получить и любой другой, в том числе Ваши конкуренты. Что будет означать для вашего бизнеса такой факт?
Наконец, самое главное. Задайтесь вопросом: принесла ли найденная информация ту пользу, на которую Вы рассчитывали? Удалось ли Вам получить информацию в необходимом объеме за отведенное время?
Описание процедуры поиска информации в сети выглядит довольно объемным. На практике, после приобретения некоторого навыка работы в сети процесс поиска вряд ли будет представлять для Вас какие-либо трудности. В подтверждение этих слов приводим статистику, полученную в результате опроса пользователей Internet по вопросу:
«Удается ли Вам найти нужную информацию в сети?»
Результаты опроса проведенного Yandex
Всегда |
9.91% |
Часто |
73.58% |
Редко |
14.98% |
Никогда |
1.53% |
Скорость проведения поиска в Сети, если не принимать во внимание технические характеристики подключения пользователя, зависит в основном от двух факторов:
грамотного планирования поисковой процедуры;
опыта работы с ресурсом выбранного типа.
Особое значение скорость проведения поиска имеет в том случае, когда Вы имеете дело с быстро обновляющейся информацией. Например, Вы работаете с продуктом, цена на который меняется несколько раз в день. В этом случае, Вам вряд ли поможет информация о динамике цены, полученная вечером или утром следующего дня. Ведь решение о продаже или покупке Вы уже приняли.
4. Планирование процесса поиска
Эффективность любого вида деятельности определяется четким представлением того, что, как и в какой последовательности мы собираемся делать, т.е. четким планированием работ. Сказанное в полной мере относится и к процедуре поиска информации в сети Internet.
Рассмотрим, из каких этапов состоит процесс поиска информации:
№ |
Этап |
Содержание работ этапа |
1. |
Определение предмета поиска |
На этом этапе определяем, что конкретно нас интересует. |
2. |
Составление списка ключевых слов |
На этом этапе выявляем, как может называться то, что нас интересует. |
3. |
Выбор информационного пространства |
На этом этапе определяем, где может находиться то, что нас интересует. |
4. |
Определение инструмента для поиска |
На этом этапе принимаем решение о том, как проще и быстрее найти то, что нас интересует. |
5. |
Предварительный поиск |
Пробуем найти. |
6. |
Анализ полученной информации |
Смотрим на полученные результаты. Если это необходимо (в том случае, когда полученные результаты нас не устраивают), проводим корректировку всех предыдущих действий. |
7. |
Дополнительный поиск |
Ищем дальше, пока не получаем ответ на свой вопрос. |
Неплохо, также, определить время, в течение которого информация должна быть найдена, оценить альтернативные способы получения и степень важности этой информации для Вас.
В любом случае опирайтесь на здравый смысл: возможно, для поиска адреса нужной Вам фирмы достаточно открыть телефонный справочник, лежащий у Вас на столе или просто набрать телефон этой фирмы и попросить секретаря продиктовать его Вам (особенно, если Вы заходите в Internet через модем).
При единичном поиске поставщика необходимой товарной продукции, в некоторых случаях, работать с печатным каталогом может оказаться удобнее. Но гораздо эффективнее для проведения сравнительного анализа цен за последние несколько месяцев, взять информацию из точно такого каталога, но размещенного в сети (Вам, по крайней мере, не придется заново набирать информацию, занося ее в персональный компьютер).
Общие советы при поиске.
Потратьте несколько лишних минут, чтобы максимально "сузить" описание предмета поиска - это поможет сэкономить Вам много времени и денег;
Искать что-то конкретное лучше всего с помощью поисковых машин, так как если вы знаете "хорошие" ключевые слова, четко определяющее то, что вы хотите найти, то и поиск не представляет никакого труда;
Используйте для поиска нескольких поисковых машин;
Если на просматриваемой Вами странице существует несколько заинтересовавших Вас ссылок - открывайте несколько окон, пока Вы читаете информацию на одной странице, остальные успешно (или не очень) успевают загрузиться;
Старайтесь использовать подходящую поисковую систему: файлы ищите с помощью FTP-поисковика, MP3 (файлы музыкальных произведений, записанные и обработанные в цифровом формате) - с помощью MP3-поисковика, благо сейчас практически любая поисковая машина предоставляет такую возможность. В случае поиска файлов, в запросе указывайте наиболее вероятное имя файла, например, «name.jpg»;
Если вы хотите найти популярные, часто посещаемые ресурсы - ищите с помощью рейтинга;
Телеконференции и страницы ссылок на тематических сайтах помогут Вам быстрее найти специализированные или редкие вещи;
Если нужна очень редкая информация - попробуйте найти ресурсы, посвященные более общей теме. Возможно там будут размещены ссылки на необходимые Вам ресурсы или будут опубликованы требующиеся материалы;
Старайтесь найти ответ, а не задать вопрос;
Создавайте свою коллекцию интересующих Вас ссылок;
Если Вы нашли что-то интересное, сразу запишите адрес ресурса в "Избранное" либо в текстовый файл;
Записывая адреса ресурсов в "Избранное", старайтесь дать им более четкое название, максимально соответствующее содержащейся в них информации, постарайтесь не использовать слишком длинные названия;
Разработайте свой собственный классификатор и для каждой темы создавайте отдельную папку в "Избранном". Поверьте, поиск в своих собственных не разобранных архивах занимает не меньше времени, чем поиск в Internet.
5. Основные методы поиска в сети и их использование
Существует два основных метода поиска информации в Internet - с использованием поисковой машины или с использованием каталога. При этом сам механизм поиска в обоих случаях практически одинаков. Различия возникают на этапе 2 (составление списка ключевых слов). Для поисковой машины - это составление списка ключевых слов, а для каталога на этом этапе производится определение тематики разделов, в которых может находиться необходимая Вам информация.
Например, Вам необходимо найти информацию о фильтрах для очистки воды.
Если Вы решили использовать поисковую машину, то необходимо подобрать набор ключевых слов, необходимых для поиска:
фильтры;
фильтры для воды;
водяные фильтры;
очистка воды;
бытовые фильтры для воды и т.д.
А, если Вы используете для поиска каталог, то требуется понять, в каких разделах может находиться интересующая Вас информация:
Предприятия ---> Пищевая промышленность;
Товары/ услуги ---> торговля ---> Промышленные товары;
Товары/ услуги/ ---> торговля ---> Химия ---> хозяйственно-бытовые товары;
Промышленность и сельское хозяйство ---> Производство ---> промышленность;
Производство и поставки ---> Машиностроение ---> Коммунальное машиностроение;
Производство и поставки ---> Машиностроение
и т.д.
Теперь давайте подробнее рассмотрим этапы поиска информации, описанные в предыдущем разделе.
Определитесь с предметом поиска. Основное правило поиска - определитесь, что именно Вас интересует, и что Вы хотите найти? Ведь если Вы хорошо знаете, предмет поиска, то искать намного легче.
Постарайтесь, как можно более подробно конкретизировать, что же Вы будете искать.
Например, Вы хотите найти информацию о фильтрах для очистки воды. Какие именно фильтры Вас интересуют? Бытовые, промышленные, настольные, напольные, карманные? Какую технологию очистки Вы предпочитаете? Можно конечно собрать информацию обо всех существующих типах фильтров, но если Вы будете искать что-то конкретное, то потратите значительно меньше времени и получите более качественный результат.
Итак, как выглядят правильное и неправильное описание предмета поиска?
Неправильное: Найти производителей фильтров.
Здесь задача поставлена слишком широко, при поиске непременно возникнут вопросы по дальнейшей конкретизации необходимой Вам информации. Что нужно найти: информацию о всех производителях, либо адреса производителей конкретных типов фильтров, либо координаты производителей в определенной стране или регионе. Какая информация требуется: только координаты, информация о производимой продукции и расценках и т.д.
Правильное: Найти производителей промышленных фильтров для воды. Фильтры предполагается использовать для пищевого производства. Требуемые технологические характеристики: производительность- Х л/час, габариты - не более 5х5 м, способ очистки - керамические фильтры, степень очистки - все микробы умерли. Регион: Россия. Требуемая информация: адреса, контактные телефоны, E-mail, прайс-листы.
Если же Вы ничего не знаете о предмете поиска кроме общей темы, то начать придется с поиска информации о самом предмете поиска. Задача переходит в другую плоскость - "найти хоть что-нибудь". Можете попробовать найти интересующую Вас тему в каталоге ссылок, кроме того, источниками информации могут быть специальные справочники или энциклопедии общего профиля, где можно почерпнуть начальные сведения. Если Вас постигла неудача - воспользуйтесь поисковой машиной. Правда в этом случае Вас ждет "море информации" и Вы потратите значительное время, чтобы его "переплыть".
Подбор ключевых слов. Найдете ли Вы нужную Вам информацию, во многом зависит от правильного подбора ключевых слов. Поэтому очень важно научиться подбирать ключевые слова и их комбинации.
На основе предварительно полученной информации о предмете поиска составьте максимально широкий набор ключевых слов в виде отдельных терминов, словосочетаний, названий и фамилий, тесно связанных с проблемой, профессиональной лексики.
Естественный язык запросов привлекает своей простотой, однако, как показывает практика, он менее эффективен при серьезном поиске, когда ставится задача найти все или большинство документов на заданную тему.
Рассмотрим основные моменты, которые помогут вам правильно сформулировать запрос к поисковой машине:
Не задавайте только одно слово. Используйте целые фразы, или, по крайней мере, несколько слов;
Указывайте слова, которые не должны встречаться в искомых документах. Обычно для этого используют либо знак "-", либо ключевое слово NOT;
Начинайте имена собственные: названия компаний, городов, фамилии людей, и др. с заглавных букв, а все остальные слова пишите только маленькими буквами;
Если вы хотите найти фразу целиком - заключите ее в кавычки;
Если вы вводите запрос к поисковой машине, состоящий из нескольких слов, то в результате получаете список документов, в которых встречается хотя бы одно слово.
Стоит отметить, что поисковая машина обычно производит сортировку документов по принципу релевантности.
Итак, что же такое релевантность. При индексации документов поисковые машины высчитывают так называемый "вес" слова на странице - соотношение количества повторов на странице заданного Вами слова к общему количеству слов на странице документа. Если Вы задаете запрос, состоящий из нескольких слов, то более релевантными будут документы, в которых совокупный вес слов будет максимальный. Однако, при подсчете веса не учитывается, рядом или раздельно стоят данные слова, и поэтому нет гарантий, что в первых документах содержится максимальное количество повторений словосочетания. Вполне возможно, что такого словосочетания там вообще не будет.
Поэтому, если Вы хотите найти заданное словосочетание - задавайте запрос в окне поисковой машины в кавычках. В этом случае будет высчитываться вес словосочетания целиком. Соответственно, гарантируется наличие именно данного словосочетания в найденных документах.
Критерием правильности выбора ключевых слов для Вас будет служить количество документов, найденных поисковой машиной при предварительном поиске. Если оно исчисляется сотнями - то Вам необходимо уточнить запрос, введя дополнительные ключевые слова или воспользовавшись специальными средствами расширенного поиска. Если не найдено ни одного документа - такое редко но случается, составьте список синонимов данного термина или проверьте орфографию.
Например, для приведенного выше примера ключевыми словами могут быть следующие:
фильтры керамические, фильтры для воды, фильтры для пищевых производств, производитель, Россия.
Задайте 2-3 ключевых слова, например «фильтры для воды», и посмотрите на объем выборки. Если она окажется слишком большой, введите дополнительные ключевые слова из приведенного списка, например «фильтры для воды керамические Россия» и т.д.
Выбор информационного пространства. Четкое представление, где может находиться запрашиваемая Вами информация, в одних случаях избавит Вас от необходимости просматривать большое количество лишней информации, в других позволит найти те сведения, которые при заданных по умолчанию в поисковой машине условиях поиска, вообще не отыскиваются.
Например, вряд ли имеет смысл просматривать всю имеющуюся в сети информацию по коммерческим предложениям о поставке фильтров для очистки воды, если Вас интересует только мелкооптовый рынок Санкт-Петербурга.
А, например, производителя уникального промышленного оборудования для той же очистки воды, лучше всего искать, предварительно уточнив хотя бы в какой стране может находиться данное производство.
Выбор поисковых инструментов. Этот этап определяет всю дальнейшую технологию поиска - переходить к нему стоит только после анализа предварительно полученной на предыдущих этапах информации.
Поскольку на сегодняшний день наиболее популярным информационным пространством является World Wide Web, то остановимся более подробно на вопросе выбора инструментов поиска именно для WWW. Как правило, у пользователя регулярно занимающегося поиском существует свой отработанный механизм, однако некоторые рекомендации применительно к работе с основными видами инструментов поиска в сети дать можно:
Поисковые машины - с помощью поисковых машин всегда легче найти что-то конкретное, и труднее - что-то общее и неопределенное. Естественно, размер базы данных поисковой машины - решает не все. Для поисковой машины самое главное - релевантность (соответствие запросу) выдаваемых ссылок, а на этот показатель, кроме размера, влияет структура базы данных и синтаксис языка запросов.
Каталоги. Именно с помощью каталогов удобно искать информацию на общие темы (природа, искусство, компьютеры, медицина и т.д.). Чем удобен поиск в каталоге? Любой каталог имеет рубрикатор. Таким образом, информация в определенной степени отсортирована. Например, Вы хотите сами провести рекламную кампанию своего предприятия, но сомневаетесь, что учли все аспекты предполагаемого мероприятия. Заходите в каталог, выбираете раздел "Реклама". При этом Вы попадаете в подкаталог, где перечислены рубрики от "Аналитических исследований" до "Полиграфии" и "Сувенирной продукции". Смотрите, изучайте…. Каждый адрес снабжен аннотацией представленных материалов. При решении достаточно стандартной поисковой задачи именно каталог, а не поисковая машина оказываются более приемлемыми для начала поиска.
Во многом тип требующегося Вам информационного ресурса определяется характером искомой информации:
Адресная информация - адресные справочники;
Новости - новостные порталы и информационные агентства, списки рассылок;
Конкретная информация - поисковые машины;
Общие сведения - каталоги;
Статистика - сервера статистических служб, рейтинги;
Хотите что-то купить - Internet-магазины и доски объявлений;
Хотите проконсультироваться - сайты компаний, специализирующихся на данной тематике и списки рассылок.
Для выбора наиболее подходящих Вам в данный момент информационных ресурсов используйте тестовые запросы из 1-2 ключевых слов. Проанализируйте количественный отклик и выберите наиболее представительные источники информации.
Вновь обратимся к опыту тех, кто уже имеет опыт работы в сети, чтобы понять их предпочтения в выборе поисковой машины.
«Какими поисковыми системами Вы обычно пользуетесь?»
Яндекс: |
66% |
Рамблер: |
59% |
Апорт: |
57% |
Yahoo: |
26% |
Alta-Vista: |
25% |
Другое: |
7% |
Предварительный поиск и анализ полученных результатов. Конечно, предварительный поиск может оказаться сразу и окончательным, если все предыдущие этапы были выполнены полно и аккуратно, а результат Вас вполне устроил. Такая ситуация возникает чаще всего в случае, когда Вам необходима какая-либо конкретная информация по хорошо известным Вам вопросам (например, координаты производителя товарной продукции или расписание движения поездов по заданному маршруту). В случае, когда параметры или предмет поиска Вам самому не вполне точно известны, тогда по анализу результатов предварительного поиска можно существенно уточнить, что, где и как нужно искать.
Например, задавшись целью найти оборудование, которое позволило бы удалять ржавчину с металлических поверхностей перед нанесением новых защитных покрытий, Вы можете и не иметь информации о том, как это вообще делается на сегодняшний день. Тогда, целью предварительного поиска для Вас становится именно знакомство с существующими технологиями, хотя вполне возможно, что уже предварительный поиск даст Вам некоторую информацию и по оборудованию, при помощи которого такая обработка производится. Ключевыми словами для Вас в этом случае станут: коррозия, ржавчина, очистка ржавчины, технология предварительной подготовки поверхности металла и т.д.
Узнав из полученной предварительной информации, что существует по крайней мере два способа удаления ржавчины, химический и механический, а соответственно, в механическом - при помощи щеток и при помощи пескоструйной обработки, Вы сможете для начала определить, какая из технологий для Вашего случая более приемлема, а уже затем, по известным технологическим параметрам найти как характеристики конкретного оборудования, так и его производителей. Для окончательного поиска ключевыми словами для Вас будут, например, пескоструйное оборудование, пескоструйные установки, пескоструйное оборудование для очистки поверхностей и т.п.
Список литературы
Для подготовки данной работы были использованы материалы с сайта http://www.rambler.ru/