Введение

Прежде чем начать, нам надо усвоить основные положения:

  • EmEx 3 собирает то, что выложено на веб странице и не более того. Если там информации нет, или она сильно искажена, то он ее может и не найти.
  • Достоверность полученой информации придется проверять Вам самим. Найденые ссылки на RapidShare (или другой файлобменник) могут быть устаревшими или удаленными с этих файлообменников.
  • Техника поиска приведенная в уроке использует поисковые машины. Более подробно о использовании поисковых машин Вы можете прочесть в уроке "EmEx 3. Использование поисковых машин"
  • Правильное построение запроса к поисковику может уменьшить время поиска и увеличить вероятность получения наилучших результатов

 

Изначальные условия поиска

Для начала нам надо правильно сформировать условия поиска. Это самое главное при поиске ссылок на файлообменники.

В качестве примера мы рассмотрим следующую задачу:

Мы хотим найти ссылки на файлообменники, где может находиться телесериал Stargate Atlantis сезон 5й. Эти ссылки должны быть не защищены никакими паролями, требованиями к регистрации на этом ресурсе и должны вести прямо на необходимый файлообменник.

Для решения данной задачи нам будет необходимо воспользоваться любой популярной поисковой системой. Используйте ту систему, которая вас устраивает. В примере мы будем использовать поисковую машину Google.

Настраиваем EmEx 3. Цели.

Шаг 1й. Что мы будем искать?

Отмечаем цель нашего поиска.

Шаг 2й. Какого типа мы будем собирать ссылки? Условия фильтрации.

EmEx 3 должен добавлять только ссылки, содержащие подстроку rapidshare.com/, а затем игнорировать все остальные ссылки на документы с домена источника. Т.е. не надо больше грузить ничего с этого сайта, раз искомый результат найден успешно.

Шаг 3й. Условия поиска.

Мы задали условие, по которому поисковик выдаст нам ряд ссылок. Все что останется EmEx 3 - проверить их на достоверность.

Глубина погружения. Не стоит игнорировать!

Шаг 4й. Настройка глубины погружения.

И правда, зачем нам сканировать все содержимое найденых сайтов, когда итак понятно, что ссылка ведущая на необходимый нам ресурс будет лежать либо в результатах поисковика, либо в одном шаге от этого результата (если используется дорвей).

Финальные настройки

Вы можете усложнить поиск, используя фильтры ключевых слов, чтобы отсечь то, что вам неинтересно.

Можете использовать фильтр динамической замены, чтобы заменять ссылки типа xxxx:// или хттп:// на нормальный http://. Некоторые сайты используют и такую защиту.

Но в нашем случае мы используем полностью стандартные условия поиска. Этого будет достаточно.

Нажали кнопку и результат готов!

Итак, мы прошли все этапы настройки проекта поиска и запустили его.

Не прошло и нескольких минут, а EmEx 3 уже нашел более 100 ссылок, удовлетворяющим условиям нашего поиска.

Все что нам осталось, так это просмотреть и довериться наиболее внушающим доверие ссылкам.

Не правда ли просто?