3 инструмента для парсинга на WordPress

Иногда нет смысла тратить время на самостоятельное написание текстадля сайта WordPress. Этот случай не касается блогов и инфосайтов, так как доход на них формируется как раз благодаря размещенным постам.

А речь идет об интернет-магазинах, сайтах компаний и новостных порталах, не рассчитанных на органический трафик. Вот для таких ресурсов уникальные материалы – это не так важно, как их постоянное обновление.

Чтобы сделать автонаполняемый сайт, вам понадобится настроить парсер новостей для вашего проекта. Для начала необходимо найти подходящие площадки, с которых вы будете парсить. Они должны соответствовать тематике вашего проекта, иначе нет смысла дублировать с них информацию. Если это так, тогда необходимо приступить ко второй части решения вопроса парсинга – это каким образом вы будете клонировать текстс другого сайта. Самый примитивный и неудобный способ – это ручное копирование. Но куда разумнее воспользоваться одним из приведенных в данной статье плагином, чтобы активировать удачный парсер новостей и контента.

blog-parser-your-wordpress

Содержание

WP-O-Matic

Весьма популярный модуль для WordPress, который позволит вам настроить функциональный парсер новостей с других площадок. Устанавливается инструмент самым простым способом: либо через загрузку напрямую в папку на хостинге, либо через вкладку «Плагины».

Далее вам предстоит настроить работу плагину, если хотите обеспечить парсинг контента. Для этого достаточно четыре раза нажать «Next» и в конце «Submit». Таким образом, вы подтвердите согласие с правилами пользования данным модулем WordPress. В частности, согласитесь с тем, что только вы несете ответственность за кражу чужих материалов, содержания других сайтов и т. д.

Если кроме текстовой составляющей вас еще интересуют картинки, тогда необходимо создать в папке с плагином директорию под названием Cache. Установите особые права доступа к этой папке. Далее вам предстоит вернуться в админку WordPress. Зайдите в настройки плагина и внимательно посмотрите, нет ли галочки около пункта Unix cron. Вам необходимо утвердительно отметить пункт Cache Image, чтобы парсер новостей также копировал и картинки к вам на ресурс.

Модуль WP-O-Matic хорош тем, что работает на любой странице сайта. Вы сможете добавить отдельную рубрику, если хотите, чтобы список новостей и контента, который предоставил парсер, отображался именно там. Для этого предварительно создайте необходимую рубрику. Затем в адмике WordPress в настройках инструмента WP-O-Matic нажмите Add Campaign. В строке Categories отметьте галочкой созданную вами специальную рубрику. А в форме Feeds пропишите RSS ленты, которую вы собрались парсить. Вы сможете прописать сразу несколько URL для лент, чтобы парсер текстасобирал информацию сразу с трех или даже четырех ресурсов.

И еще один огромный плюс в сторону плагина WP-O-Matic – это автоматическая публикация материала. Вам не придется ежечасно заходить в админку WordPress, чтобы менять статус постов на «Опубликованный». Модуль сделает это самостоятельно. И если пожелаете, он может уникализировать текст через специальный механизм синонимизации. В этом ключевое отличие данного инструмент от его конкурента – плагина FeedWordPress.

Datacol

Это функциональный граббер, который подходит не только для движка WordPress. Это не просто парсер текста страниц сайта– это умное приложение, которое позволяет фильтровать копируемый материал. К примеру, вы сможете размещать только статьи, в которых есть определенные ключевые слова. Сможете дублировать новости прямо из Яндекса. Клонированные материалы будут экспортироваться в одном из 15 доступных форматов. Сервис соберет не только текст, но и заголовки, фотографии, дату публикации, ссылки и прочие важные данные.

Но Datacol распространяется на платной основе. Однако, он куда дешевле, чем если бы вы заказывали материална сайт через биржи. Стоит приложение меньше 500 рублей и его можно использовать практически для любого движка. Есть демо-версия.

FDE Grabber

Еще один платный парсер с большим числом функций. Это уже из разряда дорогих грабберов, так как обойдется он примерно в 90 долларов. Но использовать его можно будет сразу на 10 серверах, то есть в теории разные вебмастера могут скинуться по 9 долларов, удешевив таким образом покупку.

FDE Grabber – это не совсем плагин для WordPress. Разработчики называют свое творение автономной системой, которая работает независимо от типа CMS, установленной на сайте. Основные возможности этой системы парсинга:

  • выкачка полномасштабных новостей или отдельных фрагметов;
  • автоматическая загрузка в дубли материала фотографий;
  • можно планировать публикации;
  • если хотите уникализировать дублируемый материал, есть встроенная функция синонимайза;
  • можно работать через прокси-серверы;
  • парсинг способен обходить редиректы, которые для других плагинов могут стать проблемой;
  • можно автоматически скачать все содержимое с сайта и переместить на вашу площадку (если дело касается не новостных порталов);

Вы сможете настроить парсинг полностью по собственному усмотрению, так как у программы есть возможность внедрения микропрограмм для коррекции работы. К примеру, так можно настроить особенности выравнивания и оформления копируемого материала. Также вы сможете добавить параметры noindex и nofollow для всех ссылок, которые будут в тексте страницы. Парсер даже позволяет копировать и автоматически переводить статьи с иностранных ресурсов. Это отличный способ создать постоянный поток контента на ваши страницы, который со временем начнет привлекать посетителей!

fde-grabber

Plink — парсер для WordPress (пример настройки)

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Кнопка «Наверх»