FDE Grabber 5.7 - Уникальная система
FDE Grabber - это не модуль к какой-либо CMS, а отдельная система.
Возможности:
- импорт полного контента с RSS/Atom фидов, а также граббинг с HTML страниц со списками новостей
- возможность логина на сайт, с которого идёт граббинг (например, для чтения скрытого от гостей текста)
- самая совершенная система настройки шаблонов для парсинга (1 - простая, без регулярных выражений; 2 - с использованием регулярных выражений; 3 - с использованием технологии DOM парсинга; 4 - а также технология бесшаблонного парсинга)
- разнообразные фильтры и замены слов (1 - простые, без регулярных выражений; 2 - с использованием регулярных выражений; 3 - по указанному DOM шаблону в паре с заменой)
- полноценная система перелинковки
- поддержка изображений, внедрённых в тело HTML документа, закодированных, с помощью Base64 схемы
- поддержка импорта данных с сайтов, расположенных в доменах, содержащих символы национальных алфавитов
- возможность создания превью для картинок
- возможность получения краткой новости (статьи, анонса) как из источника, так и путём обрезки полной новости по заданному количеству символов/абзацев/предложений с автоматической корректировкой незакрытых HTML тегов (дескрипторов)
- умная система выравнивания картинок в статьях (в зависимости от размера изображения)
- возможность наложения на картинки вотермарков
- настраиваемая обрезка каждой из сторон изображений (например, справа обрезать на столько-то пикселей, а слева на столько-то)
- возможность предварительного тестирования правильности настроек
- встроенный синонимайзер (в комплекте 2 базы: русскоязычная и англоязычная)
- редактирование синонимов и стоп-слов через администраторский интерфейс
- экспорт/импорт настроек граббера
- экспорт/импорт баз синонимайзера
- корректная работа с известными кодировками
- возможность автоматического определения кодировки страницы по данным HTML тега META, а также отправляемому сервером заголовку Content-Type
- возможность работы через прокси
- ведение лога событий
- поддержка фейковых пользователей и комментариев
- возможность парсить ленты которые работают через FeedBurner
- возможность парсить ленты, получать картинки, сохранять статьи, обходя редиректы
- возможность публикации полученного контента на все указанные сайты или случайно в один из указанных
- возможность выкачивания полностью всех новостей с сайта, в случае использования HTML источников (это достигается путём задействования обхода пейджера:
http://site.com/page/{page}/, где {page} будет принимать значения номеров страниц пейджера сайта с указанным интервалом)
- возможность обхода по параметру, в случае использования HTML источников: http://site.com/param/{param}/, где {param} будет принимать указанные значения
- корректная работа с тегом base
- возможность использовать собственные хаки (микропрограммы для обработки контента). На данный момент, в стандартный дистрибутив входит порядка 10 хаков
- отдельная настройка размеров изображений для краткой и полной новости
- возможность не только уменьшать картинки, но и производить операцию обрезки (crop image)
- мультиязычность администраторского интерфейса (в данный момент доступны языки: русский, английский; язык сменяется через конфигурационный файл граббера)
- разграничение прав пользователей в админке граббера. Возможность назначать пользователям группу. Возможность создавать новые группы, с указанием прав доступа
- возможность устанавливать лимит публикуемых статей за день
- возможность автоматического клонирования категорий и источников
- возможность массового изменения каких-либо параметров у выбранных категорий и источников
- возможность автоматического определения категории, к которой относится данная статья на основе обработанных стеммером ключевых слов
- возможность распознавания русских дат
- возможность указания нескольких шаблонов для парсинга через теги логического ИЛИ: {or}, а также логического И: {and}
- возможность автоматического переименования получаемых картинок путём транслитерации заголовка статьи для получения псевдо SEF (ЧПУ) адресов
- возможность настройки расположения вотермарка: левый верхний угол/правый верхний угол/левый нижний угол/ правый нижний угол/по центру/случайно из перечисленных вариантов
- возможность указания случайной флуктуации дат публикации статей, которая устанавливается на уровне настройки категории источников
- возможность указания фиксированного смещения даты новостей, которая устанавливается на уровне настройки категории источников
- возможность универсальной настройки получаемых дат статей при граббинге: a) из источника б) дата, на момент граббинга источника в) дата, на момент граббинга статьи д) дата, на момент публикации
- возможность логина на сайт, с которого идёт граббинг (например, для чтения скрытого от гостей текста)
- самая совершенная система настройки шаблонов для парсинга (1 - простая, без регулярных выражений; 2 - с использованием регулярных выражений; 3 - с использованием технологии DOM парсинга; 4 - а также технология бесшаблонного парсинга)
- разнообразные фильтры и замены слов (1 - простые, без регулярных выражений; 2 - с использованием регулярных выражений; 3 - по указанному DOM шаблону в паре с заменой)
- полноценная система перелинковки
- поддержка изображений, внедрённых в тело HTML документа, закодированных, с помощью Base64 схемы
- поддержка импорта данных с сайтов, расположенных в доменах, содержащих символы национальных алфавитов
- возможность создания превью для картинок
- возможность получения краткой новости (статьи, анонса) как из источника, так и путём обрезки полной новости по заданному количеству символов/абзацев/предложений с автоматической корректировкой незакрытых HTML тегов (дескрипторов)
- умная система выравнивания картинок в статьях (в зависимости от размера изображения)
- возможность наложения на картинки вотермарков
- настраиваемая обрезка каждой из сторон изображений (например, справа обрезать на столько-то пикселей, а слева на столько-то)
- возможность предварительного тестирования правильности настроек
- встроенный синонимайзер (в комплекте 2 базы: русскоязычная и англоязычная)
- редактирование синонимов и стоп-слов через администраторский интерфейс
- экспорт/импорт настроек граббера
- экспорт/импорт баз синонимайзера
- корректная работа с известными кодировками
- возможность автоматического определения кодировки страницы по данным HTML тега META, а также отправляемому сервером заголовку Content-Type
- возможность работы через прокси
- ведение лога событий
- поддержка фейковых пользователей и комментариев
- возможность парсить ленты которые работают через FeedBurner
- возможность парсить ленты, получать картинки, сохранять статьи, обходя редиректы
- возможность публикации полученного контента на все указанные сайты или случайно в один из указанных
- возможность выкачивания полностью всех новостей с сайта, в случае использования HTML источников (это достигается путём задействования обхода пейджера:
http://site.com/page/{page}/, где {page} будет принимать значения номеров страниц пейджера сайта с указанным интервалом)
- возможность обхода по параметру, в случае использования HTML источников: http://site.com/param/{param}/, где {param} будет принимать указанные значения
- корректная работа с тегом base
- возможность использовать собственные хаки (микропрограммы для обработки контента). На данный момент, в стандартный дистрибутив входит порядка 10 хаков
- отдельная настройка размеров изображений для краткой и полной новости
- возможность не только уменьшать картинки, но и производить операцию обрезки (crop image)
- мультиязычность администраторского интерфейса (в данный момент доступны языки: русский, английский; язык сменяется через конфигурационный файл граббера)
- разграничение прав пользователей в админке граббера. Возможность назначать пользователям группу. Возможность создавать новые группы, с указанием прав доступа
- возможность устанавливать лимит публикуемых статей за день
- возможность автоматического клонирования категорий и источников
- возможность массового изменения каких-либо параметров у выбранных категорий и источников
- возможность автоматического определения категории, к которой относится данная статья на основе обработанных стеммером ключевых слов
- возможность распознавания русских дат
- возможность указания нескольких шаблонов для парсинга через теги логического ИЛИ: {or}, а также логического И: {and}
- возможность автоматического переименования получаемых картинок путём транслитерации заголовка статьи для получения псевдо SEF (ЧПУ) адресов
- возможность настройки расположения вотермарка: левый верхний угол/правый верхний угол/левый нижний угол/ правый нижний угол/по центру/случайно из перечисленных вариантов
- возможность указания случайной флуктуации дат публикации статей, которая устанавливается на уровне настройки категории источников
- возможность указания фиксированного смещения даты новостей, которая устанавливается на уровне настройки категории источников
- возможность универсальной настройки получаемых дат статей при граббинге: a) из источника б) дата, на момент граббинга источника в) дата, на момент граббинга статьи д) дата, на момент публикации
Скриншоты:
Требования к хостингу, на котором будет располагаться основная система:
- PHP 4.3.0 и выше (рекомендуется от 5.2.5 и выше)
- MySQL 4 и выше
- библиотеки PHP: pcre, mysql, iconv, curl, xml, gd, mb
- MySQL 4 и выше
- библиотеки PHP: pcre, mysql, iconv, curl, xml, gd, mb
Требования к настройкам PHP на хостинге, на котором будет располагаться основная система граббинга:
- safe_mode is off
- allow_url_fopen is on
- разрешённое выполнение функции eval
- allow_url_fopen is on
- разрешённое выполнение функции eval
Требования к хостингу, на котором может располагаться транзитная система публикации граббера в CMS (для удалённых, remote, публикаций):
- PHP 4.3.0 и выше (рекомендуется от 5.2.5 и выше)
- MySQL 4 и выше
- библиотеки PHP: pcre, mysql, iconv, gd, mb
- MySQL 4 и выше
- библиотеки PHP: pcre, mysql, iconv, gd, mb
Требования к настройкам PHP на хостинге, на котором может располагаться транзитная система публикации граббера в CMS:
- требований нет
Для осуществления проверки совместимости FDE Grabber с вашим хостингом можно использовать подготовленный нами скрипт. Скачать . Результат работы скрипта будет выглядеть примерно так:
Для осуществления проверки совместимости FDE Grabber с вашим хостингом можно использовать подготовленный нами скрипт. Скачать . Результат работы скрипта будет выглядеть примерно так:
Онлайн демо граббера находится здесь: http://fdegrabber.demo.fdstar.net/
Логин: admin
Пароль: 123456
Официальный сайт системы импорта новостей FDE Grabber: fde-grabber.ru.
Стоимость одной лицензии составляет 88.8 USD
Метки: FDE Grabber FDE Grabber 5.7 граббер парсер контент граббера для граббинга сайтов граббинг парсить
Материал взят с сайта Seoxa.Ru
- Скрипты
- Дата: 11-04-2013
- Автор публикации: seoxa
V | G | F | T | O |