Парсер Сайта News.google.ru

Опубликованно: 19/07/2009 | Показы: 687 |

Увидев на просторах интернета парсер (parser) новостей яндекса решил проделать тоже самое, но с Google.

Я сомневаюсь что вы будете использовать данный парсер, вы сделаете наиболее универсальный граббер который будет грабить практически с любого сайта, с RSS лент и т.д. Если же вы хотите наиболее лучших уроков заходите на сайт "Уроки по PHP, HTML, CSS"

Спрограммируем парсер новостей google.ru на php, который будет "грабить" контент с news.google.ru и выводить на нашей странице. Идем по ссылке http://news.google.ru/news?ned=tru_ru&rec=0 и анализируем HTML-код. Находим в нем уникальные строки, по которым мы определим – ОТ какого участка кода и ДО какого мы будем отбирать нужный нам контент.

Находим в коде такой текст: “<table border=0 align=right cellspacing=0 cellpadding=0>” – пусть это будет начало блока… и текст ‘<br><br><br clear=all>’ (тег разделительной линии), которым наш новостной блок заканчивается.

Код нашего парсера такой:
<?php// Получаем HTML-код страницы новостей с помощью file_get_contents
$content = file_get_contents('http://news.google.ru/news?ned=tru_ru&rec=0');// Определяем позицию строки, с которой мы будем копировать код. Функция strpos.
$pos = strpos($content, '<table border=0 align=right cellspacing=0 cellpadding=0>');// Присваиваем переменной $content скопированный с помощью substr код, начиная с позиции $pos.
$content = substr($content, $pos);// Находим позицию второй строки
$pos = strpos($content, '<br><br><br clear=all>');// Отрезаем нужное количество символов от нулевого
$content = substr($content, 0, $pos);// Чтобы не подгружать изображения, я удаляю теги <img с помощью str_replace (просто заменяю на пустоту).
$content = str_replace('<img src=/images/cleardot.gif width=1 height=2>', '', $content);// выводим полученный код.
echo $content;
?>

Код с комментариями поэтому это не должно вызывать никаких затруднений по данному уроку. Помние, что данный урок пища для ума.

Оригинал урока "Создание парсера новостей с сайта google"

Источник статьи: http://www.rusarticles.com/internet-statya/parser-sajta-newsgoogleru-1050236.html

Обсудить статью

Прежде всего, отмечу, что такие направления, как поисковая выдача и услуги хостинга, должны быть определяющими в выборе методик продвижения.

От: freeseoblogrul Интернетl 09/07/2013 lПоказы: 93

Что такое % маркетинговых затрат? Какие показатели влияют на % маркетинговых затрат? Средний процент маркетинговых затрат e-commerce от 10% до 50%. Cредний процент маркетинговых затрат в сфере услуг от 15% до 60% Средний процент маркетинговых затрат e-commerce, при котором магазин становится прибыльным от 10% до 22% Средний процент маркетинговых затрат в сфере услуг, при котором магазин становится прибыльным от 13% до 22%

От: Андрейl Интернетl 04/07/2013 lПоказы: 67

Процесс разработки сайта дело пусть и трудное, однако весьма интересное, а при правильном подходе еще выгодное.

От: rabotacmsrul Интернетl 02/07/2013 lПоказы: 56

Комплексное, практичное решение для ТСЖ и УК: не только разработка и обновление официального сайта, но и своевременное выкладывание данных на государственном портале. Обращайтесь: pravila.org – с услугой сопровождения сайта управляющей организации штрафы за нарушение законодательства о раскрытии информации теперь не страшны!

От: pravilal Интернетl 21/06/2013 lПоказы: 16

Экскурс в создание сайтов. В этой статье кратко будут рассмотрены основные типы интернет ресурсов встречающихся на просторах всеммирной паутины.

От: Александрl Интернетl 09/06/2013 lПоказы: 44

Современному пользователю сети Интернет, а тем более владельцу собственного сайта, странно задаваться подобными вопросами. Это все равно, что спросить: «Почему важно использовать комплексный подход при пошиве костюма, а не ограничиваться только лишь рукавом?».

От: Exiterral Интернетl 29/04/2013 lПоказы: 28

Создание качественного сайта, все равно что евро-ремонт в квартире: подбираете качественные и модные материалы, думаете, куда и как поставить, начинаете спорить и в итоге смотрите на результат.

От: Exiterral Интернетl 23/04/2013 lПоказы: 31

Интернет-ресурсы в рекламном бизнесе заняли основательные положения. Пропаганда товаров и услуг в интернете завоевала неслыханный размах и является одним из популярных и эффективных средств рекламы различной продукции и услуг

От: Андрейl Интернетl 19/04/2013 lПоказы: 53

Как сделать поисковик? Ответ здесь! Сегодня мы с вами сделаем поисковик типа google, yandex, aport, rambler, yahoo.

От: Анатолийl Интернет> Поиск в сетиl 15/11/2008 lПоказы: 6,777 lКомментарии: 1

В этой статье речь пойдет не о поднятии тИЦ, PR, не о позициях в каком-нибудь поисковике, а именно о привлечении посетителей непосредственно на сайт не через поисковую систему, речь пойдет о нестандартных способах / методах раскрутки сайта.

От: Анатолийl Интернет> Интернет-маркетингl 26/10/2008 lПоказы: 5,253 lКомментарии: 1
Блок автора
Категории статей
Quantcast