Парсить гугл - просто результат выдачи.

Discussion in 'SЕО - тонкости, методы раскрутки' started by Adio, 18 Oct 2012.

  1. Adio

    Adio Elder - Старейшина

    Joined:
    23 May 2005
    Messages:
    1,646
    Likes Received:
    147
    Reputations:
    18
    Вопрос,
    Как мне спарсить результат в гугле
    Где написанно Found 33,444 web sites ну т.е сколько найдено,
    Дело в том что все зашифрованно в нем и сделать регуляркой нереально :)
    Я как то помню давно мне кто то давал ссылку где без шифровки можно парсить, но не помню к сожелению.
    Кто поможет +
     
  2. mironich

    mironich Elder - Старейшина

    Joined:
    27 Feb 2011
    Messages:
    733
    Likes Received:
    73
    Reputations:
    19
    Code:
    id=resultStats>.+?(\d+)
    
    У меня такая работает.
     
  3. Adio

    Adio Elder - Старейшина

    Joined:
    23 May 2005
    Messages:
    1,646
    Likes Received:
    147
    Reputations:
    18
    Не понял ? А что за страницу ты парсиш ? www.google.com ?
     
  4. mironich

    mironich Elder - Старейшина

    Joined:
    27 Feb 2011
    Messages:
    733
    Likes Received:
    73
    Reputations:
    19
    Да .,.
     
    1 person likes this.
  5. Adio

    Adio Elder - Старейшина

    Joined:
    23 May 2005
    Messages:
    1,646
    Likes Received:
    147
    Reputations:
    18
    :) ща попробую
     
  6. Adio

    Adio Elder - Старейшина

    Joined:
    23 May 2005
    Messages:
    1,646
    Likes Received:
    147
    Reputations:
    18
    Не парсиццо

    $output = curl_get_contents("http://www.google.com/search?q=achat");



    preg_match_all("#id=resultStats>.+?(\d+)#i", $output, $resultzz);

    print_r($resultzz);
     
  7. Skofield

    Skofield Elder - Старейшина

    Joined:
    27 Aug 2008
    Messages:
    937
    Likes Received:
    355
    Reputations:
    58
    Оказывается там кавычки есть и циферки с запятыми:
    PHP:
    $output file_get_contents("http://www.google.com/search?q=achat");
    preg_match_all("#id=\"resultStats\">([A-Za-z\d\s,]+)#"$output$resultzz); 
    print_r($resultzz);
    [​IMG]
     
    #7 Skofield, 18 Oct 2012
    Last edited: 18 Oct 2012
    1 person likes this.
  8. m00c0w

    m00c0w Banned

    Joined:
    25 Dec 2011
    Messages:
    103
    Likes Received:
    14
    Reputations:
    5
    SEARCH_URL = 'http://www.google.com/m?source=mobileproducts&dc=gorganic'
    REGEX_URLS = r'url\?q=(.*?)&amp'

    всё ок собирает.
     
  9. Adio

    Adio Elder - Старейшина

    Joined:
    23 May 2005
    Messages:
    1,646
    Likes Received:
    147
    Reputations:
    18
    Так, спасибо за аперативность :)