Вообщем хочу написать парсер на php , которыйпарсит загруженную страницу вот по такому вот алгоритму: 1. найти в тексте все имена людей и записать их в файл отдельно 2. найти в тексте все глаголы (Past simple tense) и также записать их в файл отдельно.. Вопрос: Это вообще реально ли? Можно ли это как то будет ускорить?
Реально, если есть словарь глаголов и отдельно имён. Если без словарей, анализировать где глагог, а где имя каким образом будешь? Попахивает лингвистическим анализатором, сам ты его сходу точно быстро не напишешь...
а как мне можно приучить паука чтобы он мог копировать страницы вконтакте в базу данных? Вконтакте ведь запаролен
в http запрос добавляй cookiesы контакта. Используй curl/zend_http_client, т.к с ними проще работать.