Большой Воронежский Форум
» Веб-дизайн>Капча Яндекс.ОЙ.
AlexanderSergeev 22:16 09.07.2011
Вот тупанул, схлопотал капчу. Парсил по нужде выдачу, и забыл слип поставить в скрипте.
Вот и схлопотал((

Теперь вот тока не могу снять, капча на сервер стоит, а как от "его" имени ее ввести - хз.

Пробовал через AJAX+jquery+php:

сначала file_get_contents
потом ajax уже append к диву.
ввожу капчу спарсенную, отправляю, попадаю на страницу поиска...но со своим ip а не сервера.

Мозга не хватает додуматься как от имени серва ввести капчу?
Или сколько ждать пока снимут? [Ответ]
silly 22:20 09.07.2011
Ого чем мы занимаемся…
http://www.google.ru?q=php+web+proxy [Ответ]
AlexanderSergeev 23:53 09.07.2011
Да матчасть я выучил...тока поздновато)
Так что вот жду более конкретных предложений по избавлению от капчи(

ЗЫ

Сообщение от silly:
http://www.google.ru?q=php+web+proxy

http://www.google.ru/search?q=php+web+proxy [Ответ]
silly 08:05 10.07.2011

Сообщение от psihOZ:
Пробовал через AJAX+jquery+php:

сначала file_get_contents
потом ajax уже append к диву.
ввожу капчу спарсенную, отправляю, попадаю на страницу поиска...но со своим ip а не сервера.

Вообще не понял, что здесь написано.

Сообщение от psihOZ:
Да матчасть я выучил...

Очевидно, еще нет. Любого скрипта по ссылке выше должно быть вполне достаточно для отправки капчи вручную. После установки скрипта на сервер, само собой. Что касается конкретно яндекса: для ботов есть Яндекс.XML (http://help.yandex.ru/xml/licence.xml).

Я, честно говоря, не знаком с особенностями работы яндексовой капчи. Вот здесь вот http://captcha.yandex.ru/ торчит <input type="hidden" name="remote_ip" value="x.x.x.x">, не знаю зачем. [Ответ]
AlexanderSergeev 09:44 10.07.2011
silly, там написано, что я страницу с капчей вывожу себе на экран, ввожу капчу, жму отправить..но яндекс не Ip сарвера, а мой записывает.
XML не подойдет.

>>любого..вручную..
И каким же образом использование прокси поможет мне отправить капчу вручную?

Как бы там ни было, МНЕ НУЖНО КАПЧУ КАК-ТО ВВЕСТИ С АЙПИ СЕРВЕРА,ИНАЧЕ ПО СТАНДАРТНОМУ ПРОТОКОЛУ ДАЖЕ RDSBAR МНЕ ОЙ ПИШЕТ ВМЕСТО ДАННЫХ. [Ответ]
DRON-ANARCHY 10:11 10.07.2011

Сообщение от psihOZ:
МНЕ НУЖНО КАПЧУ КАК-ТО ВВЕСТИ С АЙПИ СЕРВЕРА

Проксю на сервер установи [Ответ]
AlexanderSergeev 10:26 10.07.2011
DRON-ANARCHY, сервер то не мой личный..у меня там хостинг оплачен. Сайт лежит и все.
Короче беда, уже вторые сутки жду, капча все еще есть. [Ответ]
olegkm 19:40 10.07.2011
Сейчас банится на раз за прямое дерганье выдачи, используй xml от яндекса. На рамблер с этого ip не шлешь ещё запросы? [Ответ]
AlexanderSergeev 20:57 10.07.2011
olegkm, более нет. уже сутки даже больше не трогаю, не хочется проверять даже...както не могу додуматься, парсю капчу, ввожу, а какже перешел чтобы по ссылке сам сервер..вобщем всю голову сломал! мне б от этой избавиться и больше б не попался( [Ответ]
silly 21:47 10.07.2011
Я надеюсь, ответ (POST-запрос на адрес http://captcha.yandex.ru/pages/index/send/send.xml) ты с сервера посылаешь? На код взглянуть можно? [Ответ]
AlexanderSergeev 22:09 10.07.2011
silly, Я НЕ ЗНАЮ КАК ЭТО СДЕЛАТЬ. как послать запрос от имени сервера?
Вот что я делаю:
1)echo file_get_contents('http://yandex.ru/yandsearch?text=search'); отдаю всю страницу
2)$(".yandex").append(data); вывожу через ajax страницу в блок
Вот потом у меня на странице все что спарсил с поиска - капча и куча текста.
Я ввожу капчу и нихрена не срабатывает.

Подскажи как и что надо провернуть?

"Пост запрос от имени сервера", это как? капча же поменяется..или я всетаки не понял( [Ответ]
silly 22:18 10.07.2011
Ну, например: http://parsing-and-i.blogspot.com/20...curl-post.html. От себя добавлю, что проверять при получении ответа от яндекса нужно код ответа (должен быть 302, поскольку перенаправление) и заголовок location.

P.S. Определенно это не спам-бот [Ответ]
silly 22:43 10.07.2011

Сообщение от psihOZ:
капча же поменяется

Не думаю, что яндексу интересно, какая по счету это была капча.

Действия:
1. Сделай себе скриптик get_captcha.php, запрашивающий страницу http://captcha.yandex.ru/ и показывающий картинку, содержимое полей key и remote_ip из формы с капчей.
2. Сделай скриптик post_captсha.php, отправляющий форму с полями key, remote_ip и rep на адрес http://captcha.yandex.ru/pages/index/send/send.xml.
3. Бонусные очки за объединение 1 и 2 в один файл. Хотя нет, лучше не надо.

Способ «полегче» я уже предлагал выше, если что. [Ответ]
AlexanderSergeev 23:00 10.07.2011
Хм...

$t=file_get_contents('http://captcha.yandex.ru/');
$t=preg_replace('!pages/index/send/send.xml!','http://captcha.yandex.ru/pages/index/send/send.xml',$t);
Ремоут Айпи Сервера,все как надо.
Жму отправить, перенапраляет на яндекс...

НО! при попытке спарсить http://yandex.ru/yandsearch?text=search снова ОЙ...
кстати форма ОЙ отличается немного скрытыми полями, там нет IP, хоть я и пытался input с ip вставить, всеравно не пускает.

варианты?
странно..вроде ж все как надо(( [Ответ]
DRON-ANARCHY 09:41 11.07.2011

Сообщение от psihOZ:
сервер то не мой личный..у меня там хостинг оплачен. Сайт лежит и все.

Ну анонимайзер простенький влепи

Сообщение от psihOZ:
как послать запрос от имени сервера?

cURL - интересная штучка. Можно полностью сымитировать заход пользователя, а не тупо запрос с сервера, выставив всякие там юзер-агенты, куки и прочую хрень.

Кстати, а почему бы тебе не поюзать XML для парсинга? [Ответ]
silly 17:45 11.07.2011

Сообщение от silly:
2. Сделай скриптик post_captсha.php, отправляющий форму с полями key, remote_ip и rep на адрес http://captcha.yandex.ru/pages/index/send/send.xml.

Я, наверно, опять непонятно выразился: сначала форма отправляется на тот самый забаненый сервер, потом скрипт отправляет эти данные яндексу. [Ответ]
AlexanderSergeev 21:05 11.07.2011
УРА! СНЯЛИ КАПЧУ! сутки прошли!

ЗЫЗЫЗЫ:
Нашел как в php запросы слать POST и наконецто допетрил про что silly говорил, спс!
Dron, а вот CURL там не установлен, а XML есть, но там ограничение(( [Ответ]
AlexanderSergeev 21:31 11.07.2011
И снова забанили! Че за нафиг! У меня задержка по 10 секунд стояла!....уЖОС!
Теперь точно придеца изголяца((((((( [Ответ]
silly 22:24 11.07.2011
Ну, отсутствующий curl это еще не конец света, можно попробовать через fsockopen.
Или хм… вот что мне гугл находит http://habrahabr.ru/blogs/php/48726/. [Ответ]
olegkm 19:11 12.07.2011

Сообщение от psihOZ:
И снова забанили! Че за нафиг! У меня задержка по 10 секунд стояла!....уЖОС!
Теперь точно придеца изголяца(((((((

10 секунд очень мало, более менее 10 минут, если не изголятся с куками и переходами с разных страниц и тд. Быстрее только XML от яндекса, либо через прокси, которые нигде не светились. Купи например 10 впсов по 2 бакса, будет 20 прокси, а это 6*20=120 запросов в час, добавляешь yandex xml - 1000*20/24=833 запроса в час (правда надо еще 20 сотовых, но их можно при желании раздобыть) [Ответ]
DRON-ANARCHY 20:50 12.07.2011

Сообщение от psihOZ:
XML есть, но там ограничение((

Тебе 1000 запросов в сутки мало?

Сообщение от silly:
можно попробовать через fsockopen

Геморно имхо
Плюс еще можно быть практически уверенным, что если нет curl то и сокеты будут залочены. psihOZ, че за сервер у тебя такой, где курла нет?))

Сообщение от psihOZ:
У меня задержка по 10 секунд стояла!

Это не много.
[Ответ]
Вверх