Один из способов проверить наложен ли на сайт какой-нить фильтр - это ввести url сайта в Яндекс и посмотреть выдачу. Если на 1 месте нет ссылки на проверяемый сайт, то можно сказать что сайт не чист :)

Я думаю что вы это знали до прочтения этой записи, но Яндекс не любит когда его пытают! Если парсить выдачу напрямую, то тогда он покажет капчу, а при обработке xml-запросов можно обратится только 1000 раз…

А выход то совсем рядом :) mail.ru использует выдачу Яндекса, правда только до конца  этого года…. Удачного парсинга!


Интересные записи:
Редирект в Яндексе
Опыт в киберсквотинге
Новая бага на сапе