11
2010.09.29бкрс Я тоже склоняюсь, что это какая-то система что-то делает. Может не гугл и не байду, а что-то более локальное.
Просто тут есть одно "но" - база открытая, с ней можно делать все что угодно, зачем на сайт лезть?

Это или не от большого ума или кто-то слишком хитро*опый.
Именно потому что он бот, потому и и*иот! IdeaIdea

я заметил на распечатке он простым перебором запрашивает, то есть вслепую , даже элементарных понятий в языке бот не имеет
2010.09.30
Тема Ответить
12
Если вас идиот по башке арматурой стукнет, вряд ли вам будет легче, от того, что он идиот Smile

В данном случае мы не знаем какова цель этих запросов, поэтому не можем судить помогают ли они хозяину или нет.
2010.10.01
Тема Ответить
13
Sogou ищет?
есть поисковик такой ,его можно смело банить

а что в UserAgent ?
2011.03.07
Тема Ответить
14
Да там не написано кто это.
Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)
Я бы с удовольствием его забанил, проблема лишь в том, что он IP все время меняет.
Тут только хитрый скрипт писать, который считает сколько запросов с одного IP за короткое время произведено и банить если много.
Но это еще вопрос что дешевле - держать такой скрипт или закрывать на этого бота глаза.

Из последних его минуту назад:
Цитата:律和声
律和省
绿和省
率和省
旅和省
旅和 
率 

声依永
盛意用
生疑用
生意用

На какое-то IME похоже.
2011.03.07
Тема Ответить
15
а если добавить RECAPTCHA на основную страницу, чтобы незарегистрированные пользователи могли делать запросы по словарю только после подтверждения их "человечности"? тут неможко об этом вместе с PHP:
http://code.google.com/apis/recaptcha/docs/php.html
2011.03.07
Тема Ответить
16
не банить, а капчу пихать, если запросов слишком много в минуту, ну и ограницение на количество пользы ввести
2011.03.08
Тема Ответить
17
Каптча как один из вариантов, хотя хотелось бы ее избежать. А если отслеживать частоту запросов, то сама система будет жрать гораздо больше ресурсов чем этот наглый бот.
Есть же еще хорошие боты, из поисковых систем, типа гугловского. Но почему-то они не отражаются в статистике (они в отличии от этого должны ходить только по существующим страницам), хотя сайт вроде нормально индексируется. Не соображу как так получается. Не хотелось бы их забанить. Не выплеснуть бы с водой ребенка.

У "бесполезных" посетителей качество поиска будет похуже, но достаточно высоким, чтобы заинтересовать новых участников. Ведь никто из пришедших не понимает разницы между Словарем и данным сайтом. Т.е. сильно притеснять разными капчами нельзя.
Социальное расслоение будет обязательно происходить. Ведь изначально сайт делался именно как инструмент работы со Словарем, а не онлайн-словарь.


Заметил, что этот бот присосался именно к быстрому поиску. Изменил имена скриптов, если тот бот на автомате, без захода на сайт, то ему тоже придется в ручную адреса менять. Буду иногда менять и следить, может поможет. Пока вроде исчез, но он и раньше не периодически был.
2011.03.08
Тема Ответить
18
2011.03.08бкрс Но почему-то они не отражаются в статистике

Может это не по теме, но если из статистики смотреть слова, то они не отображаются в статистике. То есть если я нажимаю на слово, которое только что кто-то смотрел, то мой запрос идет мимо статистики.
2011.03.10
Тема Ответить
19
Это не баг, это фича. Так сделано специально, чтобы дублирования не было.
Потом надо сделать, чтобы если другим человеком, то сохранялось.
2011.03.10
Тема Ответить