2015.11.24西北狼 API -- это сторонний код, работающий на лету, например облачные шрифты от Гугла, что использует куча сайтов, кнопка с лайком от Фейсбука и прочее.
Что за бред? API - это стандартизированный набор команд. На том же примере яндекса, у него есть Translate API:
https://translate.yandex.net/api/v1.5/tr/translate ?
key=<API key>
& text=<text to translate>
& lang=<translation direction>
& [format=<text format>]
& [options=<translation options>]
Можно заблокировать доступ к яндекс-переводчику, но заблокировать конкретные API... Ибо запрос будет звучать как $request &text"hello" &lang "eng_rus" &format"UTF8" &options“” &appid"1222213" &appkey"1231412124"... Блокировать можно или весь запрос по ключевым словам, или обращение к определенному сервису, но никак не конкретный API.
Озвучьте, сделайте милость, как заблокировать &text, но оставить &lang...
Про Real-time Traffic Inspection - тоже маразм - в том же VK туева хуча упоминаний про тех же фалуней, но доступ к нему никто не блокировал. Фильтрация контента падает на разработчиков и дистрибьюторов контента - любой магазин( тот же 91, теперь - байду) требует добавления в любое приложение фильтра 敏感词, иначе приложение просто не пройдет 审批.
Тот же 敏感词库 даже в сокращенном виде - это таблица на пару мегабайт. В полном - около полгигабайта. Если уважаемый
西北狼 озвучит, какая система сможет фильтровать на лету КАЖДЫЙ запрос к сайту без ICP и сопоставлять его с полгигабайтной базой - это будет круто, но вряд ли такие мощности вообще имеются в мире. Это ж застрелиться можно - десятки миллионов лаоваев, сотни миллионов запросов ежеминутно - и сопоставлять каждый с гигабайтной базой.
Учитывая тот факт, что если на супер 8-ядерный Xeon(с SSD само собой) загрузить 100-мегабайтную MySQL базу, то при условии наличия всего 1 клиента на сервера, запрос на соответствие ВСЕМ записям в базе займет около 7 секунд. То, наверное, весь Синьцзян заставлен серверами, которые только тем и занимаются, что сопоставляют трафик за рубеж с базой 敏感词. А если учитывать, что фильтровать надо и внутрикитайский трафик, то серверами заставлено несколько провинций, не иначе...
Короче, откройте эксель и таблицу на 100к+ символов. Задайте поиск по букве "а". И идите пить чай - раньше, чем через несколько минут компьютер не очнется.
Да и по времени, которое проводит пакет на файрволле - traceroute выдает задержку в 200 мс. Ну никак не успеть проверить полгигабайтную базу текста за 200 мс. И за 2000 не успеть. Но вам виднее, не иначе.