Любопытный момент в свете событий - т.к. тасс ддосили, он закрыл доступ для парсинга с зарубежный серверов, там выскакивает какая-то проверка.
К сожалению, он является самым адекватным официальным источником, пропаганда видна только с высокой точки, сами новости представлены как факты, с минимум "правильных пояснений", было весьма хорошо. Его альтернатива риа это ужас в этом смысле, к ней доступ сохранился.
Планирую настроить парсинг в полуавтоматическом режиме (нужно в ручную на компе ссылку нажимать, хотя бы пару раз в день), т.к. качество существенно ухудшилось.
2021.03.24 Чуня Вот еще один сайт про Китай - https://www.chinainc.ru/
Если вы случайно владелец, то как это соотносится с http://china-inc.ru/ , какой смысл менять домен?
2019.06.30 ноябрь а что с сайтом south-insight.com? его взломали или просто умер, но присутствует в источниках бкрс?
Умер, но сам сайт работал, просто обновлялся уже года два. Если не очухается, уберу.
2019.02.01 snum23 материал дзена мы не хотим дублировать на сайт, хотел просто отображать нашу ленту дзена (как с виджетом твиттера например слева на сайте у нас), чтобы люди туда переходили читать, а не самого нашего сайта, поэтому дублировать материал смысла нет, да и это не одна минута, а две как минимум))
Понятно, но тогда можно просто дублировать заголовок, а внизу ссылка. Я бы понял, если бы у вас материалов было много, но тут же пару раз в неделю ctrl+c ctrl+v нажать (две минуты это наверное если с чаем).
Значит вы дзен хотите основным каналом сделать, но тут всё равно можно копировать полностью с сылкой, кому нравится дзен, будет там читать.
2019.02.01 snum23 насчет спарсить - а можно как-то спарсить в виде удобоваримой rss (желательно с превью-картинкой) ?
Можно конечно, по сути это и есть rss в другом виде, картинка тоже там. Но нужно, чтобы кто-то его переделал как надо и подключил куда вам нужно. Хорошая практическая задача, чтобы повысить свой уровень программирования
Если я буду делать, то сразу себе в базу сохраняю. Там json формат, по сути проще не бывает (но первый раз нужно повозиться). Но не исключено, что яндекс может что-то поменять, тогда нужно переделывать, т.к. это не "официальный канал", в отличии от rss.
2019.02.01 snum23 да можно, конечно, просто времени жалко и лень все руками делать, хочется все эти мелочи автоматизировать, сделать удобно, чтобы заниматься более полезными вещами (например, непосредственно контентом)
Всё-равно не понимаю логики, копировать текст это меньше минуты, у вас же их там не сотни в день, а несколько в неделю, зачем там автоматизация. Наоборот, нужно будет что-то подправлять (оформление, картинки).
На счёт добавления в ленту, я потом гляну, там конечно придётся парсить, но вроде тут всё готовое. Если к себе не будете дублировать. Немного непонятно как это свомещать с вашей лентой, чтобы не было одного и того же, но там разберёмся, если добавлю.
2019.02.01 snum23 так я и хочу на наш сайт вставить, но как из дзена достать или слепить rss, пока не понял.
А почему в ручную нельзя, зачем вам rss? Туда и туда сразу добавляйте.
Цитата:Пока просто в шапке поставил ссылку, что мол и там у нас блог есть.
Не вижу её, ссылка на блог, кстати, на старый домен ведёт.
--
Нашёл, я в меню смотрел, а не в информатор, к тому же его на главной нет.
snum23, вообще агрегаторы/социалки не планировалась, но можно глянуть, вдруг подойдёт.
А где ссылка, даже на сайте у вас не вижу.
Почему не хотите к себе дублировать?
rss я не увлекаюсь, они нужны для простого подключения к ленте, иначе приходится страницу грабить и регеспами выковыривать.
Для дзена нужно поискать, возможно, есть уже готовый сервис.
snum23, почему у вас на русском? Там жесткая форма, нельзя менять.
Код:
Here are examples of valid RFC822 date-times:
<pubDate>Wed, 02 Oct 2002 08:00:00 EST</pubDate>
<pubDate>Wed, 02 Oct 2002 13:00:00 GMT</pubDate>
<pubDate>Wed, 02 Oct 2002 15:00:00 +0200</pubDate>
А у вас
Код:
<pubDate>пн, 24 дек 2018 19:58:23 +0300</pubDate>
Сейчас парсер не может с ней с ней справится, поэтому думает, что время 0, поэтому не включает (старые не включается). Переделайте на анлглийский. Можно, конечно, персональное правило ввести, сейчас у всех по дефолтному strtotime() расчитывается.
snum23, в вашей rss ленте нет времени, только дата
http://chineseplus.ru/sites/default/rss.xml
<pubDate>11.12.2018</pubDate>
должно быть
<pubDate>Fri, 21 Dec 2018 10:05:18 +0000</pubDate>
Или сами поменяйте, если сможете найти где, или я потом подкорректирую, чтобы рядом с датой получения было
2018.06.15 В синюю гать РБК приличные новости по Китаю: https://www.rbc.ru/search/?project=rbcnews&query=%D0%BA%D0%B8%D1%82%D0%B0%D0%B9
Источник-то приличный, но там новостей по Китаю не много, все которым там есть уже присутствуют. То есть, там в Китай особо не вникают, только основные перепечаютывают.
Послежу, если хотя бы редко что-то уникальное будет появляться, можно будет добавить.
|