1
Есть ли возможность скачать словарь вместе с сателлитами? Иногда встречаются термины, в которых в "основном" словаре только английский перевод, а русский в сателлите.

Поиск в интернете по отдельным словарям не сильно помогает. Какие-то сателлиты находятся, но далеко не все. Например, слова типа
Цитата:堵灰 забивание золы
蒸汽带水 унос влаги с паром
固有水份 свойственная влажность
и т.д.
взяты из "Китайско-англо-русский словарь терминов по тепловой электростанции 汉英俄火力发电厂常用词汇", но он находится только в pdf, а в dsl или чём-то таком его нет в общем доступе. Откуда он взялся тут?

Судя по теме Новые сателлиты, некоторые словари присылали лично бкрс. Может быть на них ещё сохранились ссылки, можно их как-то достать? Интересуют конкретно русскоязычные тематические словари с терминологией.
2023.07.09
править Тема Ответить
2
Сателлиты скачать нельзя, у меня ссылок и файлов нет, только база на сайте, давно завязал с коллекционированием словарей. Выкладывать всю базу не планируется, и так 大БКРС по сайтам гуляет.

Многое в сателлитах не сохранялось и новые слова шли в словарь (как 固有水份).

Большинство сателлитов скачаны с открытых источников, помню большой сборник "словари для стардикт", где были все основные словари. Кое что-то я сам обрабатывал, некоторые присылали.

Конкретно по тем словам что вы привели, если не ошибаюсь, там была неопределённая китайская куча мала, которую пришлось сильно профильтровать, поэтому не стал заменять английские слова, т.к. много шлака. И они из тех, кто не сохранял новые слова (в словарь шли). Видимо, там был указанный словарь, т.е. отдельно его выделить не получится, даже в источнике, значит он у китайцев есть оцифрованный.

Хотя вы правы, что стоит включить русский перевод из сателлитов там, где он отсутствует, хотя бы просто рядом, чтобы его можно было скачать. Поставлю в тудушку.
2023.07.10
Тема Ответить
3
Я вас немножко попарсил на той неделе, надеюсь не сильно побеспокоил.

В процессе обнаружил, что некоторые слова есть в скачанном словаре, но их нельзя посмотреть с сайта.
Код:
'乔鱂'
'他的校外作文成绩从来没低于4+'
'传说级发光鮟鱇怪'
'剗削'
'剗新'
'地下迳流潜水迳流'
'庄稼老儿没见过木鱼子——捱打的物'
'恐惧鮣魚'
'泉鱂'
'碱性平炉法硷性平炉炼钢法'
'种鱂'
'红宝石 + 白化蜘蛛卵囊'
'绿宝石 + 白化蜘蛛卵囊'
'落实性修理和預展的規模'
'蓝宝石 + 白化蜘蛛卵囊'
'诺氏鱂'
'超鱂'
'路氹'
'迳潦'
'酸碱平衡酸硷平衡'
'雨水的洩水面积'
'青鵁'
'高速断续器快速断路器'
'鮟鱇触须手套'
'鮣魚油'
'鮸姑'
'关于积极推进«互联网+»行动的指导意见'
'划桨小艇, 双人双桨划艇'
'卡车式搅拌机, 汽车式拌和机'
'受试杆, 试棒试验杆, 试棒试验杆'
'叶根, 叶柄'
'孔雀豆, 红荳, 相思树'
'导线拉伸, 导线拔制'
'成套锉刀成套锉刀, 组锉刀一组锉刀'
'抵陒'
'控制盘, 控制板板式控制盘'
'机械寄存器, 机械计数器'
'核 外电子层, 外壳 层'
'桨式搅拌机, 叶片搅拌器'
'次级电池, 二次电池蓄电池'
'液压松脱-弹簧制动多片式制动器'
'烫平地沥青混凝土, 热压滚平地沥青混凝土'
'离心式制动器离心闸, 离心制动机离心闸'
'红外线导引, 红外线制导'
'窒息灭火系统, 惰性气体灭火系统'
'置入罩壳处理法, 外罩法'
'蒸汽吹灰器, 蒸汽清洗器'
'蟠虁文'
'辅助厂房+29. 00M标高处气流系统'
'顚晃'
'料俸'
'鸟苷-3'-磷酸'

Последнее (с ' в слове) ещё и небезопасно выглядит. Мне кажется с таким словом можно инъецировать что-то нибудь куда-нибудь  21


Довольно любопытно было заметить, что цвета в окне последнего поиска не рандомные, а генерируются из первых цифр IP.


Алсо, само это окно выглядит очень сомнительно, уверен там даже спам лист не работает.

2023.07.26
Тема Ответить
4
Цитата:В процессе обнаружил, что некоторые слова есть в скачанном словаре, но их нельзя посмотреть с сайта.
Из-за "плохих" иероглифов, которые тут автоконвертируются. Их конечно исправиь/удалить надо.

Цитата:Последнее (с ' в слове) ещё и небезопасно выглядит. Мне кажется с таким словом можно инъецировать что-то нибудь куда-нибудь  21
Инъекцировать или можно или нет, сам по себе символ ничего не значит.
Проблемы раньше были, все исправлено.

Цитата:Довольно любопытно было заметить, что цвета в окне последнего поиска не рандомные, а генерируются из первых цифр IP.
Алсо, само это окно выглядит очень сомнительно, уверен там даже спам лист не работает.

У ip там только первые три части и через несколько секунд оно все канает в лету. Все это легко меняется, но это несущественно.


Про спам, парсинг и тп не волнуйтесь, тут все настроено и при необходимости вычищает хорошо. Навредить можно только забив канал и то, быстро придется с клаудом иметь дело.
2023.07.26
Тема Ответить
5
бкрс, на этой странице bkrs.info/p47, в базах "за сегодня" база примеров мне кажется кривовата, её не удается нормально разделить в 2 столбика - китайский и русский. Из-за этого в dsx.html пришлось их конвертировать в один а это не очень удобно.
В связи с этим вопрос: можно ли поправить?, или можно сразу скачать в формате серверной таблицы (mysql,sqlite,..) ?
2023.12.20
Тема Ответить
6
dsx, в чём кривость заключается?
Как я понимаю, в примере может быть пустая строка и она мешает разделить.

По хорошему пустых строк в примерах быть не должно.

Я уберу пустые строки в дампе (будет завтра).
2023.12.20
Тема Ответить
7
2023.12.20бкрс dsx, в чём кривость заключается?
Как я понимаю, в примере может быть пустая строка и она мешает разделить.

По хорошему пустых строк в примерах быть не должно.

Я уберу пустые строки в дампе (будет завтра).
Пустые есть но хуже то, что помечено заметками слева на видео с экрана, их разделить невозможно, и этого очень много
https://disk.yandex.ru/i/-f3q_JlR518DDQ
2023.12.20
Тема Ответить
8
бкрс, там огромные массивы "тёмных кусков" данных, какие-то песни и пр. Их не получается найти, пытался
2023.12.20
Тема Ответить
9
dsx, я там причесал что увидел, убрал везде \r, сделал всем trim (почему-то не было при сохранении). А при дампе в следующих версиях пустых строк не будет (\n\n на \n). Так что будет нормально делиться по строкам.

Песни надо удалять, тут поиск не предназначен для крупных отрывков. Одно среднее предложение норма, всё остальное нужно делить.
2023.12.20
Тема Ответить