Ещё не хватает сократить там мета-информацию, т.к. в каждом блоке одно и тоже кроме падежа / лица
2022.06.17
2022.06.16остроwok Заметила, что когда есть такая проблема с двойным ударением, то ё всегда маленькая. А когда проблемы нет, то Ё - большая. Это так?Ё большая это где было ударение, там оно было апострофом, я их переделал на áи́е́я́о́ю́у́ы́э́, а для ё сделал большую, т.е. где маленькая, значит было без ударения. Цитата:И еще интересно, что по поиску смел вариант с ё (смёл) вообще не предлагается, потому что сам глагол "смести" не предлагается. Там вообще-то можно сделать, чтобы искало оба варианта, если случаев хотя бы несколько. 2022.06.17
Мне кажется там кое что автоматикой делали, т.к. нереально в ручную, поэтому есть косяки.
2022.06.16
2022.06.16остроwok Это что ещё) Женское от вметён (под половик) Туда же вы́бьёшься (от вы́бьются) Похоже там всё же есть штучный мусор: вспо́ёшь всполошённо́ 2022.06.16
С удивлением узнал, что у буквы ё нет ударения в юникоде (в отличии от áи́е́я́о́ю́у́ы́э́), пришлось выделять её большой Ё, что не очень смотрится.
Понимаю, что ё всегда ударное (амёбови́дный бочёно́чника вметёнá), но хотя бы в образовательных целях стоило. 2022.06.16
2022.06.16остроwok Ради интереса вбила принялсЯ, там вместо предпочтительного ударения дано только принЯлся. Ну и мотать вниз иногда долго. Но в целом здорово (2 ударения на месте). Как я понял, там из словарей балось, возможно что-то устаревшее. База хорошая, но где-то зацеплялся глаз за странности. Проверить всё это конечно не вариант. Цитата: Ну и мотать вниз иногда долго.Я там несколько раз туда сюда ставил, думал как лучше. Проблема в том, что у некоторых слов там оочень много вариантов и нужно или как-то сокращать или ставить вниз, т.к. всё же перевод важнее, а тут в самом верху такая портяка. Цитата:Спасибо за Ваш труд.Всё-таки там труд чужой, я всего лишь на заливку немного потратил. Как я понял, кто-то собирал эту базу по косточкам как мы сейчас БКРС, включая аналогию Зализняка<>Ошанин, Жаль, что нет связей переходности глаголов, т.к. именно это у нас в русский словах, что мы удаляем. Но думается, что подобное должно существовать, т.к. их не так уж и много (пары типа делать-сделать). 2022.06.16
Добавлена морфологическая база русского языка, 5 074 139 словоформ, 550 мб текста (для сравнения: 大БКРС — 350 мб).
Давно лежала, думал "может когда-нибудь" дойдут руки, но только что удалил очередную правку явно китайца, где он пытался сделать что-то с русским, что у нас не предусмотрено и что-то щёлкнуло. Оказалось не так уж страшно, для современных баз это мелочь и возни на пару часиков всего. Это не только чисто для китайцев, хоть и главное там - ударение и разбор слова. Но также это может помочь когда вбивают неначальную форму слова. Не хватает связей совершенных-несоврешненых глаголов и словообразования, если кто-то наткнётся, дайте знать. Взято от сюда, спасибо составителям. Цитата:Словарь составлен на основе известного файла "Полная акцентуированная парадигма по Зализняку" (2 645 347 словоформ) и существенно расширен за счет словарей в электронном виде доступных на http://www.speakrus.ru/dict2/index.htm и некоторых онлайн-словарей (особенно "Викисловарь") и энциклопедий. Для лемм, отсутствующих в доступных словарях, использованы данные из Национального корпуса русского языка и очевидные соображения. Пример: Цитата:сглáзить (гл сов перех инф) В словаре в существующих словах будет появляться постепенно, т.к. кеш. 2022.06.16
|