Показаны наиболее выделенные сообщения темы
Вернуться в полную тему
1
>>>
2019.04.05Yaroslav Arhaluk, постараюсь написать, пишу диссер по ним в Германии, но в данный момент в поездке. Главная проблема - разграничить эвфемизмы, ставшие частью общего лексикона, "фоссилизировавшиеся" в слова и обороты обычного носителя, и эвфемизмы, воспринимающиеся как литературные цитаты, как приём, как новинка. Тут поможет только опрос носителей в таком масштабе, который диссертанту в одиночку едва ли возможен...

Какие опросы, вы что? Эти все задачи решаются стандартными статистическими методами: во-первых, все интересующие слова делятся на группы сходных слов (через кластеризацию на базе любой метрики, хоть даже Левенштейна), затем берутся массивы текстовых данных (блоги, форумы, соцсети) за разные периоды времени и для каждой группы слов строится модель по типу нелинейной регрессии, описывающая изменение частоты использования слов в каждой группе с течением времени. Визуально это - кучка графиков, по одному графику на каждую группу сходных слов.

Далее на основе этих моделей уже делается классификация, выделяющая те группы, слова которых относятся к устойчивым языковым единицам (стабильный тренд), те, которые относятся к новинкам (восходящий тренд), и те, которые стремительно превращаются в архаизмы (нисходящий тренд).

То есть, весь метод = кластеризация + регрессия + классификация. Все делается автоматически, полсотни строк в любом R, надо только сунуть на вход кучку текстовых файлов.

Опросы пары десятков людей на улицах - это годится только для курсовой на первом курсе, но не для диплома и уж тем более не для диссертации.
2019.04.05
Тема Ответить
2
>>>
test4, какие-то проблемы, молодой человек?

Читаем "Основные правила и инструкции форума":
Цитата:Свободно поднимайте старые темы, если они полностью сосуществуют тому, о чём вы хотите сказать или спросить.
Цитата:Отвечать в старых темах по существу (т.н. некропостинг) можно и нужно свободно.
2019.04.03
Тема Ответить