на чем основано это утверждение, откуда у вас такие данные?JamesTheBond пишет: ↑25 июн 2024, 10:56 Вот, опять-таки, говорим ли мы о словах или гнездах. Такого количества гнезд в общелитературном языке и близко нет.
например в песне льда и пламени 10600 слов из 1200 "гнезд" выше 10ой тысячи, это не учитывая кучи proper nouns и слов которых нет в списках. Это одна книжка, еще неск десятков книг возьмете и встретится половина слов из 10-25 тысячи))
решается, выше у меня был пост об этом.JamesTheBond пишет: ↑25 июн 2024, 11:02 Я обратил и именно на это ответил, что это задача не решается. Если включать туда всю научную литературу мира, то это абсолютно бессмысленно – на каком месте будут слова "анизотропия" и "силур" не имеет никакого значения, так как к ним вообще понятие частотности неприменимо. Возможность их встретить зависит только от тематики и больше ни от чего.
Зато это исказит статистику действительно нужных слов.
почему это не имеет значение? как минимум увидев частотность, можно понять для себя - стоит ли его учить на данном жизненном этапе или есть слова поважнее.
применимо.
не понимаю каким образом исказит.
В идеале было бы здорово знать наперед все слова, которые встретятся человеку в будущем и тогда можно было бы составить свой уникальный корпус и для него сделать ранг слов по важности. В реальности же можно попытаться составить усредненный корпус.