Немного арифметики

Словарный состав языка, выбор лексических единиц, как учить и запоминать новые слова, тесты и задания на знание лексики, специальная лексика, словари и другие вопросы.

Модератор: zymbronia

Аватара пользователя
Yety
Сообщения: 11321
Зарегистрирован: 28 фев 2018, 23:44
Благодарил (а): 3443 раза
Поблагодарили: 5451 раз

#151

Сообщение Yety »

acapnotic пишет: 14 авг 2021, 12:18 кто же вам виноват?
Йэти ещё помнит то время, когда ваша цепкость приводила к позитивным результатам..
Хорошее было время.
Аватара пользователя
acapnotic
Сообщения: 4681
Зарегистрирован: 02 мар 2018, 07:49
Благодарил (а): 311 раз
Поблагодарили: 1067 раз

#152

Сообщение acapnotic »

Yety, вы хотите иммунитет от критики?
Аватара пользователя
Yety
Сообщения: 11321
Зарегистрирован: 28 фев 2018, 23:44
Благодарил (а): 3443 раза
Поблагодарили: 5451 раз

#153

Сообщение Yety »

acapnotic пишет: 14 авг 2021, 16:07 иммунитет от критики?
Боже упаси.
А вы не хотите иммунитета от критиканства?))
Аватара пользователя
acapnotic
Сообщения: 4681
Зарегистрирован: 02 мар 2018, 07:49
Благодарил (а): 311 раз
Поблагодарили: 1067 раз

#154

Сообщение acapnotic »

Yety пишет: 14 авг 2021, 16:14Боже упаси.
Ну вот он вас и упасает, а вы ропщете.
Yety пишет: 14 авг 2021, 16:14от критиканства
О каком критиканстве речь? Вы вроде бы согласились с тем, что я вам предъявил. Т.е. критика была справедливой. Или я опять вас не понял? Ну так неудивительно.
Andrea
Сообщения: 5497
Зарегистрирован: 28 июн 2020, 13:33
Благодарил (а): 4245 раз
Поблагодарили: 1546 раз

#155

Сообщение Andrea »

gavenkoa пишет: 22 сен 2020, 18:40 Пол составил список на основании BNC https://en.wikipedia.org/wiki/British_National_Corpus (100-million-word) + COCA (560-million-word), но "давно".

Т.е. данные на сайте COCA - "свежее".
А для British English чего-то посвежее нет? Расстроилась, что BNC уже, скорее, outdated, честно говоря. Остаётся лишь уповать на чтение прессы и contemporary prose? Ну, и лекции лингвистов слушать (нельзя недооценивать, да?) И/или специализированная литература какая-то?
Аватара пользователя
Харбин Хэйлунцзян
Сообщения: 1577
Зарегистрирован: 01 мар 2018, 13:59
Поблагодарили: 523 раза

#156

Сообщение Харбин Хэйлунцзян »

Харбин Хэйлунцзян пишет: 28 янв 2021, 21:45 corking (corker)

По всему судя, это ошибка в тексте который я читал, хоть и очень расплодившаяся:

https://www.google.com/search?q=%22cork ... f+earth%22

Аутентичный текст такой:

https://books.google.com/books?id=cyokA ... f+earth%22

For nowadays, the whale-fishery furnishes an asylum for many romantic, melancholy, and absent-minded young men, disgusted with the carking cares of earth, and seeking sentiment in tar and blubber.

-
Moby Dick, by Herman Melville

Слово corking, конечно, интересное, но carking интереснее.

-
Аватара пользователя
Харбин Хэйлунцзян
Сообщения: 1577
Зарегистрирован: 01 мар 2018, 13:59
Поблагодарили: 523 раза

#157

Сообщение Харбин Хэйлунцзян »

zymbronia пишет: 12 дек 2020, 22:19 Я когда начал изучать язык, после Бонка, прочитал 30 книг за три месяца, в среднем по 250-300 страниц

[snip]

Тогда распознавал 1500 слов

Мой друг подарил мне книжку The Lost World, by Arthur Conan Doyle и приложил к ней старые тетрадки - выписанные незнакомые слова. Записи обрываются вот так:

Изображение

Я поискал в книжке и это 115я страница - где-то 10 слов на страницу. Надо признать это издание эконом класса и страницы очень плотно упакованы текстом но если пересчитать на страницы в книжке типа HP из первого сообщения этой темы то получится тоже немало - 7 слов на страницу.

Я как-то уже рассказывал что оценивал словарный запас который мне дало советское образование - школа + институт - и получилось где-то 4000 словарных статей. В отличие от меня у моего друга оценка отлично за иностранные языки и можно сказать уверенно что его словарный запас был не меньше моего.

Еще можно сказать что он всегда был очень упорным студентом - не пропустил ни одной лекции, не списал ни одного задания. И видимо чтение этой книжки его единственное незавершенное начинание.

Я воспользовался поводом и перечитал эту книжку - очень простенькая. Какие же книжки люди читают с запасом в 1500?

-
zymbronia
Сообщения: 2749
Зарегистрирован: 02 мар 2018, 16:21
Благодарил (а): 207 раз
Поблагодарили: 477 раз

#158

Сообщение zymbronia »

Харбин Хэйлунцзян пишет: 08 мар 2022, 11:25 Какие же книжки люди читают с запасом в 1500?
Сначала про колобка. Потом адаптированные, потом оригинальные. Но это все быстро, тк. я читал везде - в метро, в очереди, ночью - каждую свободную минуту. А словарем пользовался редко - только те слова, что не позволяли понять общий смысл. Никогда не пытался понимать дословно.
zymbronia
Сообщения: 2749
Зарегистрирован: 02 мар 2018, 16:21
Благодарил (а): 207 раз
Поблагодарили: 477 раз

#159

Сообщение zymbronia »

Частые слова я запоминал, редкие и сейчас не знаю. Но за 3-4 месяца в пассив перевел по 1000 слов в месяц. Т.е. к концу этого этапа запас в пассиве был уже более 5000 слов.
Аватара пользователя
Харбин Хэйлунцзян
Сообщения: 1577
Зарегистрирован: 01 мар 2018, 13:59
Поблагодарили: 523 раза

#160

Сообщение Харбин Хэйлунцзян »

Закончилось время возможностей. Vocabulary.Com вводит плату для learners:

Изображение

Я возможно заплатил бы за месяц чтобы завершить последний марафон, но российские карты нынче не принимают. Думаю все к лучшему.

Мне кажется я запомнил все что нужно было запомнить. По моим оценкам этот тренажер дал мне >4000 слов в словарный запас - это именно те слова которых не хватает для комфортного чтения когда со всем остальным вроде проблем нет.

После перечитанного Moby Dick, by Herman Melville я прочитал 21 книжку и перечитал еще 4:

Pride and Prejudice, 1813, Jane Austen
Wuthering Heights, 1847, Emily Brontë
Vanity Fair, 1848, William Makepeace Thackeray
A Tale of Two Cities, 1859, Charles Dickens
The Land of Fire, 1885, Mayne Read
The Complete Collection, 1902-1930, Beatrix Potter
Anne of Green Gables, 1908, Lucy Maud Montgomery
The Great Gatsby, 1925, F. Scott Fitzgerald
My Early Life, 1930, Winston S. Churchill
Swallows and Amazons, 1930, Arthur Ransome
Murder on the Orient Express, 1934, Agatha Christie
My Family and Other Animals, 1956, Gerald Durrell
Cat's Cradle, 1963, Kurt Vonnegut
Speak, Memory, 1966, Vladimir Nabokov
All Creatures Great and Small, 1972, James Herriot
The Witches, 1983, Roald Dahl
Guns, Germs, and Steel, 1997, Jared Diamond
The Devil in the White City, 2003, Erik Larson
Extraordinary, Ordinary People, 2010, Condoleezza Rice
Trust but Verify, 2013, Suzanne Massie
Maker of Patterns, 2018, Freeman Dyson

Treasure Island, 1883, Robert Louis Stevenson
The Lost World, 1912, Arthur Conan Doyle
The Restaurant at the End of the Universe, 1980, Douglas Adams
Matilda, 1988, Roald Dahl

По местным меркам это немного но для меня нормально и главное именно в таком диапазоне (годы, жанры) я хотел научиться читать когда пришел на EFL.RU в 2016 году. Можно сказать что в прошлом году я уже умел читать - значит на научиться мне потребовалось 6 лет. Не быстро, совсем не с нуля и не без словаря. Вот незнакомая лексика в одной из последних книжек:
The Devil in the White City, by Erik Larson - 69 слов и выраженийПоказать
strake
caisson (engineering)
the bends (decompression sickness)
cut loose with
flash flood
alienist (amer. psychiatrist)
deviltry
a blind spot for
stripe (amer. kind, sort)
lay someone low
excelsior (amer. fine wood shavings)
business (amer. patronage, custom)
grade level
virga
cutting bed (flower bed)
settlement house
sanpan (sampan, boat)
caique (boat)
summersweet (sweet pepperbush)
staff (amer. building material)
slash (woody debris)
vinca (periwinkle, plant)
claque (theatre)
intake crib (water crib, cribwork)
standpipe (firefighting)
virtuosic (adj. * virtuoso)
packinghouse
trocar
trepan (trephine)
standing army
discontinuity (lack of rational connection)
adlumia
catbriar (catbrier)
virgin's bower (clematis)
milkweed
umbilicus
flat-footed (downright and uncompromising)
freightyard
redux (adj.post. brought back)
felloe
writ of replevin
boxcar (amer.)
danse du ventre
plink [on the keyboard one note at a time]
slipperlick (probably invented by Larson)
frappé
sinker (amer. daughnut)
scrapple (amer.)
muriatic acid
pipe stem (pipestem)
lead (v. p. leaded. printing, provide space between lines with leads)
shim (v. printing, fill in, level, or adjust by using thin pieces of material)
stanhope (carriage)
mucid (adj. mucor)
gonfalon
in receivership
passbook (bankbook)
infilling (adj. filling in)
passkey (master key, skeleton key)
falsework
babbitt (v.t. line, face, or furnish with Babbitt metal)
root beer
trunnion
syncope (medic. technical word for a faint)
Chinese lantern
festal
engorged (with)
pigheaded
wrecker (amer. a person whose job is to demolish buildings)
-
Аватара пользователя
Харбин Хэйлунцзян
Сообщения: 1577
Зарегистрирован: 01 мар 2018, 13:59
Поблагодарили: 523 раза

#161

Сообщение Харбин Хэйлунцзян »

Изменение политики Vocabulary.Com было так неожиданно что когда я писал предыдущее сообщение я забыл упомянуть важный момент который вроде собирался упомянуть вместе со списком прочитанных книжек.

Когда в первом сообщении этой темы я использовал частотность слова squeamish, я в том числе опирался на собственный опыт - я не помнил чтобы оно мне встречалось и это значит что абсолютно точно оно мне не встречалось в предыдущих двадцати прочитанных книжках. В последней двадцатке оно мне таки встретилось.
И не раз...Показать
"Already arisen?" repeated Mr. Bennet. "What, has she frightened away some of your lovers? Poor little Lizzy! But do not be cast down. Such squeamish youths as cannot bear to be connected with a little absurdity are not worth a regret. Come, let me see the list of pitiful fellows who have been kept aloof by Lydia's folly."

-
Pride and Prejudice, by Jane Austen
-
The different conduct of these two people is pointed out respectfully to the attention of persons commencing the world. Praise everybody, I say to such: never be squeamish, but speak out your compliment both point-blank in a man’s face, and behind his back, when you know there is a reasonable chance of his hearing it again.

-
Vanity Fair, by William Makepeace Thackeray
-
I shook hands with him; it seemed silly not to, for I felt suddenly as though I were talking to a child. Then he went into the jewelry store to buy a pearl necklace - or perhaps only a pair of cuff buttons - rid of my provincial squeamishness forever.

-
The Great Gatsby, by F. Scott Fitzgerald
-
From his earliest boyhood, he was absolutely fearless, but was squeamish and wary of 'natural history,' could not make himself touch wriggly things, could not endure the amusing emprisoned tickle of a small frog groping about in one's fist like a person, or the discreet, pleasantly cool, rhythmically undulating caress of a caterpillar ascending one's bare shin.

-
Speak, Memory, by Vladimir Nabokov
-
Siegfried took the syringe and quickly infiltrated the area. "This is where we go inside, Hubert. I hope you aren't squeamish."

The colonel beamed. "Oh, I've seen blood before. You needn't worry, I shan't faint."

-
All Creatures Great and Small, by James Herriot
-
It may come as a surprise to learn that plant seeds can resist digestion by your gut and nonetheless germinate out of your feces. But any adventurous readers who are not too squeamish can make the test and prove it for themselves.

-
Guns, Germs, and Steel, by Jared Diamond
-
Mrs. Ferris insisted on being aboard for the first ride, despite Gronau's attempts to dissuade her. Gronau inspected the wheel to make sure the car would swing without obstruction. The engineer in the pit started the engines and rotated the wheel to bring the test car to one of the platforms. "I did not enter the carriage with the easiest feeling at heart," Gronau said. "I felt squeamish; yet I could not refuse to take the trip. So I put on a bold face and walked into the car."

-
The Devil in the White City, by Erik Larson
Вот такая получается частотность.

За прошедшую пару недель я дочитал еще одну книжку - Three Men in a Boat, 1889, Jerome K. Jerome. Слово squeamish в ней не встречается.

-
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#162

Сообщение Androbroiler »

По тестам из инета мой словарный запас 10-12 тысяч.
Сегодня взял частотные списки (BNC_COCA 25000) и посчитал какой процент слов я знаю начинающихся на букву "B":
получилось так
4 тысяча - 91%
8 тысяча - 63%
16 тысяча - 30% - тут за счет всяких багетов, ботулизмов и биотеха вышла такая цифра

Вот что интересно. Вроде бы Paul Nation писал, что надо знать около 9000 слов чтобы более менее свободно читать. Что имелись ввиду - именно первые 9000 частотных слов или вообще слов? Просто всегда же будет распределение по частотности с какой то долей незнакомых слов. Не может же такого быть, что в первых 9000 частотных слов знаешь все 100%, а в десятой тысяче 0%.
Судя по полученным мной результатам, в первых 10000 частотных слов я не знаю где то 2-3 тысячи. Насколько существенным будет эффект если их выучить до знания близкому к 100%?
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#163

Сообщение Androbroiler »

Харбин Хэйлунцзян пишет: 16 ноя 2020, 15:50 Занимательный случай вышел. Слово custard я наверно лет 10 знаю как что-то сладкое из яиц и молока, использующееся в десертах и как topping, но вопрос потребовал больших знаний:
и вправду занимательно, у каждого свой уникальный путь)
мне оно впервые встретилось в словосочетании "custard launcher".
слово mustard я знал, поэтому из контекста в общем и целом было ясно чем идет речь, но проверил на русском на всякий случай.
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#164

Сообщение Androbroiler »

Харбин Хэйлунцзян пишет: 18 ноя 2020, 10:13 Еще один занятный случай. У меня вопрос на слово ply:
у меня такие ассоциации: plywood, 3 or 5 ply fry pan, # ply thread

кстати слова ply и custard в 8 тысяче по частотности
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#165

Сообщение Androbroiler »

Для иллюстрации как сейчас выглядит мой словарный запас.

Тысяча частотности - Знакомые слова начинающиеся на букву "B"
1 - 100%
2 - 98%
4 - 91%
8 - 63%
12 - 45%
16 - 30%
24 - 14%

Изображение
Аватара пользователя
JamesTheBond
Сообщения: 5088
Зарегистрирован: 01 мар 2018, 11:08
Благодарил (а): 601 раз
Поблагодарили: 893 раза

#166

Сообщение JamesTheBond »

Androbroiler пишет: 18 июн 2024, 13:05 Для иллюстрации как сейчас выглядит мой словарный запас.
А что такое тысяча частности - 25?
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#167

Сообщение Androbroiler »

JamesTheBond пишет: 23 июн 2024, 09:47 А что такое тысяча частности - 25?
Двадцать пятая тысяча самых часто встречаемых слов.

Иными словами:
Если слова (точнее word family) расположить в порядке убывания частоты их употребления, то это будут слова с 24 000 по 25 000.
Аватара пользователя
JamesTheBond
Сообщения: 5088
Зарегистрирован: 01 мар 2018, 11:08
Благодарил (а): 601 раз
Поблагодарили: 893 раза

#168

Сообщение JamesTheBond »

Androbroiler пишет: 23 июн 2024, 14:42 Двадцать пятая тысяча самых часто встречаемых слов.
А столько слов вообще бывает? Или слова work, working и worker рассматриваются как отдельные слова все-таки, а не как word family? Можно пару-тройку слов из 25-й тысячи частотности? Никогда не слышал, что к таким словам вообще применимо понятие частотности - после 4-й тысячи гнезд уже все зависит только от тематики и ничего больше.
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#169

Сообщение Androbroiler »

JamesTheBond пишет: 23 июн 2024, 18:16 А столько слов вообще бывает? Или слова work, working и worker рассматриваются как отдельные слова все-таки, а не как word family? Можно пару-тройку слов из 25-й тысячи частотности? Никогда не слышал, что к таким словам вообще применимо понятие частотности - после 4-й тысячи гнезд уже все зависит только от тематики и ничего больше.
Я использовал BNC_COCA_25000, там как раз 25 тысяч.
Как одно слово, именно word family используется, например для слова work такие слова в word familiy:
rework
reworked
reworking
reworks
unworkable
unworked
workable
worked
worker
workers
workin
working
workings
works


Если корпус достаточно большой и представительный, то почему нет? В пределе если взять и отцифровать все книги, фильмы и журналы и т.п. то можно все слова проранжировать. Недавно натыкался на научную статью по лингвистике, там корпус был в триллионы слов, откуда то с гугла вроде.
Я видел такое ранжирование слов по частотности:
High frequency 3
Medium frequency 4-9
Low frequency >9
Причем есть утверждения, что знание первых 9 тысяч слов позволяет покрыть 98% слов в тексте, и поэтому можно экстенсивно читать без словаря оригинальные тексты, а значение низкочастотных слов угадывать из контекста.
По моим ощущениям medium frequency слова действительно представляют наибольшее препятствие на пути тех, кто хочет читать. С одной стороны, в отличие от слов low frequency, они достаточно часто встречаются, чтобы их незнание мешало пониманию. А с другой стороны, они встречаются достаточно редко, что естественной рециркуляции не хватает, чтобы их запомнить, как например high frequency слова.


Пример первых трех слов в алфавитном порядке из 25ой тысячи:
ablaut
absinth
absquatulate
Аватара пользователя
JamesTheBond
Сообщения: 5088
Зарегистрирован: 01 мар 2018, 11:08
Благодарил (а): 601 раз
Поблагодарили: 893 раза

#170

Сообщение JamesTheBond »

Androbroiler пишет: 24 июн 2024, 08:01 Если корпус достаточно большой и представительный, то почему нет? В пределе если взять и отцифровать все книги, фильмы и журналы и т.п. то можно все слова проранжировать.
Ничего не получится, потому что если взять все научные книги и журналы, то это будет совершенно бессмысленно, так как подавляющее большинство слов из них не знает никто кроме специалистов, и это лишь исказит картину.
Ну, посчитали мы на каком месте будут пеннанция, раффлезия и энцефалартос – практическая польза от этого равна нулю.
В общепринятом литературном языке около 10 тысяч гнезд (даже меньше). И еще десятки и десятки тысяч специфических терминов. Частотные словари осмысленны только для общелитературной лексики.

Практически никто не знает что такое аблаут/абляут – только филологи. Поэтому "место", которое он займет в частотном списке, зависит лишь от того, сколько для базы возьмут материалов по филологии.
Olla
Сообщения: 217
Зарегистрирован: 15 мар 2018, 20:40
Благодарил (а): 74 раза
Поблагодарили: 155 раз

#171

Сообщение Olla »

JamesTheBond пишет: 24 июн 2024, 14:16 Практически никто не знает что такое аблаут/абляут – только филологи. Поэтому "место", которое он займет в частотном списке, зависит лишь от того, сколько для базы возьмут материалов по филологии.
А место absinth в частотном списке, видимо, будет зависеть от того, попадут ли в корпус книги Ремарка в переводе на английский (если только переводчики не пользовались вариантом absinthe). Третье слово, кстати, не знала и вряд ли запомню, но оно вполне обычное, хоть и редкое, никакой не термин. Например, использовалось Гербертом Уэллсом в одной из не самых известных его книг, "The History of Mr. Polly".
“And here am I — clad in steel. Well, not exactly, but my fiery war horse is anyhow. Ready to absquatulate all the dragons and rescue you.”
В отличие от абляута, остальные два приведённых слова вполне "общелитературны". Как и большинство слов 25-й тысячи, полагаю.
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#172

Сообщение Androbroiler »

JamesTheBond пишет: 24 июн 2024, 14:16 Ничего не получится, потому что если взять все научные книги и журналы, то это будет совершенно бессмысленно, так как подавляющее большинство слов из них не знает никто кроме специалистов, и это лишь исказит картину.
Androbroiler пишет: 24 июн 2024, 08:01 Если корпус достаточно большой и представительный
Вероятно вы не обратили внимание, что я написал, что корпус должен быть представительным, т.е. репрезентативным.
Если взять каждой книги по 1 экземпляру и сложить, то наверное действительно не представительная выборка получится.
А вот если каждую книгу взять во всем тираже, то наверное уже ближе к реальности будет, тогда научная книга войдет 100 раз а какой нибудь Гарри Поттер 500 миллионов раз. В идеале, наверное, надо умножить книгу на кол-во ее прочтений, это лингвистам-статистикам виднее. В любом случае, с учетом возможностей современной вычислительной техники, не вижу препятствий почему частотный список должен заканчиваться, как вы сначала говорили на 4ой тысяче, а потом на 10ой.


Olla пишет: 24 июн 2024, 21:53 В отличие от абляута, остальные два приведённых слова вполне "общелитературны". Как и большинство слов 25-й тысячи, полагаю.
по ощущениям где-то поровну терминов и общелитературных.
JamesTheBond пишет: 24 июн 2024, 14:16 Практически никто не знает что такое аблаут/абляут – только филологи. Поэтому "место", которое он займет в частотном списке, зависит лишь от того, сколько для базы возьмут материалов по филологии.
как выше заметили из трех слов два вполне нормальные - "полынь(абсент)" и "сдриснуть".
Последний раз редактировалось Androbroiler 25 июн 2024, 08:31, всего редактировалось 1 раз.
Androbroiler
Сообщения: 372
Зарегистрирован: 28 дек 2019, 10:54
Благодарил (а): 33 раза
Поблагодарили: 49 раз

#173

Сообщение Androbroiler »

Вот список с 25ой тысячей слов (формы слов удалил, иначе тяжело было бы скопировать и отформатировать):


ablaut absinth absquatulate accipiter acclivity accordant accouchement acerbate acetanilide aciduria acrophobia actinian actinide actinomycin adar adenomatous adonai advect aerodyne aestival aestivate afflux agita ahimsa aiglet aigrette aiguille ailanthus airth akela alane albacore albescent alcaic aldebaran alencon algol aliphatic alkene allelomorph allelopathic allotrope amandine amaranthine amarna amative ambuscade ament amerce americium anableps anacoluthon analog anapaest ancillae andantino anglocentric anglophobe ankylose ankylosis anthropophagy antlia anubis aorist aoudad aper apercu apodictic apologue apophthegm appanage apsides apsis apus arbil arcturus arethusa argentite argentum argles arkose armilla arteriole arthroscopy arvo arytenoid asafetida asseverate ataractic atheling atticism aureate aureola australoid australopithecus autochthon autotroph avast avaunt aviatrix avoirdupois axletree axolotl aymara azidothymidine bacitracin backsheesh bagnio baiza balbriggan baldachin baldric baldrick balletomane banderol barbital barbule barcarole bargello barilla barograph barouche barratry barret baruch bathyscaph bathysphere bayadere beatific beaverboard bedel bedizen beldam belleek benzedrine benzoate benzocaine benzoin berkelium betatron bilboa bioherm birling blanquette blighty blintz bluet boatel bobolink bohrium boreas boscage botfly bowyers brachiate brachiosaur brachycephalic brail brasil brede brel brewis brisling britannic brose buhl burd burnie burnoose buskin butterfingers cachalot cachexia cachinnate cachou cacodemon cadi caelum caerulein cairene caitiff calcific calcimine calif calkin callipygean calthrop camelopardalis camorra canaille candela candescence cannae canthus caoutchouc capeskin capote capriole caracole carambola carburet carburize carcanet carle carnauba carolus carpi carrageen carrell cartouch casaba cassiopeia catawba catboat catchpenny catechetic cates causerie cayuse cedarn cedilla cembalo cementum cenozoic centaurus centesimal centimo cepheus cerate cerecloth ceres cering cesta cesti cetaceous cetus chalcopyrite chamade charry charybdis chicana chichi chinch chinquapin chippendale chiro chirography chiromancer chitlings chlorella chlortetracycline chocaholic choroid chowchow chrestomathy chrisma chrisom chrysalid chuckhole chuckwalla chugalug chumash chyle chylous cicatrice cicatrix cincture circinus circumambience cislunar cladistics clairaudient claymation clingstone cliometric clodhopper closefisted clotheshorse clotho clumber cnidarian coalite coccyges cockamamie cockscomb cockspur cocos coenobite collop colly colonus colubrid conchy concrescence concretion concupiscent coni consuetude cooch coquet corbeil corbie corium corrigendum corvee corvus corymb cosecant costard coteaux crapulence craquelure cremains crenulate crepitate cringle crumhorn crural cryogen cryolite cryosurgery ctenophore cullender cullis culm cummin cupric cuprous curette curtal curvet cush cushite cuspid cuspidor cyanogen cybernaut cyberspace cyclamate cyclosporine cymric cyrenaic dalasi damozel daric dauphine dds deadeye deaves debute decahedra decalcomania decasyllable declass decurion decussate dees defalcate defalcator defeasance defenestrate deflagrate degage degauss dehydrogenate deliquescent delphinus demerol demulcent dentifrice deoxyribose deracinate derv deshabille detumesce dextrin dexy diaphoresis diaster diatomaceous dicer didy dieresis diether dipteran discombobulate disembogue distich distrain dithyramb diuron divagate divaricate divulgate dobby dobies docetism dodecagon dodecahedra dogbane dogger dolby dolichocephaly dolma dolors donzel dramamine drave driblet drouth dst dubbin duckpin ductule dulcify dumdum duodecimal durr dysphasia dysprosium ecdysis echinoid ecocide ecotonal ectotherm edacious effleurage eft egads eidolon eidos einsteinium elapid elasmobranch electrotype eleemosynary elul embarcadero embonpoint embower emoticon empennage emption empurple empyreal encaenia encephalogram encephalograph encephalon enclitic encomiast endodontic endodontics endodontist endotherm endothermal endotoxaemia enfeoff engrail enjambement enologist enology entrechat ephebe epiphenomenalism epithalamium epode equuleus erfurt ergative ergosterol eridanus esculent esterify estop ethyne eurovision eurythmics eustasy euthenics excursive exobiology exosphere extemporary extrados extubate exurbia eyry fabliaux fainéant fanlight farcy farthingale fastigiate fauces febrifuge felid felloe ferlie fermium ferromagnet ferromanganese ferrotype fetting fibroma fibrovascular fillete fishguard flageolet flagitious flavin flinder florescent florilegium floruit fluoroscope fluval footle forb fornax francium freebee frenum frise frow frustum fugacious fulgurant fuscous gaddi gaddis gallinule galluses galvanometric gama gambade gambrel gambusia gamin gamp ganev garganey garget garniture gavage geegaw geminate geochronology geodesy geotropism gesundheit giller gillyflower gingival gingko glabrous glacis gladsome gloam glossina glossolalia glossolalic gloze glycaemic gnathic goffer gonfalon gonfalonier gonococcal gormandize gouda graal graeco grandam greco gribble grift grippe grison grunion guaiacum guck gunsel gyn gyrocompass gyve habilitate habilitated habu hackamore haecceity halbert halfbeak halm hamadryad hamzah handsel harl hartebeest harum hasid hassium hausen havarti haviour hawkshaw hazed hebdomadal hebetude hebraist hectogram heehaw hegira hellbent helve helvetica hemidemisemiquaver hendiadys heptagon heptameter herries heshvan heteroclite heteronym heterotroph hexapeptide hidrosis hierocracy hierophant highhanded hiragana hirple hirsel hobbledehoy hoke holarctic holmium holocene holophrase hoosegow hootenanny horsefeathers houdini huarache hullaballoo humungous hydrolyte hydropath hydrotropism hygrometer hypergastrinaemia hyperglycemia hypothesi hyson ichthyosaurus ictus impark inarch inductance intelsat interoperability introit iodinate irenic ixia jackanapes jaconet jarl jawan jehosaphat jehu jerkwater jerrybuilt jiggery jupe jurat jussive juvenescence kabbala kakiemon kalimba kalpa kamala kames karn kasbah kays keefs kerns kibe killie kilojoule kiltie kippen kiribati kiwifruit knackwurst kreutzer krugerrand kwashiorkor labret lactone lagune laigh lanthanide lappet larboard larrigan latakia lection lethe lickspittle ligneous ligroin likud liman limba lipocyte lipotropic lipotropin lithosol lithotripsy lollapalooza lucent lucubrate lugsail lunate lunula lustrate lustrum luxate macaronic macchia machinate mackle macrocephaly macrocosmos macron madrona maes maestoso magnificat magniloquent mahjong maieutic majore majuscule malapert malapropos maline malison malodor maltose manege mangel manihot manometry mansuetude mantic mantid marae marcasite maremma marlinespike marquisette materfamilias matutinal maund mavin mayweed meitnerium melanosis meliorate mellifluent mendelevium mensurable mep mephitis merk meronym mesencephalic meshuga mesosphere metacarpus metanoia metathesis methaqualone methuselah metis mfg micra microcyst millenary milligal milos minnesinger minuend mizenmast moet monition monkeyshine monoceros monody monomial monosaccharide monovalent mool morae mordacious mordent morelle moufflon msg muenster muggs muliebrity multiparous multiword mumbletypeg munnion musca musée muskox musth myology myosotis myotome myriapod myrica mystagogue mythomania naafi nainsook namby naugahyde nebulize necrology neoteric neots nepenthe nescience nhl nicam nictate nielsbohrium nitrobacterium niveous nobelium nocuous nonage nonillion nubia obelus objurgate obloquial oceanarium octahedron octamer octans octant octette octillion octreotide octuplet odeum odontology oems ofwat ogive olea oligocene omphalos oncogenesis oogonium oology operose oppidan opsimath orache organophosphorous origan osmund ossia ottar oxter paice palme pamby pampero pandit panicum pappus paribas parral passionfruit patin paty pavis pbx pein pekin peles pellete pelorus penates pepsinogen peris pernod pharisaic pharyngitides phloem phoebus phonogram phototropism phutz piggledy pindling pinyin plumule podocarp pokery polygram pourri progastrin prognose propria prostacyclin radicle rainbird ramson reale remonstrance repubblica rhus richen ringhals roose roset rowen sabin saintes sars sclerose sclerotherapy scorpio secant seise seraphin sext sheol shrove sodom soissons souchong spatio spean spital streek succoth syke symplectic syntagma tadjikistan tela terce terpsichorean thein thromboxane torfaen toyo tplf tragi transfected transfection transhumance triglyph troms turvey ulva uncial unco uppance urania ursa vanda variceal varve versant vertice vinify volvox weever whitsunday whitsuntide wurzel ysgol ywca zillah zoon zowie
Аватара пользователя
JamesTheBond
Сообщения: 5088
Зарегистрирован: 01 мар 2018, 11:08
Благодарил (а): 601 раз
Поблагодарили: 893 раза

#174

Сообщение JamesTheBond »

Olla пишет: 24 июн 2024, 21:53 А место absinth в частотном списке, видимо, будет зависеть от того, попадут ли в корпус книги Ремарка в переводе на английский (если только переводчики не пользовались вариантом absinthe).


Да, именно так.

Как и большинство слов 25-й тысячи, полагаю.

Вот, опять-таки, говорим ли мы о словах или гнездах. Такого количества гнезд в общелитературном языке и близко нет.
Аватара пользователя
JamesTheBond
Сообщения: 5088
Зарегистрирован: 01 мар 2018, 11:08
Благодарил (а): 601 раз
Поблагодарили: 893 раза

#175

Сообщение JamesTheBond »

Androbroiler пишет: 25 июн 2024, 08:21 Вероятно вы не обратили внимание, что я написал, что корпус должен быть представительным, т.е. репрезентативным.
Я обратил и именно на это ответил, что это задача не решается. Если включать туда всю научную литературу мира, то это абсолютно бессмысленно – на каком месте будут слова "анизотропия" и "силур" не имеет никакого значения, так как к ним вообще понятие частотности неприменимо. Возможность их встретить зависит только от тематики и больше ни от чего.
Зато это исказит статистику действительно нужных слов.
Ответить

Вернуться в «Лексика, словарный запас»