Оглавление блога

понедельник, 28 июля 2008 г.

В каком языке больше всего слов?

В каком языке больше всего слов?


Многие интересуются, сколько всего слов в том или ином языке, а главное - в каком больше, чей язык "круче"?


Правильный ответ: вопрос сформулирован некорректно, поскольку составляющие его слова ("слово", "язык", "всего") слишком многозначны. Поэтому, хотя с точки зрения грамматики "Сколько всего слов в русском языке?" - это вопросительное предложение, на него нет ответа, точно так же, как нет осмысленного ответа на вопрос "Сколько будет семь разделить на ноль?" (или 3:0=?, и т.д.).


1. Что считать словом?


В русском языке словом мы привыкли считать группу букв между двумя пробелами.


Но, например, Эрик В. Гуннемарк в своей книге "Искусство изучать языки", пишет:

"В инкорпорирующих языках, к примеру, в языке гренландских эскимосов, отдельные слова, по сути, отсутствуют. Члены предложения в них часто сливаются в единые комплексы - очень длинные "слова-предложения".


То есть, "Миша поймал одну рыбу" - это у них одно слово:

"Мишапоймалоднурыбу", а "Миша поймал две рыбы" - это уже совсем другое слово: "Мишапоймалдверыбы". Ясно, что число слов в языке гренландских эскимосов - бесконечно, куда нам с ними тягаться! И цифры вовсе не обязательны: "Миша поймал щуку", "Гоша поймал леща", "Даша поймала триппер"...


И в Гренландию лететь или плыть тоже не обязательно, можно, не сходя с места, просто сесть в машину времени и перенестись лет на 700 назад:

Древние славяне, вслед за древними греками писали предложения слитно, без пробелов между словами. Так написаны все ранние переводы библейских книг на старославянский язык. Ясно, что число возможных слов-предложений - бесконечно.


Нет машины времени? Не беда! Поехали в Чехию на автобусе!


"Не" с глаголом у нас пишется отдельно, а в чешском языке - слитно.


видим = vidime

не видим = nevidime


носите = nosite

не носите = nenosite.


Что же теперь, чехам "носим" и "неносим", и вообще, любой другой глагол засчитывать как два разных слова, а нам - как одно и то же?


Этак они на конкурсе "Евролингвидения" сразу огромную фору получат!


Считать и им "не" отдельно от глагола? А в турецком отрицание всегда стоит вообще внутри слова:


geliyorum - я прихожу, gelmiyorum - я не прихожу

geliyorsun - ты приходишь, gelmiyorsun - ты не приходишь.


Выковыривать из них это отрицание как косточку из вишни?


А "не" с прилагательными, наречиями, причастиями у нас пишется то вместе, то отдельно: "некрасивый", но: "не красивый, а уродливый".

А известный, неизвестный, безвестный, небезызвестный,

большой и небольшой, трудно и нетрудно, изученный и неизученный? Считать каждое такое слово за полтора?


Если бы проблемы были только с частицей "не" и вообще с отрицаниями!


А, например, "белый", "белая", "белое" считать как три разных слова или как разные формы одного? В русских словарях прилагательные даются только в форме мужского рода. В итальянском одни слова изменяются по родам (bianco = белый, bianca = белая), другие - нет (forte = сильный, сильная). В английском грамматического рода вообще нет.


А "беленький"? А "белеть"?


А "белизна"? А "белеющий"? Словари считают "белеющий" не отдельным словом, а одной из форм глагола "белеть" - его действительным причастием настоящего времени.


Но если "купающийся" в словосочетании "купающийся мальчик" - это не отдельное слово, а причастие от глагола "купаться", то в предложении "На пляже было много купающихся" - это уже существительное, такое же как "учащийся" и "трудящийся", которые хотя и происходят от "учиться" и "трудиться", но давно уже употребляются только как существительные и никогда - как причастия: "Учащийся мальчик" - это уже не по-русски.


Как быть? "Белеющий" не считать вовсе, "трудящийся" считать отдельным словом, а "купающийся" - считать как полслова? А "русский" считать за два слова или за одно? Ведь в словосочетании "русский язык" - это прилагательное, а в предложении "Я - русский" - существительное, точно так же как "белый" и "белизна". Просто прилагательное "белый" и существительное "белизна" звучат по-разному, а прилагательное и существительное "русский" (или "рабочий") - одинаково, они омонимы.


А если будем считать "белеющий", тогда уж и "белею", "белеешь", "белеет", "белеют", "белел". А "убелённый" (сединами), а "побелевший", а "побéленный? Это уже действительное и страдательное причастия, соответственно от "побелеть" и "побелить"!


А "белеть" "белить" и "побелеть", "бежать", "побежать" и "бегать"?

А "добежать", "прибежать", "отбежать", "вбежать", выбежать", пробежать, перебежать?


Интуитивно, "бегать" и "бежать" ощущаются как разные формы одного и того же слова, грамматически - это два разных глагола. Словари обычно дают определения или переводы только для одного из такой пары глаголов, либо совершенного, либо несовершенного вида, а от второго дается ссылка на первый. А тогда "идти" и "ходить" тоже считать одним словом? А корни-то ведь разные!


Конечно, считать разными словами "дерево", "дерева", "дереву", "деревом" и т.д. было бы вроде как-то неспротивно.


Это как в том анекдоте, у кого больше праздников: у русского, кроме дня железнодорожника, дня строителя, и т.д. еще и день получки, день аванса...


Если считать только слова с разными основами, отбросив падежи, то есть, например, "дерево" и "деревце", считать как два разных слова, а "дерево " и "дереву" - как одно и то же слово, "деревце" и "деревцу" - тоже, "несу" и "ношу" как отдельные слова, а "несу" и несешь" - как одно и то же, то тюркские языки нас легко обскачут. Там у глагола штук десять времен, а всяких причастий и деепричастий - штук 20...

Абыдно, да?


А краткие прилагательные:

Чёрен (черный), бел (белый), длинен (длинный), короток (короткий).

А степени сравнения: длиннее, белее, интереснее, привлекательнее?

У нас это всегда одно слово, а по-английски,

long - longer

interesting - more interesting, то есть, два слова "more" и "interesting", которые мы по отдельности уже посчитали.


А омонимы, типа "коса" (женская), "коса" (речная), и "коса" (для косьбы) это три разных слова или одно? А "шина" автомобильная и "шина" наложенная на сломанную ногу? А "дерево" - растение (= англ. tree = итал. albero) и "дерево" - материал (= древесина = англ. wood = итал. legno)? Разными их считать - тогда китайский вперед вырвется, да и английский тоже нас обгонит:


например, их слово copy - это и копия, и копировать (the copy - копия, to copy - копировать)


work - работать, работа,

print - печатать, распечатка,

score - счет (в матче) и забивать (гол).


2. А что считать "языком"?


Раньше сербский и хорватский считались экавским и йекавским субдиалектами штокавского диалекта общего сербскохорватского языка, а теперь хорваты доказывают, что хорватский и сербский - разные языки. Царь Александр III постановил, что украинский - это говор русского языка.


К примеру, слова "пацан" "хата", "хлопец" это еще русские слова или уже украинские?


Ломоносов считал церковнославянский не отдельным языком, а "высоким штилем" (торжественным стилем) русского.


Церковнославянские формы считать словами русского языка или нет?


город и град,

холод и хлад (дохнул осенний хлад)

берег и брег (на брегах Невы)

молоко и млеко

сторож и страж

короткий и краткий

прочитать и прочесть


Все зависит от точки зрения, как сказал Маяковский:

Лошадь сказала, взглянув на верблюда:

- Какая гигантская лошадь ублюдок!

Верблюд ответил:

- Да лошадь разве ты?

Ты просто-напросто верблюд недоразвитый!

И знал лишь бог седобородый,

что это животные разной породы...


А устаревшие, вышедшие из употребления слова: картечь, пищаль, бричка? С одной стороны, они уже лет двести как не употребляются, с другой - есть в произведениях современной школьной программы по литературе. Считать их?


А где тогда остановиться? Устаревшие слова из "Домостроя" - памятника древнерусской литературы, тоже считать?


бечет - драгоценный камень типа рубина

братина - небольшой чаша, кубок с шаровидным корпусом, служил для питья вкруговую

вандыш - снеток, сушеная рыбка вроде ерша

векошники - пироги, заправленные мясными и рыбными остатками пищи, своего рода "пицца". (Видите, Россия-то оказывается родина не только слонов, но и пиццы тоже!)

вечка - медная кастрюля

и т.д.


А региональные слова, которые в ходу, например, только в Рязани, и непонятны в Самаре или наоборот: курмыши (любой район частной застройки), баклажка (любая емкость под разливное пиво) - оказывается, так только в Самаре говорят. Что это? Язык? Говор? Диалект? Если такие слова считать, то итальянцы и немцы - наголову нас разобьют! У итальянцев что ни город - свой язык. У меня есть неаполитанско-итальянский, венецианско-итальянский, генуэзско-итальянский и другие подобные словари, по 8 тысяч слов в каждом. Вот, например:

Итальянский

Italiano

Неаполетанский

Napoletano

conservare

сохранять

stipà, astipà

consuetudine

привычка, обычай

ausànza, rènza

contento

довольный

priàto

Итальянский

Italiano

Миланский

Milanese

palido

бледный

smort

paniere

корзинка

cest, cavagna

posporre

отложить

posponn

Есть баварско-немецкий, саксонско-немецкий и другие словарики немецких диалектов.


А неологизмы считать?


Пойдем, поэт,

взорим,

вспоем

у мира в сером хламе.

(Маяковский).

"Я планов наших люблю громадьё" - слова "громадьё" нет ни в одном русском словаре!

Ну ладно бы один Маяковский, а то ведь и Пушкин туда же!


"Людская молвь и конский топ".


"Взорим", "громадьё", "молвь" - это слова русского языка, или слова языка Маяковского, языка Пушкина (есть, например, специальный "Словарь языка Пушкина"!)?


Устаканиться? Отговорить? Не в смысле разубедить, а "Отговорила роща золотая"?


3. Какой смысл мы вкладываем в слово "всего" в вопросе "Сколько всего слов..."?


Например, КГБ (контора глубокого бурения), ПБОЮЛ (предприниматель без образования юридического лица), ИСН (измельчитель соломы навесной), ПСРМ (плавучая судоремонтная мастерская), ЗАГС (запись актов гражданского состояния), тоже считать? Но таких "слов" можно сколько угодно напридумывать, на счет раз: ШСПШСС (Шла Саша по шоссе и сосала сушку).


А если их не считать, то как насчет гебуха, кгбешник, гаишник, гайцы? А кавеэнщик (КВН), нэпман? Слова это уже или еще нет? Считать только те аббревиатуры, которые склоняются как обычные существительные: в ЗАГСе, возле ЗАГСа, но: в СССР?..


А сокращения типа собес, старпом, комдив, завскладом, замдиректора, сисадмин? Считать их отдельно, или мы их уже посчитали как "старший" + "помощник", и т.д.? Линкор - это отдельное слово, или мы его уже посчитали в виде "линейный" + "корабль"?


А цифры, написанные прописью: два, двадцать, двести?


У итальянцев вообще есть тотальное, непобедимое оружие: сложные числительные в документах (прописью) пишутся вместе, одним словом: тримиллионатристатридцатьтритысячитристатридцатьтри. Если им их засчитывать, то получится, что число слов в итальянском - бесконечно, ведь числовой ряд бесконечен. А почему нет, собственно?


Если итальянцам их не засчитывать, то почему нам засчитывать слова "отставить" или "пробежать" как новые, отдельные слова, а не "от" + "ставить", "про" + "бежать", а например, англичанам put aside, run by - нет? А слова через дефис, считать их или нет: "светло-синий"? А чем "труднопроходимый", лучше, чем "мелко нарезанный"? Почему "трудно", "проходимый" и "труднопроходимый" = 3 слова, а "мелко", "нарезанный" и "мелко нарезанный" = всего 2 слова?


А какую подлянку нам хотели подложить орфографические реформаторы три года назад - предлагали писать причастия, как и прилагательные с одним "н", то есть, одинаково, и "стреляный воробей", и "стрелянная гильза"! Явно же британские агенты! Из-за них русский язык не попал бы и в первую десятку "крутизны"! Ладно, пресекли вовремя!


Если уж заговорили о реформе орфографии:

В 1964 г. в КНР провели орфографическую реформу, упростили написание 2238 иероглифов. Считать старые и новые иероглифы разными словами? А почему нет? Ведь китайские слова gou = кое-как, все равно как и gou = собака, как и десятки тысяч (!!!) других омофонов произносятся одинаково, а пишутся по-разному. Но тогда и русские слова в дореформенном и послереволюционном написании,


коммерсантъ и коммерсант

орехъ и орех


тоже придется считать разными? Нет? Так никто сейчас не пишет? Но китайская-то реформа проведена только в Китайской Народной Республике, а в Китайской Республике на Тайване (и в Гонконге, и в Макао), как писали по-старому, так и пишут.


А английские и американские написания многих слов:


thru и through

programme и program

разными словами считать или одним и тем же? В новом английском толковом словаре Вебстера даются оба написания. Если одним - то почему слова write (писать) и right (правый) и многие-многие другие считать разными? Читаются-то они одинаково, как и китайские gou = кое-как и gou = собака.


В бразильском и европейском вариантах португальского языка тоже многие слова пишутся по-разному:

contato (браз.) = contacto (порт.)

setor = sector

objeto = objecto

и т.д.


А превед? сцуко? Ацкий сотона?


4. Какие слова считать русскими?


"Провайдер", "менеджер", "риэлтор", "дистрибьютор" - русские? Вроде бы нет, они ведь явно английские!


А как тогда быть с "мотором", "машиной", "горизонтом" "фортепьяно", "роялем", "монетой", "газетой" - они ведь тоже заимствованы русским из других языков! И главное, не знаешь, где остановиться, ведь и амбар, балык, богатырь (коих на картине Васнецова аж целых три, и все - русские!), барабан и т.д. - тоже нерусские слова! Когда-то они были заимствованы из тюркских языков.


А "утрировать" (фр. "outré")? А "заорверлочить", "отпруфридить", "отксерить"? В английском таких слов нет, хотя корни их английские. Считать их?


Да если заимствования не считать, от английского почти ничего не останется, 80% его словарного состава - это заимствования из латыни или французского:


change (англ,) - changer (фр.)

research - recherche,

accident - accident

to clame - clamo (латынь)

и далее, по списку.


Считать заимствования? Тогда англичанам незаслуженная фора, у них полно дублетных пар: два слова означают одно и то же, но одно исконно английское, а другое романское заимствование, типа:


begin = commence = начинать

leave = abandon = покидать, оставлять

и т.д.


5. Считать по словарям?


По каким? Словник словаря ударений кроме нарицательных содержит и имена собственные (Линдсей, Линёва (русская собирательница народных песен), Линёво (Волгоградской обл.) и даже названия газет ("Непал самачар"). Словник орфографического словаря отличается от словника толкового или двуязычного. А русско-немецкий текстильный словарь, например, считать? А Норвежско-русский по рыболовству? Словник спеллера (компьютерной программы проверки орфографии) неизбежно содержит все словоформы склонения и спряжения (книгу, книгой, книгам, прочитаю, прочитаешь, прочитают), зато там нет многих узкоспециальных терминов (шильдик, варикап, стопорение, проставка).


6. Подытожим:


Кто-то скажет, что это чисто теоретические рассуждения, касающиеся небольших групп слов, которые не могут существенно повлиять на счет числа слов в языке и на "присуждение" ему того или иного места на необъявленном конкурсе "крутизны", в котором каждый народ считает победителем свой собственный язык. Это вам только так кажется!



This suggests that there are, at the very least, a quarter of a million distinct English words, excluding inflections, and words from technical and regional vocabulary not covered by the OED, or words not yet added to the published dictionary, of which perhaps 20 per cent are no longer in current use. If distinct senses were counted, the total would probably approach three quarters of a million.

Это означает, что по самым скромным подсчетам, если не считать словоформы, отличающиеся только окончанием, технические термины и слова регионального употребления, не включенные в "Оксфордский словарь английского языка", новые слова, еще не вошедшие в опубликованные словари, из которых процентов двадцать уже перестали употребляться, в английском языке 250 тысяч разных слов. Если разные значения многозначных слов считать отдельными словами, то получится что-то около 750 тысяч слов.

Ничего себе, "невелика разница" - полмиллиона слов, или в 3 раза, только в зависимости от того, как считать!


Как справедливо замечает Юкка Корпела, финский автор, написавший на английском языке статью "В каком языке больше слов?", "...если кто-то скажет, что общее число слов в языке Х равно N, я запросто могу составить список, содержащий заведомо больше чем N финских слов. А это значит, что вопрос, "В каком языке больше слов?", не имеет смысла".

То же самое и мы можем сказать о русском.


Примечание:

The Second Edition of the Oxford English Dictionary contains full entries for 171,476 words in current use, and 47,156 obsolete words. To this may be added around 9,500 derivative words included as subentries.

Во втором издании Оксфордского словаря английского языка 171 476 заглавных слов, используемых в настоящее время и 47 156 вышедших из употребления. К ним можно добавить примерно 9 500 производных слов, приведенных в словарных статьях соответствующих заглавных слов.

1. How many words are there in the English language?

http://www.askoxford.com/asktheexperts/faq/aboutenglish/numberwords?view=uk

2. Which language has largest vocabulary?

http://www.cs.tut.fi/~jkorpela/lang/vocab.html

Комментариев нет :