в чем разница между языком и диалектом
Чем полноценный язык отличается от диалекта (спойлер: не только названием)
Спросите специалистов по языковедению, в чем разница между языком и диалектом, — и ваш разговор затянется на несколько часов. Потому что короткого однозначного ответа нет. Но его пытается найти датский лингвист Серён Вихманн: он разработал программу, которая анализирует языки и сравнивает их друг с другом. Почитайте, как он рассказывает об этом порталу Aeon.
С точки зрения политики, язык — это то, на чем говорит нация. С 1850 по 1992 годы, например, существовал язык, который был известен как сербо-хорватский. Он включал в себя три диалекта: сербский, хорватский и боснийский. Но так как в середине 90-х Югославия разделилась на несколько независимых государств, эти диалекты были признаны самостоятельными языками.
Политическое определение языка в какой-то степени работает, но в конечном итоге создает больше проблем, чем решений. Есть языки, на которых говорят в разных странах — например, испанский в Латинской Америке. Никому не придет в голову заявить, что испанский, на котором говорят в Мексике, и испанский Колумбии — это два разных языка. А испанский, на котором говорят в некоторых частях Испании, так сильно отличается от своих латиноамериканских разновидностей, что впору было бы объявить его полноценным языком.
Может, разницу между этими понятиями можно объяснить с точки зрения того, насколько хорошо люди, говорящие на языке и диалекте, понимают друг друга? К сожалению, и этот подход не выдерживает критики. Датчанин поймет шведа лучше, чем швед — датчанина. У человека, который говорит на своеобразном сельском диалекте британского английского, гораздо больше шансов понять американца из Лос-Анджелеса, чем наоборот. Взаимопонимание собеседников зависит скорее от взаимодействия, чем от языковых факторов. А взаимодействие между людьми — вещь довольно изменчивая, его трудно контролировать.
Поэтому давайте придерживаться сугубо лингвистического подхода. Представьте, что мы можем измерить разницу (обозначим ее D) между двумя вариантами речи. Тогда величина D, принимая определенное значение, может определить границу между двумя диалектами и двумя языками. Величина D однозначно существует, ведь в языках полно особенностей, которые можно сравнить: звуки, грамматические характеристики, лексика.
Как алгоритмы помогают назвать вещи своими именами
Недавно мы поняли, как измерить разницу между речевыми вариантами и определить значение переменной D. В 2008 году группа лингвистов создала автоматизированную программу оценки сходства (Automated Similarity Judgment Program, или ASJP). Я один из ее основателей и ежедневных кураторов. Эта программа тщательно отбирает, систематизирует и сравнивает языковые данные.
В ASJP хранятся 7655 списков слов из двух третей мировых языков, если ориентироваться на ISO 639-3 (международный стандарт классификации языков мира, где каждому языку присваивается уникальный идентификационный код — Прим. ред.). Поскольку каждый список слов содержит фиксированный набор из 40 понятий и расшифровывается единообразно, их можно легко сравнить и измерить разницу.
Разницу между двумя словами измеряется очень просто — с помощью версии расстояния Левенштейна (названо в честь советского ученого Владимира Левенштейна). В 1965 году он разработал алгоритм для сравнения двух строк символов. Он определил «расстояние» как количество замен, вставок и удалений одного символа, нужное для превращения одной строки в другую.
Чтобы можно было поместить этот показатель на шкалу от 0 до 1, мы делим расстояние Левенштейна на количество символов одной из двух строк (той, которая длиннее). Получается «нормализованное расстояние Левенштейна», или LDN.
Понятия «язык» и «диалект», возможно, присваиваются произвольно и даже интуитивно. Но здесь есть многообещающие подвижки. Если посмотреть на все языковые семейства в ASJP (а там довольно много близких, родственных вариантов), можно увидеть, что пара языков и пара язык-диалект проявляют себя по-разному. Вот что интересно: нормализованное расстояние Левенштейна склонно колебаться либо относительно небольшого значения переменной, либо относительно достаточно крупного. Между этими двумя значениями — внушительный «зазор».
Как выяснилось, этот «зазор» чаще всего находится в довольно узком диапазоне. Его среднее значение — 0,48 LDN
Разновидности речи, скорее, не похожи друг на друга в основной лексике. Если они больше похожи, мы можем определить их как диалекты (и значение LDN меньше 0,48), если же они меньше похожи или совсем не похожи — это разные языки (значение LDN выше 0,48). Вот вам и главное различие между языком и диалектом.
Диалекты, вероятно, «удаляются» друг от друга по мере того, как люди переселяются на новые места и формируют новые идентичности. Но если люди продолжают контактировать, их язык все-таки сохраняет точки соприкосновения. Пусть речевые разновидности совпадают лишь наполовину, это будет все еще один и тот же язык. Стоит им лишь немного разойтись, наступает своеобразная точка невозврата: диалекты становятся все менее и менее похожими, расстояние Левенштейна между ними увеличивается — и вот это уже два разных языка.
Некоторые диалекты лишь маскируются под полноценный язык. И наоборот
Поскольку мы нашли объективный и непроизвольный критерий, по которому можно отличить язык от диалекта, мы можем применить его к языкам мира. Некоторые пары речевых разновидностей, которые считаются национальными языками (боснийский и хорватский), на шкале нормализованного расстояния Левенштейна LDN находятся ниже предельного порога в 0,48 LDN. То есть, несмотря на распад Югославии, это один и тот же язык.
Некоторые языковые разновидности совсем чуть-чуть не дотягивают до этого порога — например, хинди и урду (то есть разными языками их можно назвать с большой натяжкой). А показатель LDN у разновидностей китайского, которые часто рассматриваются как один язык, взлетает выше отметки 0,48, поэтому на самом деле речь идет о разных языках. Та же ситуация — с арабским.
Есть несколько пар языковых разновидностей, которые мы рассматриваем как самостоятельные языки, а на самом деле их значение LDN тоже опасно близко к предельному порогу. К примеру, LDN шведского и датского языков равняется 0,4921.
За какой срок диалекты становятся самодостаточными языками
Наконец, есть метод, с помощью которого можно определить, сколько времени потребуется диалектам, чтобы окончательно разделиться и стать отдельными языками. Этот метод, который мы назвали ASJP-хронологией, был получен на основе наборов языковых данных.
Учитывая возможную погрешность, мы пришли к выводу, что речь идет приблизительно о 1059 годах
Чтобы подтвердить эту цифру, мы анализировали, за какое время протоязык (язык-прародитель — Прим. ред.) какой-либо языковой семьи распадался на дочерние языки — предков языковых ветвей. Для этого используются другие методы подсчета, но результаты совпадают: пройдет примерно тысячелетие, прежде чем диалекты станут самостоятельными языками. В этом мы уверены, потому что теперь знаем, чем одно отличается от другого.
Об авторе: Сёрен Вихманн — датский лингвист, который сотрудничал с Лейденским университетом в Нидерландах, Казанским федеральным университетом в России и Пекинским университетом языка и культуры в Китае. Соавтор книги Temporal Stability of Linguistic Typological Features.
В чем разница между языком и диалектом
Нередко на простые вопросы приходится давать сложные ответы. Например: в чем разница между языком и диалектом? Если вы решите спросить об этом лингвиста, то усаживайтесь поудобнее. Хотя на первый взгляд в этом вопросе нет ничего сложного, ответить на него можно по-разному.
Разграничение между языком и диалектом может зависеть от той или иной точки зрения. С политической точки зрения, язык — это то, на чем обычно говорит народ как нация. К примеру, с 1850 по 1992 год существовал так называемый сербохорватский язык, который включал в себя несколько диалектов, в том числе сербский, хорватский и боснийский. Но после того, как в середине 1990-х годов Югославия распалась на несколько независимых государств, эти диалекты были признаны отдельными языками. Такое политическое определение отчасти работает, хотя и несет с собой больше проблем, нежели решений: бывают языки, на которых говорят в разных странах, яркий тому пример — испанский в Латинской Америке. Никто не станет утверждать, что мексиканский испанский и колумбийский испанский — это разные языки. Возможно, испанский, на котором говорят в некоторых частях Испании, настолько отличается от своих латиноамериканских разновидностей, что заслуживает называться отдельным языком, но это не до конца ясно.
А что, если провести границу между языком и диалектом, руководствуясь критерием взаимопонимания? К сожалению, и этот подход не идеален. Датчанин будет несколько лучше понимать шведский, чем швед — датский. Точно так же человек, говорящий на специфическом крестьянском говоре британского английского, поймет американца из Лос-Анджелеса гораздо лучше, чем американец его. Взаимопонимание часто зависит от внешних факторов — они представляют собой довольно неконтролируемую переменную — а не от присущих самому языку свойств.
Так что, возможно, нам стоит взять на вооружение чисто лингвистический подход. Представьте, что мы можем систематически измерить разницу (D) между двумя речевыми вариантами. Тогда конкретное значение D позволило бы нам определить границу между двумя диалектами и двумя языками. Найти такую величину, должно быть, не очень сложно, поскольку два языка можно сравнивать по множеству критериев, таких как звуковой инвентарь, грамматические характеристики или лексика. Но что, если различия между речевыми вариациями являются градуальными и вероятность нахождения заданного значения D столь же высока, сколь и вероятность нахождение какой-то другой величины? Тогда нам пришлось бы выбрать в качестве отправной точки произвольное значение D, а произвольное значение отбросило бы нас назад к соображениям политического или практического характера, которые мы не собирались брать в рассмотрение. Хотим мы, чтобы наша линия разрыва проходила на уровне, где сербский и хорватский — это разные языки или один? Каталогизируя языки мира, сколько тысяч языков мы хотим предать забвению: пять? Или семь? А может быть, десять тысяч?
Второе препятствие заключается в том, что, возможно, «язык» и «диалект» являются понятиями, которые могут быть определены только в произвольном порядке. Здесь у нас есть для вас вполне обнадеживающие новости. Если мы посмотрим на все языковые семьи в базе данных ASJP, куда участники проекта включили существенную долю близких разновидностей, мы можем приступить к поиску различных типов поведения языков и диалектов. Перед нами возникает интригующая картина: расстояния как правило колеблются либо вокруг относительно небольшой величины, либо вокруг относительно большой, и между ними образуется впадина. Как выясняется, чаще всего эта впадина лежит в узком диапазоне, в среднем равном примерно 0,48 LDN. Мы не погрешим против точности, если скажем, что речевые варианты стремятся не быть частично похожими друг на друга в своей базовой лексике. Либо наблюдается тенденция к большей схожести, и в этом случае речевые варианты можно определить как разные диалекты, либо к меньшей схожести — и в этом случае их можно отнести к разным языкам. Здесь как раз и пролегает граница между языком и диалектом.
Придя к объективному, а не произвольному критерию для отделения языков от диалектов, мы можем применить его к языкам мира. Некоторые пары речевых разновидностей, которые считаются национальными языками, такие как боснийский и хорватский, находятся значительно ниже порога LDN, равного 0,48 (значит, это один и тот же язык, независимо от существования Югославии). Совсем недалеко от этого порога оказываются такие языки, как хинди и урду (едва ли их можно назвать двумя разными языками). А разновидности арабского и китайского языков, которые часто рассматриваются как единые языки, взлетают выше LDN = 0,48 (эти разновидности являются отдельными языками). На самом деле, есть несколько пар разновидностей, которые обычно считаются разными языками, но колеблются на границе: например, датский и шведский языки, у которых LDN составляет 0,4921.
Наконец, метод, полученный из наборов данных, называемый ASJP-хронологией, может быть применен с целью установить количество времени, необходимого для того, чтобы диалекты дистанцировались друг от друга настолько далеко, чтобы считаться отдельными языками. Найденный нами результат — 1059 лет, если не учитывать некоторую погрешность. Эти выводы подтверждаются тем, сколько времени обычно требуется, чтобы родовой язык языковой семьи распался на дочерние, которые впоследствии становятся предками подсемейств. Для этого нам необходимы другие методы анализа, но результаты схожи: для превращения диалектов в языки требуется около тысячелетия. Мы знаем это, потому что теперь можем отличить одно от другого.
За последние годы удалось преодолеть два основных препятствия на пути различения языка и диалекта. Первое состоит в том, как измерить различия между речевыми вариантами — то есть найти значение для D. В 2008 году группа лингвистов создала Автоматизированную программу оценки сходства (Automated Similarity Judgment Program, ASJP), ежедневным куратором и основателем которой является ваш покорный слуга. ASJP кропотливо подготовила систематический сравнительный набор данных по языкам, который в настоящее время содержит 7655 списков слов. Они имеют отношение к двум третям мировых языков, если предположить, что для наших целей языки определяются по стандартному коду ISO 639-3. Поскольку каждый список слов содержит фиксированный набор из 40 понятий, которые истолковываются единообразно, их легко сравнивать и таким образом получить меру различия. Чаще всего в качестве меры различия между двумя словами используется вариант «расстояния Левенштейна» — этот термин был назван в честь Владимира Левенштейна, советского ученого, который в 1965 году разработал алгоритм для сравнения двух строк символов. Он определил «расстояние» как минимальное количество замен, вставок и удалений, необходимых для превращения одной строки в другую. Расстояние Левенштейна можно с пользой разделить на длину самой длинной из двух строк и таким образом поместить все расстояния в шкалу от 0 до 1. Данное явление известно как нормализованное расстояние Левенштейна, или LDN.
Вероятно, это явление стало результатом социальных обстоятельств. Диалекты расходятся по мере того, как люди расселяются на новых территориях и формируют новые идентичности, но, если между ними все еще есть некоторый контакт, может иметь место конвергенция, так что речевые варианты остаются похожими более чем на 50 процентов (и, следовательно, речь идет об одном языке). Однако небольшой толчок в направлении дивергенции может привести к тому, что языковые варианты разойдутся относительно быстро, увеличив расстояние Левенштейна, и в этом случае мы можем квалифицировать их как отдельные языки. Возможно, существует связь между границей для расстояний между словами в стандартном списке, используемом ASJP, и соответствующими расстояниями в других частях языковой структуры, которые могут приводить к серьезной потере взаимопонимания. Другими словами, порог взаимопонимания может коррелировать с порогом между языками и диалектами. Мы еще не изучили этот вопрос, но как объект для исследования он крайне интересен.
Проблема «язык или диалект»
Проблема «язык или диалект» — проблема, связанная с определением статуса определённой разновидности языка как отдельного языка либо как диалекта какого-то языка.
Содержание
Суть проблемы
Вопрос, является некоторая языковая разновидность (идиом) языком или диалектом, относится к одной из сложных проблем лингвистики, причем последствия такого решения могут выходить и далеко за её пределы.
Если строгого выбора в обозначении конкретной разновидности языка лучше избежать, лингвисты обычно используют термин идиом (либо «промежуточное» обозначение «язык/диалект»). Однако в англоязычной литературе такой термин не используется.
Не существует единого понимания проблемы «язык или диалект» и, соответственно, единых критериев её решения. Поэтому, утверждая, что некий идиом является именно языком или именно диалектом, необходимо оговаривать, на основании каких критериев делается этот вывод. Это значит, что на вопрос «являются два (близкородственных) идиома диалектами или разными языками?», как правило, нельзя ответить просто «да» или «нет», не оговаривая, что имеется в виду.
Среди критериев, которыми могут руководствоваться при решении проблемы, можно выделить две основные группы — социолингвистические и структурные.
Соотношение языка и диалекта
Возможны следующие варианты формулировок:
Социолингвистические критерии
Социолингвистические критерии нередко признаются важнейшими для решения проблемы «язык или диалект»; общим для них является обращение к внешним факторам.
Функциональная полноценность
Следуя этому критерию, отдельным языком считается идиом:
Как правило, идиомы, не обладающие перечисленными преимуществами (например, используемые лишь в ситуации бытового общения), считаются диалектами других языков. Общая письменная традиция (ср. немецкий термин Dachsprache — «язык-крыша») часто объединяет довольно далеко разошедшиеся идиомы (например, «диалекты» итальянского, немецкого, арабского, даргинского или китайского языков) или даже слабо родственные (латынь в средние века). У разных частей одного идиома могут оказаться разные «крыши» (для нижнесаксонских диалектов на северо-востоке Нидерландов «крышей» является нидерландский, а на севере Германии — немецкий). Этот принцип заведомо не может быть применен к языкам, не обслуживаемым никакой письменной традицией.
Политический фактор
В некоторых случаях идиомы, находящие в сходном функциональном распределении, могут считаться как диалектами одного языка, так и разными языками, в зависимости от политической ситуации. Например, английский и сербохорватский имеют по несколько стандартных (региональных) вариантов (этнолектов) плюс множество традиционных диалектов. Однако варианты английского языка (британский, американский, австралийский и другие) общепризнанно считаются одним языком, не в последнюю очередь потому, что они используются дружественными государствами (см. Содружество наций). Стандартные же варианты сербохорватского (то есть сербский, черногорский, хорватский, боснийский) обычно, особенно в соответствующих странах, считаются отдельными языками, причем именно в силу политических причин (стремление подчеркнуть независимость) — хотя пока их носители находились в одном государстве, их язык считался единым. Более того, эта ситуация продолжает развиваться: чем дальше отдаляется Черногория от Сербии, тем всё больше голосов раздаётся за провозглашение отдельного черногорского языка.
В качестве иллюстрации политического подхода в решении вопроса о статусе идиома часто цитируют высказывание известного лингвиста Макса Вайнрайха: «Язык — это диалект, у которого есть армия и флот» (в оригинале на идише: אַ שפּראַך איז אַ דיאַלעקט מיט אַן אַרמיי און פֿלאָט, в латинской транскрипции: A shprakh iz a dialekt mit an armey un flot).
Самоидентификация носителей идиома
Многие исследователи целиком полагаются на мнение носителей о том, на каком языке они говорят. Однако мнения разных носителей могут не совпадать между собой, поскольку это мнение легко меняется под воздействием внешних факторов и пропаганды. Утверждение одних людей, что они говорят на языке X, может противоречить мнению других носителей этого же языка, утверждающих, что первые говорят на другом языке (пример 1); и наконец, во многих культурах вообще не было и нет чёткого представления о своем языке (пример 2).
Этническая ориентация
Часто при решении вопроса, являются два идиома одним или разными языками, прибегают к этническому критерию: если носители обоих идиомов относятся к одному этносу, значит это один язык, если к разным — разные. Однако следует понимать, что определение народа является ещё более сложным: скорее, одним из параметров для классификации народов является языковой, а не наоборот. Кроме того, нередко наблюдается несоответствие народов и языков: так, американцы и англичане говорят по-английски; ирландцы говорят по-английски и по-ирландски; мордва говорит по-мокшански, по-эрзянски (и по-русски); носители аварского, андийских, цезских и арчинского языков считаются аварцами, а языки итальянцев относятся к трём разным подгруппам романских языков. Таким образом, полное соответствие языка и народа, по-видимому, является достаточно редким.
К генетически неоднородным относятся также диалекты: немецкие, узбекские (карлукские, кипчакские и огузские), крымскотатарские (ногайские, половецкие и огузские), южнокиргизские (ногайские, киргизско-кыпчакские и карлукские), чулымские с шорскими (северноалтайские и хакасские). Крымский диалект крымскотатарского в нынешнем состоянии представляет собой разновидность среднего крымскотатарского, латгальский лингвистически является диалектом литовского, а не латышского.
Структурные критерии
Другим подходом, принципиально отличающимся от социолингвистического, является структурно-лингвистический, в рамках которого учитываются лингвистические различия между идиомами. Однако выработка чисто лингвистических критериев для разграничения самостоятельного языка и диалекта является непростой задачей. Во-первых, следует определить признаки сравнения, а во-вторых, установить некоторый «пороговый» уровень.
Взаимопонятность идиомов
Наиболее частым основанием для решения вопроса о языке/диалекте является степень взаимопонятности соответствующих идиомов: если носители разных идиомов достаточно хорошо понимают друг друга (говоря каждый на своем идиоме), значит они говорят на диалектах одного языка, если же нет — на разных языках. Однако на практике взаимопонятность осложняется многими другими факторами, среди которых: предварительное знакомство с языком собеседника, тема общения, само желание или нежелание понимать собеседника и прочее. Кроме того, нередка ситуация так называемой «полукоммуникации». Это особый вид многоязычия между близкородственными языками, когда каждый из собеседников говорит на родном языке, но при этом свободно воспринимает язык собеседника. Такое возможно с немецким и нидерландским, скандинавскими, восточнославянскими и многими другими языками.
Лексикостатистический критерий
Наиболее удобным для сравнения уровнем языковой системы является лексика. Сравнивают обычно списки слов, однако размер и состав этих списков сильно различаются от автора к автору. Чтобы придать такому подходу универсальность, подсчитывают процент совпадений в базовой лексике. Этот метод широко используется в лексикостатистике и глоттохронологии, как правило, для более высоких уровней языковой систематики. Он достаточно удобен тем, что универсален, не зависит от внешних факторов и настроения информанта.
Четырёхчастная шкала языковой систематики
Согласно этой шкале, если у двух идиомов процент совпадений в 100-словном базовом списке меньше 89 (что соответствует времени распада по формуле Сводеша-Старостина более 1100 лет назад), то идиомы являются разными языками. Если процент совпадений больше 97 (время распада меньше 560 лет), то идиомы являются диалектами одного языка. Для оставшегося же интервала (89—97 %) предложен промежуточный уровень очень близких языков / отдалённых диалектов, в качестве названия для которого используется термин «наречие» в тех случаях, когда соответствующий идиом традиционно рассматривается как компонент другого языка. Когда же такой идиом принято считать отдельным языком, за ним сохраняется таксон «язык», а объединение, куда он входит и которое соответствует по степени близости единому языку, называется «кластером». Наглядно употребление таксонов нижних уровней проиллюстрировано в таблице. При этом часто бывает так, что один или несколько идиомов в одном кластере принято считать языками, а другие — нет, хотя они находятся на одинаковом уровне взаимопонятности / структурной близости. В качестве примера можно привести вайнахский кластер, включающий чеченский и ингушский языки и аккинско-орстхойское наречие.
Уровни | Примеры | |
---|---|---|
a) | б) | |
1-й уровень (89—95 % совпадений) обычно соответствует либо а) самостоятельному языку (мало взаимопонятному с другими языками), либо б) группе (кластеру) близкородственных языков. | английский, французский | русско-белорусский кластер, Примечание: Подчеркнутые идиомы раскрываются в следующих строках таблицы. Указанные уровни в то же время соотносятся со степенью взаимопонятности, что особенно полезно, когда процент совпадений между языками неизвестен: Очевидно, что существующие структурные критерии, в том числе и лексикостатистический, могут приводить к совершенно другим результатам, нежели этно-функциониальные. Например: Несмотря на это, схема является удобным служебным подспорьем для организации языков и диалектов в единую систематику и для сравнения степени их близости между собой. Другие уровневые схемы и близкие понятияВнешний язык, внутренний язык, диалектЯзыковые зоны, континуумы, комплексыКауфман выделяет, помимо языков и диалектов, следующие случаи. Аусбау-парадигмаАусбау-парадигма (парадигма Ausbausprache — Abstandsprache — Dachsprache, «развитый язык — отстоящий язык — язык-крыша») была разработана немецкими социолингвистами [Kloss, 1967] и впоследствии завоевала популярность в мировой лингвистике. В основу этой концепции заложено понимание того, что существует два независимых набора критериев и аргументов для отличения языка от диалекта: один основан на этно-социальных функциях, другой на объективных структурных особенностях. Одним из преимуществ аусбау-парадигмы считается замена перегруженных и политизированных терминов язык и диалект нейтральными (пока ещё), хотя и труднопроизносимыми немецкими словами. По мнению авторов, терминологическая замена может оказаться полезной в том, что она позволит людям взглянуть на застарелые противоречия с совершенно другого ракурса. Диалектный континуум, языковой комплекс, плюрицентризм, диасистема и кластерВ социолингвистике, диалектологии и языковой систематике существует несколько близких понятий, которые оперируют с понятиями язык и диалект. ДиглоссияПримером является арабский мир с диглоссией между литературным арабским и отдельными разговорными арабскими языками.
|