31.08.2012 7538

Дистрибутивно-статистический анализ как лингвистическая процедура выявления системных лексических отношений

 

Одним из наиболее точных методов лингвистического исследования является дистрибутивно-статистический анализ, принадлежащий к отдельной области языкознания - лингвистической статистике. Он основан на адаптации приемов и методов теории вероятностей и математической статистики к языковым явлениям и процессам. При этом основное внимание уделяется не только определению количественных характеристик явления, а обязательному анализу их соотношений, определению степени их взаимосвязи, что позволяет расширить возможности исследования, а также накопить достаточный объем качественных и количественных характеристик исследуемых единиц. Именно поэтому метод дистрибутивно-статистического анализа широко применяется при исследовании синонимичных и антонимичных лексем (см.: Серебрякова 2002). Так как предметом исследования выступают номинанты эмоции «страх», наше внимание будет сконцентрировано на анализе семантически родственных и близких по значению слов-синонимов с целью выявления характера и силы семантической связи между ними.

Изучение семантических связей между языковыми единицами основывается на предварительном отборе материала. В основе лежит принцип индукции, то есть выдвигается рабочая гипотеза, согласно которой определяется круг слов, между которыми предполагается наличие семантических связей. Ассоциативный подход к исследованию слов-синонимов нецелесообразен, так как некоторые оттенки значения «не всегда поддаются однозначной интерпретации» (Серебрякова 2002: 75). Несмотря на то, что некоторые языковеды считают невозможным количественное определение степени синонимичности слов (Будагов 1978: 40), мы все же попытаемся выявить степень синонимичности в границах группы близких по значению лексем.

Исследование языковых процессов традиционно заключается в рассмотрении таких понятий, как языковая способность (устное высказывание) и текстовая реализация лексем. Причем, большее внимание уделяется анализу текстовой реализации тех или иных лексических единиц, так как при их изучении рассматривается не только содержание и структура, но и условия их функционирования и сфера применения. Любое исследование в современной лингвистике направлено как на синтагматический, так и на парадигматический аспекты языка. Принцип перехода от изучения текстуальных связей (синтагматических) к системным (парадигматическим) лежит в основе дистрибутивно-статистических методик и может быть сформулирован следующим образом: парадигматические связи, связи второго порядка, должны выводиться из связей синтагматических. Два элемента связаны парадигматически, если оба они синтагматически связаны с какими-то третьими элементами. Значит, представляется возможным предположить, что сила парадигматической связи должна возрастать с увеличением числа и силы общих синтагматических связей (Шайкевич 1976: 370). Таким образом, анализ распределения (лат. distributio - распределение, разделение) единиц в потоке речи, а также в текстовом фрагменте, составляет основу различных разновидностей дистрибутивно-статистического анализа.

Парадигматические отношения возникают между словами, принадлежащими к одной части речи и имеющими некоторое общее значение. Эти слова образуют совокупность единиц, выбираемых для построения высказывания и способных заменять друг друга в одной и той же позиции внутри высказывания. Парадигматические отношения имплицитны, они вскрывают отношения между языковыми единицами только в результате лингвистического анализа. Сходство и различие между синонимичными лексемами в парадигматическом аспекте языка определяются методом анализа их дефиниций по толковым и двуязычным словарям. В данном случае под дистрибуцией понимается «совокупность лексических единиц, линейно окружающих заданную единицу (совместно встречающуюся с ней) в определенном интервале текста (в нашем случае, в словарной статье словаря, то есть термин «дистрибуция» в первом смысле используется только по отношению к словарному тексту как к особому виду мета текста)» (Серебрякова 2002: 234). Единицами описания лексических значения слов являются те или иные семантические признаки, на основании которых и формируется парадигмо-система. Отношения между членами парадигмы определяют ее структуру: выделяется центр (имя поля), ядро (наиболее частотная и информативная его часть), около ядерная зона, зоны ближней и дальней периферии, отличающиеся разной степенью семантической близости с ядром и друг с другом. Если имя и ядро парадигмы выражаются лексемами с наиболее абстрактным значением, состоящим из минимального количества сем, то дальнюю периферию формируют более конкретные по своему значению слова.

Следует обратить внимание на взаимосвязь составляющих синонимического ряда: «Взаимодействие центра и периферии регулируется центростремительными силами, обновляющими центр за счет периферии, и центробежными силами, наполняющими периферию. При этом могут образовываться новые смысловые центры, выходящие за пределы данной группы и поля» (Конецкая 1998: 24). Полученные данные могут служить основанием для выделения пар сильных и слабых синонимических единиц в парадигматике, то есть сильных и слабых парадигмо-синонимов. В данной работе применяется методика анализа словарных дефиниций существительных, поскольку, по общему мнению исследователей, существительные с логической точки зрения обладают более широкой семантикой, чем другие части речи. Конечно же, необходимо учитывать, что словарные дефиниции не всегда являются безупречным материалом для исследования, так как иногда страдают неточностью и тавтологией. Информация, представленная в словарях, не может быть семантически исчерпывающей, так как познание мира человеком постоянно видоизменяется и углубляется. При условии, что дефиниция признана носителями языка не ошибочной или уместной (Шубин, Троицкая 1971), обращение к одноязычным толковым словарям становится целесообразным.

Следующим этапом исследования является рассмотрение синонимичных лексем в синтагматическом аспекте, эксплицитно представленном в текстах. Дистрибутивно-статистические методики исследования синтагматики, будучи основанными на текстовом материале нескольких художественных произведений, позволяют произвести сравнительный анализ использования лексем в речи, выявив при этом изменения, происходящие в лексическом составе языка. Лексико-семантические изменения носят разнообразный характер: они не сводятся к исчезновению одних и появлению других слов, а проявляются в увеличении частотности употребления самых обыкновенных, ничем не примечательных слов, наряду с меньшим использованием употребительных ранее единиц. В основе формирования синтагмо-системы лежит принцип сплошной выборки лексем, объединенных одним общим значением.

Внутри созданной группы претендующих на синонимичность слов выделяется перечень обобщенных семантических признаков, а также определяется ряд дифференциальных характеристик. Квантитативный учет словоупотреблений позволяет сопоставить доли семантических признаков, определить семантический объем и семантическое расстояние исследуемых слов - синонимов. Для получения показателя, оценивающего близость значений, используется формула коэффициента корреляции. Конечным результатом исследования является выделение пар синонимов, между которыми зафиксировано наличие сильных (сильные синтагмо-синонимы) и слабых (слабые синтагмо-синонимы) семантических связей.

Комплексные лингвистические исследования требуют обращения, как к парадигматическому, так и к синтагматическому планам языка. Данные, полученные в результате таких исследований, являются более точными и могут претендовать на достоверность. «Несмотря на то, что генетически словари тоже восходят к текстам (создаются на их основании), с синхронной точки зрения, данные словарей и текстов не совсем совпадают, поскольку в словарях, с одной стороны, отражена только часть того, что содержится в текстах, с другой стороны, словарный текст (текст толковых, двуязычных, синонимических, антонимических словарей) отражает преимущественно парадигматические связи слов, а связный текст - синтагматические» (Серебрякова 2002: 112). Характер семантических связей между одними и теми же словами в синтагматическом и парадигматическом аспектах часто различен.

При изучении каждой отдельно взятой лексической подсистемы (в данном исследовании внимание уделяется парадигме синонимичных лексем со значением «страх») целесообразно производить анализ парадигматических свойств слов с обязательным обращением к рассмотрению их синтагматических свойств, ибо, хотя эти два аспекта исследования и соотносимы между собой, между ними все же есть различия, так как они, не покрывая друг друга полностью, являются взаимодополняющими. Установление различий между результатами, полученными в ходе парадигматического и синтагматического анализа, имеет не менее важное значение, чем определение степени их сходства. Именно такой интегрированный подход к изучению свойств языковых единиц может претендовать на получение достоверных результатов при моделировании иерархических, снабженных количественными показателями отношений тождества и различий в границах единой подсистемы, а также обеспечить эмпирическую основу для такого рода исследований.

 

АВТОР: Хоменко О.Е.