Горошко Е.И.
Изучение электронного дискурса в судебном речеведении
В статье рассматриваются в рамках судебного речеведения особенности электронного дискурса, в частности русскоязычные тексты электронной почты. Выделяется ряд идентификационных характеристик, пригодных для определения пола автора электронного сообщения. Намечается дальнейшая перспектива исследований.
У статті розглядаються в рамках судового мовознавства особливості електронного дискурсу, зокрема російськомовні тексти електронної пошти. Виділяється ряд ідентифікаційних характеристик, придатних для визначення статті автора електронного повідомлення. Намічається подальша перспектива досліджень.
В эпоху столь активного развития компьютерных технологий и распространения Интернета вопросы, связанные с различными аспектами электронной коммуникации, не могут не вызвать пристального внимания и со стороны судебного речеведения. Под судебным речеведением мы вслед за Р. К. Потаповой, Е. И. Галяшиной и рядом других российских ученых понимаем "…интегративную область изучения речи, возникшую в связи с существенным расширением сферы знаний о речевом поведении и текстовой деятельности" (Галяшина, 2003, С.5). Нам кажется, что этот термин является родовым понятием, аккумулирующим такие видовые понятия как юрислингвистика, юридическая психолингвистика, психолингвистическая экспертиза, юрислингвистическая экспертиза, судебно-автороведческая экспертиза, фоноскопическая экспертиза и т. д., использующихся в правовом дискурсе на настоящий момент (Леонтьев, 2003, Юрислингвистика 1, 2, 3).
Судебное речеведение, по мнению Е. И. Галяшиной, может считаться одной из отраслей прикладной лингвистики, которая изучает речевую деятельность и её результаты в целях решения родовых задач судебной экспертизы устных и письменных произведений речи (Галяшина, 2003, С.5).
При этом Е. И. Галяшина полагает, что "…предметом судебного речеведения являются качественно своеобразные модусы организации языковой способности, речевого поведения и текстовой деятельности, когерентные задачам экспертного исследования устных и письменных текстов" (Там же). К его предмету также относится "…установление научно-достоверных фактов, объясняющих специфику закономерностей существования и функционирования естественного или искусственного языка в структуре коммуникативного акта" (Там же, С.7).
Из этого следует, что одна из важнейших целей судебного речеведения заключается в систематизации имеющихся и открытие новых сведений о структуре, содержании, результатах, участниках и компонентах коммуникативной ситуации в целом, а также их дальнейшее использование в судебной практике.
В задачи судебного речеведения входит изучение языковой личности и речевого поведения индивида, а также исследование формальной и содержательной стороны речи как результата вербальной и отчасти невербальной форм коммуникации.
Объектами судебного речеведения выступают речевые произведения, вовлекаемые в сферу судебного разбирательства в качестве документов или вещественных доказательств с целью подтверждения или опровержения позиции участвующих в деле сторон. При этом речевые произведения могут быть в любой форме.
В дальнейшем нас будет интересовать электронная форма речевых произведений и особенности электронной коммуникации.
Под электронной или компьютерной коммуникацией (КК) мы понимаем коммуникативное действие, связанное с обменом информацией и общением между людьми посредством компьютера.
Заметим, что КК характеризуется рядом свойств. Во-первых, КК является опосредованным общением с помощью технических средств. В англоязычном дискурсе существует даже специальный термин CMC (computer-mediated communication). Во-вторых, КК имеет массовый характер и объединяет огромную по численности аудиторию (не сравнимую ни с какой другой). В-третьих, она является взаимно направленной, т.к. во многих случаях существует обратная связь. При этом КК является одной из разновидностей общения - это не только процесс распространения информации, но и процесс убеждения, воздействия и т.д. И этот процесс носит социальный характер, т.к. распространяемая информация, а вместе с ней духовные, моральные и т. д. ценности и нормы, отражают интересы определенных социальных групп (Галичкина, 2001, с.34).
Обобщая ряд работ по изучению КК, можно составить её теоретическую модель. Это модель описывает КК по пяти параметрам:
- по признаку масштабности (массовая, групповая и внутриличностная);
- по признаку времени (краткая и неограниченная во времени);
- по форме (письменная (текстовая и графическая) и устная (при наличии звукового модема));
- по каналу передачи (актуальная, виртуальная);
- по способу контакта (всегда опосредованная).
В последнее время понятие КК стало почти эквивалентно понятию электронного или компьютерного дискурса (Crystal, 2001). В парадигмальных рамках данной работы два эти понятия являются взаимозаменяемыми, хотя в принципе понятия "дискурс" и "коммуникация" в лингвистике разводятся (Макаров, 2003).
Обычно компьютерный дискурс выделяется на основании канала общения. И это общение приобретает весьма специфические черты, которые могут быть сведены к следующим:
1) электронный сигнал становится каналом общения; 2) виртуальность; 3) дистантность, т.е. разделенность в пространстве и во времени; 4) опосредованность (так как осуществляется с помощью технического средства); 5) высокая степень проницаемости; 6) наличие гипертекста; 7) креолизованность компьютерных текстов в целом, включающая в себя буквенные, образно-зрительные и образно-слуховые компоненты; 8) статусное равноправие участников; 9) передача эмоций, мимики, чувств с помощью "смайликов"; 10) объединение различных типов дискурса; 11) специфическая компьютерная этика (Галичкина, 2001, С.55).
В КК выделяются определенные форматы или речевые жанры, типические формы речи, представляющие функциональный стиль с определенным перечнем конститутивных признаков. На современном этапе развития теории КК выделяются следующие жанры: электронная почта, электронные разговоры чаты, электронные доски объявлений (BBS) и компьютерные конференции (Галичкина, С.63). Однако это классификация весьма условна, т.к. по многим конституционным признаком эти жанры могут пересекаться. Например, английский лингвист Д. Кристал в монографии "Язык и Интернет" выделяет на 2001 год пять жанров, называя их при этом ситуации использования Интернета (broad Internet-using situations) (Crystal, 2001, C.10). Это: электронная почта; синхронные и асинхронные чаты, включая BBS; виртуальные миры (MOOs, MUDs, MUCKs, MUSEs и т.д.); ВЕБ - тексты.
Нас будет интересовать жанр электронной почты как объект судебного речеведения.
Электронная почта (E-mail) - услуга Internet, которая была разработана в 1972 году Рейем Томлинсоном (С. 116, Галичкина, 2001, С.63-66; Crystal, 2001, C.97-128). Первоначально электронная почта предназначалась исключительно для передачи текстовых сообщений между учеными в исследовательских центрах США, как собственно и сам Интернет является детищем Пентагона. Далее она стала использоваться для пересылки любых типов файлов, перешагнув границы американского континента. Сегодня E-mail является самым массовым и чрезвычайно популярным средством общения в компьютерной среде.
По электронной почте передаются письма, как правило, личного содержания, от одного пользователя другому. Однако существуют и письма, рассылаемые по имеющимся адресам всем пользователям от имени той или иной фирмы. Выделяется также жанр нежелательных писем рекламного характера, которые приходят на электронный адрес пользователя без его согласия, это так называемый "спам" (первоначально английское spam означало колбасный фарш, который рекламировали в компьютерных сетях таким образом) (Галичкина, 2001, С.64-65).
Как и традиционное письмо, сообщение по электронной почте состоит из: заголовка, тела сообщения (body of message) и электронной подписи (факультативный элемент). Заголовок состоит из: уникального идентификационного номера сообщения; адреса отправителя сообщения; адреса(ов) получателя(ей) сообщения (аналог "кому"); темы сообщения. В нем также содержится указание времени и даты отсылки сообщения. В некоторых случаях в заголовок включается дополнительная информация о маршруте, т. е. сетях, через которые будет переслано сообщение. Вся эта информация очень важна с точки зрения механизма доставки электронных писем.
В электронном письме подпись автоматически добавляется в конец каждого письма. Она может включать имя и адрес отправителя, небольшое графическое изображение, созданное с помощью символов псевдографики, любимую цитату и все, что автор хочет связать со своим сообщением или с тем, как он себя позиционирует. В состав электронного письма можно также включить или приложить какой-нибудь файл в любом формате: текстовом, видео, аудио и т. д., что напоминает, по словам Е. Н. Галичкиной, бандероль в традиционном толковании (Там же).
Одной из отличительных черт электронной почты по сравнению с обычным письмом является то, что в ответных электронных письмах распространено взаимное цитирование. Для разграничения вашего собственного письма от текста первоначального послания, текст последнего отмечается специальными значками в начале каждой строки (как правило, угловой скобкой ">").
В последнее время особенно на Западе, электронные письма становятся частыми объектами судебной лингвистической экспертизы (forensic linguistics) как в идентификационных (установление или отрицание конкретного авторства сообщения), так и неидентификационных целях (Corney, 2003). На материале англоязычных электронных писем было установлено, что наиболее оптимальный объем текста, пригодный для исследования - это от 100 до 200 словоформ. Установлен список значимых в плане идентификационного и неидентификационного исследований стилометрических показателей: распределение частоты длины слов, среднее количество слогов в словоформах, длина слогов, среднее количество словоформ в предложении, особенности распределения частеречной принадлежности слов от их позиции в предложении, число служебных (функциональных слов), показатели лексического богатства текста (индексы лексического разнообразия (Type Token Ratio)), индекс Симпсона (D), показатель Юла (К) и показатель величины энтропии текста) (McMenamin, 2001). Значимими оказались так же показатели лексической дистрибуции (vocabulary distribution), включая данные по количеству hapax legomena и hapax dislogemena.
Было также установлено, что тема сообщения никак не влияет на установление (отрицание) авторства электронного сообщения (Ibid, C.9). В ряде исследований указывалось на возможность установления "социолингвистических фильтров" для определения половозрастной принадлежности автора электронного письма, а также установления уровня владения им английского языка (на уровне родного, как иностранного или установление, допустим, того факта, какой вариант английского языка (например, австралийский или канадский английский) является родным.
Так, исследования в плане установления гендерных особенностей электронного письма показали, что мужская речь была лексически богаче, а мужские предложения были длиннее. В свою очередь, женщины использовали больше глаголов, их предложения были короче, их лексические средства были менее разнообразны, а также в их речи прослеживалась более ощутимая тенденция заменять существительные местоимениями (Rayson, 1997; Sighn, 2001; Sussman & Tyson, 2001; Thomson & Murachver, 2001). В целом можно заметить, что данные по гендерным различиям, полученные в английском языке, как для обычного письма, так и для электронного практически совпадают.
Всё сказанное выше побудило нас провести аналогичное пилотажное исследование на русском языке. Для исследования гендерных особенностей электронного письма (почтовых сообщений) нами было отобраны 100 сообщений (авторы писем по половому составу делились поровну). Средний уровень автора находился в промежутке от 30 до 40 лет. Родной язык - русский. Уровень образования - высшее гуманитарное. Все письма могли бы быть отнесены к жанру деловой переписки. Характеристики адресата не учитывались, хотя в дальнейшем планируется социобиографические данные об адресате ввести в эксперимент в качестве контрольных параметров. Отдельно оговорим, что мы накладывали ограничение на длину сообщений. Они не должны быть слишком короткими, что достаточно часто встречается в текстах электронной почты. Длина текста отобранных писем в среднем колебалась от 150 до 200 словоформ. Для изучения были выбраны следующие идентификационные параметры текстов: средняя длина предложений, средняя длина слов, коэффициент лексического разнообразия, показатели по hapax legomena и hapax dislogemena. Эти параметры были отобраны нами в силу их легкой формализуемости, а, следовательно, и их вычисление было полностью автоматизировано. Сопоставительные данные из англоязычных источников, также свидетельствовали, что именно по этим параметрам наблюдаются самые существенные различия между мужскими и женскими текстами (Corney, 2003, Herring, 1996).
В эксперименте при анализе полученных различий использовалась t-статистика.
Статистически значимыми получились следующие характеристики:
По показателю TTR (лексическому разнообразию) словарь женщин оказался беднее. В речи мужчин больше встретилось также слов с частотой один и два (показатели hapax legomena и hapax dislogemena в среднем выше). По остальным показателям достоверных статистических различий получено не было.
В дальнейшем мы планируем, во первых, расширить список идентификационных характеристик электронных текстов. Во-вторых, учитывать социобиографические данные адресата сообщения. В-третьих, мы бы хотели попытаться определить корреляционную связь между темой сообщения и половой принадлежность его отправителя и адресата, а также увеличить как объем выборки (количество образцов), так и постараться определить оптимальный объем электронного текста, необходимый для исследований подобного плана.
ЛИТЕРАТУРА
Галичкина Е. Н. Специфика компьютерного дискурса на английском и русском язиках. Дис. ... канд. филол. наук. Астрахань, 2001, 208с.
Галяшина Е. И. Основы судебного речеведения, М.: СТЭНСИ, 2003. - 236с.
Леонтьев А. А. О психолингвистической экспертизе // Методология современной психолингвистики, М. - Барнаул: Изд-во Алт. ун-та, 2003, с.с. 58-69.
Макаров М. Л. Основы теории дискурса, М.: ИТДГК "Гнозис", 2003. - 280с.
Юрислингвистика - 1: проблемы и перспективы, Барнаул: Изд-во Алт. ун-та, 1999 - 323с.
Юрислингвистика - 2: русский язык в его естественном и юридическом бытии, Барнаул: Изд-во Алт. ун-та, 2000. - 210с.
Юрислингвистика - 3: проблемы юрислингвистической экспертизы, Барнаул: Изд-во Алт. ун-та, 2003. - 248с.
Corney, M. W. Analysing E-mail Text Authorship for Forensic Purposes, Master Thesis, Queensland, 2003, 165p.
Crystal, D. Language and the Internet, Cambridge: Cambridge University Press, 2001.
Herring, S. C. Computer-mediated Communication: linguistic, social and cross-cultural perspectives. Amsterdam: Benjamins, 1996.
McMenamin, G. R. Style markers in authorship studies. Forensic Linguistics, 8(2): 93-97, 2001.
Rayson, P., Leech, G., Hodges, M. Social differentiation in the use of English vocabulary: Some analysis of the conversational component of the British National Corpus. International Journal of Corpus Linguistics, 2(1): 133-152, 1997.
Singh, S. A pilot study on gender differences in conversational speech on lexical richness measures. Literary and Linguistic Computing, 16 (3): 251-264, 2001.
Sussman, N. M., Tyson, D. H. Sex and Power: Gender differences in computer-mediated interactions. Computers in Human Behaviour, 16:381-394, 2000.
Thomson, R., Murachver, T. Predicting gender from electronic discourse. British Journal of Social Psychology, 40(2): 193-208, 2001.
ПРИМЕЧАНИЯ
hapax legomena - показатель количества слов, единожды встретившихся в тексте.
hapax dislogemena - показатель количества слов, дважды встретившихся в тексте.
Социолингвистические фильтры - в Западной судебной лингвистике под ними понимают совокупность характеристик текста, которые позволяют отнести его автора к определенной социальной группе.
© Е.И. Горошко, 2004.