Из жизни слов. Анонс

В рамках проекта Хранитель слов мы
открываем рубрику - Из жизни слов

 

Анонс

Слово - основная единица текста. Слово возникает в тексте, развивается в нем, исчезает из него, мигрирут внутри пространства текстов. Тексты датируются и локализуются по словам, для которых, как нам кажется, мы установили место и время появления.

Первое появление слова, развитие у него нового значения, изменение написания слова - все это важнейшая текстологическая информация, которой мы, увы, обладаем в очень незначительной степени. Даже сейчас, когда мы имеем в своем распоряжении большие корпуса текстов в электронном виде, а в Интернете мимо нас ползут "Новостные Ленты" любой тематики и жанра, мы практически не используем эту почти готовую информацию для анализа жизни слов, пополнения и уточнения словарей. Причина не только в трудоемкости такого рода исследований и очевидных недостатках автоматических средств анализа текстов, но и в неумении применять адекватные методы сбора и оценки именно такой информации, отсутствии привычки к анализу и мониторингу лексических потоков (междисциплинарная проблема).

Так или иначе, раз теперь имеется такая возможность, пора начинать регулярно отслеживать и фиксировать жизнь слов, в интересах не только текстологов, но и лингвистов, информационщиков, всех, ищущих в Интернете. Полезно делиться этой информацией, организовав что-то вроде регулярной (сначала раз в месяц) "ЛЕНТЫ НОВОСТЕЙ" из жизни слов.

Такая лента могла бы иметь, например, следующие основные разделы:

  • "самые частые слова месяца" (о ком чаще всего, о чем чаще всего, как чаще всего, где чаще всего);
  • "знакомьтесь - новое слово , берегитесь - новое значение";
  • "это Наши трудности" (ошибки, варианты);
  • "самый употребительный синоним";
  • "Кто же автор СЛОВА?" (сеанс c разоблачениями и выдачей патентов);
  • "Ваша частичка Англии вредная для вашего здоровья" (загадки для тех кто не ездит в МЕТРО)
  • и т.п.

С помощью системы автоматического анализа текстов, разработанной и используемой нами, можно решать не только эти задачи, но и, например, задачи контентанализа. Можно отслеживать активизацию целых семантических групп лексики и получать на этой основе, например, динамику степени тревожности, некий "социальный барометр" по газетным текстам, или субъективную оценку "инвестиционного климата" по публичным высказываниям отобранной группы ораторов, или…

Надеемся, что в результате всей этой работы сможет возникнуть электронная лексикологическая служба, регулярно обрабатывающая потоки текстов, фиксирующая и анализирующая на этой основе новые слова и значения, отслеживающая динамические характеристики отдельных слов и групп слов, вариантов написания и т.д. Такая служба много кому нужна практически, но и кроме "низких" резонов, она поможет всем нам узнать что-то новое о реальной жизни слов, которая сейчас проходит перед нами, а может быть и об этой жизни вообще.

 

Редколлегия

 

Rambler's Top100 Rambler's Top100
Все права защищены согласно российскому и международному законодательству. Copyright © 1999 - 2011 ООО "Компьютерные системы ЛКС". Авторские права на публикации принадлежат авторам статей. Ни один фрагмент сайта не может быть использован без предварительного разрешения правообладателя. Ссылка на сайт обязательна. Сайт создан и поддерживается А.А. Соколовым