Глоссарий

Анализ текста — процесс получения высококачественной информации из текста на естественном языке.

Геномограмма - графическое представление 140 количественных показателей анализа текста или его фрагмента на предмет содержания в нем нормальных и аномальных модальностей. Геном подразумевает в данном контексте уникальность эмоциональной структуры текста.

Графическое его изображение дает визуальное представление о данных показателях для специалистов из разных областей. Сравнение двух или нескольких геномограмм дает возможность не только анализа, но и прогнозирования увеличения (уменьшения) отрицательных (положительных) оценочных показателей текста (автора текста).

Данная методология дает возможность своеобразного "анкетирования" эмоционально-нравственной структуры общественной психологии народа, нации, профессиональной общности, конкретного исторического периода и является инструментальным средством социального познания процессов, происходящих в обществе, по массивам текстов, продуцируемых в нем (по письмам, книгам, газетам, законам, постановлениям).

Контент - содержимое (или содержание) документа.

Контент-анализ (от англ.: contents - содержание, содержимое) - метод сбора количественных данных об изучаемом явлении или процессе, содержащихся в документах. Под документом при этом понимается не только официальный текст (типа инструкции или правового закона), но все написанное или произнесенное, все, что стало коммуникацией. Контент-анализу подвергаются книги, газетные или журнальные статьи, объявления, телевизионные выступления, кино- и видеозаписи, фотографии, лозунги, этикетки, рисунки, другие произведения искусства, а также, разумеется, и официальные документы.

В отечественной исследовательской традиции контент-анализ определяется как количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. Контент-анализ применяется при изучении источников, инвариантных по структуре или существу содержания, но внешне бытующих, как не систематизированный, беспорядочно организованный текстовой материал. Философский смысл контент-анализа, как исследовательского метода, состоит в восхождении от многообразия текстового материала к абстрактной модели содержания текста. В указанном смысле, контент-анализ является одной из номотетических исследовательских процедур, используемых в сфере применения идеографических методов.

Выделяют два основных типа контент-анализа: количественный и качественный.

Количественный контент-анализ (также именуется содержательным) основывается на исследовании слов, тем и сообщений, сосредоточивая внимание исследователя на содержании сообщения. Таким образом, собираясь подвергнуть анализу выбранные элементы, нужно уметь предвидеть их смысл и определять каждый возможный результат наблюдения в соответствии с ожиданиями исследователя.

Это означает, что при проведении контент-анализа этого типа исследователь должен создать своего рода словарь, в котором каждое наблюдение получит определение и будет отнесено к соответствующему классу.

Проблема состоит в том, что исследователь должен предвидеть не только упоминания, которые могут встретиться, но и элементы их контекстуального употребления, а для этого должна быть разработана детальная система правил оценки каждого случая употребления.

Системы автоматизированного количественного контент-анализа призваны облегчить рутинный труд специалистов в этой области по поиску и подсчёту в тексте определённых фразем, идиом и снизить вероятность серъёзных погрешностей и заведомо неверных выводов.