Типы информационных массивов и единицы контент-анализа. Описание метода контент-анализ Основные направления применения контент-анализа

Контент-анализ — описание метода

Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет. Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта — окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа — наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий — знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа — лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица — «предложение». Наконец, необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12—16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200—600 текстов.

» Контент-анализ социология

© О.Т. Манаев

Контент-анализ - описание метода

Контент-анализ (от англ. contens содержание) - метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа - наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий - знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение». Наконец, необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица - кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

Контент-анализ представляет измерения социальных объектов. В социологии измерение означает поиск упорядоченной классификации. Существует множество способов измерения (ранжирование, шкалирование и т.д.). Контент-анализ есть приспособление процедуры измерения к содержанию различных документов.

Первое упоминание о применении специальной техники для анализа содержания текстов относится к середине XVII столетия. В это время внимание исследователей было направлено, в основном, просто на подсчет тем. Объектом исследования долгое время служили, в основном, тексты, связанные с религиозной жизнью населения. Например, в XVH-XVIII вв. измерялась частота появления тем, связанных с именем Иисуса Христа (данные исследований использовались для принятия решений о еретичности книги).

В дальнейшем при измерении содержания документов начинают использовать относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. При этом в зависимости от того, что является переменной содержания, под длиной текста может пониматься как количество слов в данном тексте, так и количество предложений, количество абзацев, количество любых других единиц анализа текста.

Затем появилось понятие категории. В качестве категории может выступать набор слов, объединенных по определенному основанию. Посредством категорий уже представляются определенные концептуальные образования. Например, в посланиях того или иного президента можно выделить категории ЭКОНОМИКА (слова -безработица, инфляция и др.), СЕМЬЯ (родители, мать, отец, ребенок и др.) и т.д. Вычисление частоты встречаемости категорий позволяет судить о внимании, которое уделяется в послании тем или иным вопросам.

Как отмечает В.И. Шалак, по мере развития и масштабов применения данного метода были внесены и другие категории. Так, относительные частоты требуют сравнения двух и более текстов, но иногда требуется вывести то или иное заключение на основе исследования всего лишь одного текста. При этом вводится некоторая норма, которая служит нулевой отметкой измеряемой характеристики данного текста (степени лояльности, степени агрессивности и т.д.). Исчисление нормы основывается на частоте проявления лояльности, частоте употребления агрессивно окрашенных слов средним носителем данного языка и т.д. Основой для расчета нормы могут быть частотные словари.

При сравнении нормы с проявляемой лояльностью, агрессивностью и т.п. в данном тексте мы получаем отклонения в ту или иную сторону, по которым можем судить о большей или меньшей лояльности, агрессивности или любой другой характеристике текста (выступления политика и т.п.). Кроме того, статистическая оценка (z-score = N-E/стандартное отклонение, где N - количество слов данной категории, реально встретившихся в тексте, Е - ожидаемое число вхождений слов данной категории в текст, которое вычисляется умножением нормальной частоты категории на число слов в анализируемом тексте) позволяет определить значимость отклонения частот. «Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного. Очевидно, что норма для него будет отличаться от нормы для среднего человека. Поэтому для оценки агрессивности профессионального военного требуются другие нормы, которые могут быть получены путем дополнительной статистической обработки представительной выборки текстов, характерных для военной среды».

Последующее развитие контент-анализа характеризуется введением все более тонких методов анализа текстов. Например, к середине ХГХ в. внимание исследователей сосредотачивается не на простом наличии или отсутствии категорий в тексте, а на связях между ними. Для этого исчисляется совместная встречаемость слов различных категорий (обычный коэффициент корреляции). «Во второй половине XX в. западными авторами был предложен ряд ставших классическими вариантов методики контент-анализа, наиболее интересными среди которых являются «Анализ неслучайных связей» (Ч. Осгуд); «Система саов» (Р. Икера); «Анализ регрессии» (К. Лоранца); «Анализ высказываний» (С. Вейман), автоматизированная система «Дженерал Инквайрер» (Гарвардский университет), а также более поздние работы ГДалера и Г. Лаклера (анализ речей канадских и французских политиков) и работы Д. Рулофа и Д. Фрайа (анализ отношений Восток-Запад в период разрядки)». 6

Широко известен случай применения данных контент-анализа для судебного преследования некоторых редакторов газет в США за информационное пособничество нацистам. В частности, Г. Лассуэлл и ряд других социологов выступили на суде и представили результаты своих исследований как доказательство подрывной работы ряда газет (так, было подсчитано: в одной из подозреваемых в пронемецких настроениях газет 71% статей описывали слабость союзников по антигитлеровской коалиции).

Другие известные примеры применения контент-анализа в исследовании общественно-политической жизни той или иной страны. В 50-е гг. прошлого столетия западные аналитики на основе контент-анализа передовых статей газеты «Правда» выявили резкое снижение числа ссылок на Сталина. Был сделан вывод о том, что преемники его власти стремятся дистанцироваться от этой фигуры. Далее. В одном из исследований была замечена смена одного из терминов китайской периодики, что послужило индикатором для вывода о переходе к более агрессивному этапу действий Пекина (затем действительно последовала война).

В настоящее время метод контент-анализа продолжает развиваться: большое распространение находит контекстный анализ, или метод нахождения контекстов употребления слов (collocations ), появилось множество версий автоматической категоризации (группа Т. Амака из ФРГ, проект «ВААЛ» 7 в России и т.д.).

Как правило, контент-анализ применяется тогда, когда необходимо исследовать обширный (по объему) и несистематизированный (по какому-либо основанию) текстовый материал. Это означает, что квантификация оправдана, если текстового материала очень много (его нельзя даже охватить без суммарных оценок) и изучаемые качественные характеристики проявляются в тексте достаточно часто. Таким образом, контент-анализ - это перевод массовой документальной информации в количественные показатели с последующей статистической обработкой этой информации.

Суть контент-анализа заключается в переводе вербальной информации в невербальную форму, которая дает некоторые дополнительные объективные измерения того или иного текста. В этом методе содержание коммуникации служит основой для выводов. Как пишет Л.Н. Федотова, «социологический анализ содержания коммуникации состоит в своеобразной «перегруппировке» текста согласно концептуальной схеме исследователя... раздвигаются рамки текста, как объекта анализа для исследователя. Отдельное сообщение перестает быть равным самому себе, перестает иметь (для исследователя!) самодовлеющую ценность, а оценивается как реализация намерений коммуникатора, как характеристика коммуникативной ситуации, как потенциал определенных характеристик аудитории и т.д.». 8 С помощью выявления частоты появления в тех или иных документах определенных характеристик (переменных) исследователь получает точные и объективные данные о намерениях создателя текста, а также о возможных реакциях коммуниканта.

Надо отметить, что анализ документов направлен на изучение общественного мнения не прямо, а опосредованно: через исследование характеристик субъектов (политических партий, политических лидеров, средств массовой информации и т.д.), влияющих на общественное мнение, через изучение применяемых ими средств (публикаций, речей и т.д.), характера и эффективности их воздействия на общественное мнение. Так, контент-анализ широко используется в электоральных социологических исследованиях с целью изучения программных позиций политических партий и общественно-политических организаций, участвующих в избирательных кампаниях, выявления и описания личностных характеристик кандидатов, особенностей «подачи» этих кандидатов в различных СМИ.

На данный момент времени существует множество определений данного метода: статистическая (квантитативная) семантика, техника для объективного количественного анализа содержания коммуникации, техника качественных выводов при помощи установления количественных характеристик сообщения. Каждая из подобных формулировок делает акцент на количественных параметрах анализа текста, но не отражает качественной характеристики контент-анализа. Попытка интегрального определения дается в Социологическом энциклопедическом словаре: «1. Метод качественно-количественного анализа содержания документов с целью выявления имеющихся тенденций развития социальных факторов. 2. Формализованный метод исследования содержания социальной информации посредством выявления устойчиво повторяющихся смысловых единиц текста (названий, понятий, имен, суждений и т.д.)».

Процедура контент-анализа - это последовательность отдельных операций контент-анализа, каждая из которых основана на определенной технике.

Процедура исследования состоит из ряда последовательных операций:

Разработка программы исследования;

Выбор объекта и материала исследования;

Разработка модели выборки;

Разработка системы единиц анализа;

Разработка модели представления содержания текста;

Проведение выборочной операции;

Разработка полевого документа;

Разработка инструкции по проведению полевых работ;

Проведение пилотажных копировочных работ;

Уточнение логической модели предмета анализа, полевого документа и инструкции по проведению полевых работ;

Проведение основных копировочных работ, в том числе разбиение содержания текста на единицы содержания и классификация их по категориям анализа;

Разработка программы обработки полевой информации;

Обработка полевой информации;

Разработка макета представления количественных результатов исследования;

Изготовление итоговых таблиц;

Первичный анализ полученной аналитической информации.

Существуют три вида операций, которые реализуют процедуру контент-анализа: 1) по разработке документов исследования; 2) по реализации документов; 3) по обеспечению надежности процедуры.

Центральным элементом контент-анализа является логическая модель предмета анализа, в которой выделяются три элемента.

1. Категориальная модель предмета анализа, которая включает параметры и категории анализа, отражающие признаки объекта исследования и их различные аспекты. Каждому признаку соответствует свой параметр исследования, а значению признака - своя категория анализа. При этом каждый параметр анализа может быть представлен в виде системы категорий анализа.

Разработка категориальной модели начинается с определения параметров анализа. Параметры анализа могут быть одномерными и многомерными. Так, параметр «тип автора данного материала» является одномерным параметром, если он характеризуется категорией «журналисты», и становится многомерным параметром, если мы вводим еще какой-либо признак (например, пол автора). Параметры подразделяются также на исчерпывающие (полностью измеряют все аспекты соответствующих признаков) и неисчерпывающие (измеряют лишь некоторые аспекты признака) и т.д.

Вот пример расклада «структуры жизненных ситуаций противостоящих социальных субъектов» на совокупность показателей, с помощью которых определялась как разница между официальными и альтернативными СМИ, так и существенные различия внутри этих групп: оценка ситуации (+, -, +/-, 0), цель деятельности (сохранить ситуацию полностью, изменить ситуацию частично, изменить ситуацию полностью), средство достижения цели (давление сверху, диалог, компромисс, другие средства, давление снизу), модальность действий (возможность, необходимость), политическая позиция (консервативная, либеральная, демократическая), конструктивность отношения к сопернику (сотрудничество, диалог, конфронтация), результат оценки своих действий (положительный, сбалансированный или нулевой, отрицательный). 10

После установления всех параметров, каждый из них расчленяется на категории анализа, к которым предъявляется ряд требований: они должны отражать цель исследования, быть исчерпывающими,

взаимоисключающими, независимыми, выводиться из одного принципа классификации. По степени соответствия выделенных категорий исследуемой социальной реальности определяется обоснованность методики контент-анализа. Если выбор категорий и единиц анализа

то методика проводимого контент-анализа считается объективной.

2. Система единиц анализа , которая призвана зафиксировать интенсивность проявления того или иного признака и его значения. Данные смысловые единицы фиксируют фрагменты содержания документов. Если расхождение результатов кодировки разными кодировщиками (одних и тех же документов и по одной и той же инструкции) не превышает пяти процентов, то методика проводимого контент-анализа считается надежной.

Выделение смысловых единиц анализа осуществляется на основе сформулированных гипотез. Основными требованиями к подбору единиц анализа являются: единица анализа должна быть достаточно большой, чтобы выражать определенное смысловое значение; одновременно она должна быть достаточно малой, чтобы не выражать слишком много значений; в результате единица анализа должна легко и свободно идентифицироваться; при этом число единиц анализа должно быть таким, чтобы из него можно было сделать выборку.

В качестве единиц анализа могут использоваться: понятие (знак, термин и т.д.), сообщение, тема, суждение, ситуация, действие и т.д. Наименьшей единицей анализа является слово или символ.

Сообщение - одна из наиболее часто используемых единиц анализа. Оно характеризуется целостностью. Наиболее часто используется при анализе небольших текстов.

Тема - это такая единица анализа, которая представляет собой отдельное высказывание об отдельном предмете. Она очень широко применяется в социологических исследованиях. Тема может быть выражена суждением, словом и словосочетанием (наименование рубрики в газете и т.п.).

Суждение является наиболее мощной и одновременно наиболее сложной (для использования) единицей анализа.

Ситуация - это такая единица анализа, которая представляет содержание текста в виде структуры, отражающей фрагменты действительности.

Все единицы анализа классифицируются по трем основаниям:

- языковые и тематические единицы: языковые единицы (элементы структуры языка) редко используются в социологическом исследовании; тематические единицы (элементы структуры содержания текста) находят широкое применение в контент-анализе (тема сообщения, ситуация и т.д.);

- объектные и необъектные единицы анализа: объектные единицы в тексте представлены непосредственно (сообщение, рубрика, слово, предложение - единицы протяженности); к необъектным единицам относятся все тематические единицы;

- коммуникационные и структурные единицы.

3. Меры (единицы ) измерения, фиксирующие регулярность появления смысловых единиц в документе. Определив единицу анализа, надо решить, что при этом следует подсчитывать. Это может быть время, место, частота и т.д. Следует помнить, что любой текст обладает такими признаками, как протяженность и дискретность, поэтому в контент-анализе используется два типа количественных мер (единиц измерения) - единицы протяженности (объем текста в квадратных сантиметрах, объем передачи в минутах эфирного времени и т.д.) и единицы частоты (единичное присутствие какого-либо элемента содержания текста).

Единицы протяженности характеризуют анализируемое содержание в целом, без учета деления этого содержания на элементы. В качестве единиц измерения здесь чаще всего используются: квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Единица частоты, в отличие от меры протяженности (которая может быть представлена большим количеством единиц измерения), представляется всего лишь одной единицей измерения - единичным присутствием элемента содержания. Выделение большего количества единиц измерения считается нестрогим или эклектичным, так как единицы протяженности и частоты составляют весь необходимый арсенал измерения содержания по его протяженности и дискретности.

Так, Б.Н. Миронов, разбирая ошибки одного из анализов содержания исторических документов российской истории, пишет: «Но самый большой просчет автора программы заключался в том, что он взялся анализировать всего 46 небольших текстов с помощью контент-анализа, тогда как в данном случае для решения поставленной задачи более подходящим является традиционный монографический подход к каждому указу и манифесту. Крестьянская война представляла собой событие неординарное, исключительное, к тому же продолжавшееся всего около двух лет. Это время было наполнено множеством событий, в которых участвовали - не по шаблону, не по трафарету ~ сотни тысяч людей. Естественно, каждый указ и манифест являлся уникальным - или во всяком случае не типичным, не массовым документом, - отражая накал социальной борьбы, состояние дел в повстанческом и правительственном лагерях, настроение, мнения, потребности, осознание происходящего в рядах восставших в данный момент, в данную историческую секунду. Поэтому классический интенсивный анализ указов и манифестов, направленный на то, чтобы до конца проникнуть в суть документа, исчерпать его содержание, для которого важно каждое слово и даже буква, каждый поворот мысли и аргументации, словом, каждый элемент документа, более уместен в данном случае. Контентный же анализ как анализ экстенсивный, обобщающий успешнее всего работает с источником массовым, отличительные признаки которого - массовость; способность отражать массовые явления исторической действительности; ординарность

обстоятельств происхождения; однородность, повторяемость содержания; однотипность формы, тяготеющей к стандарту. Именно в массовой исторической документации частота повторения смысловой единицы, категорий анализа имеет тенденцию отражать ее значимость. В повествовательном источнике связь между частотой и значимостью нередко нарушается, а может и вообще не наблюдаться, поэтому развернутость, пространство, занимаемое смысловой единицей, более соответствует ее важности, чем частота». 11

При проведении контент-анализа используются такие исследовательские инструменты, как классификатор, протокол, кодировальная матрица, инструкция, список проанализированных документов.

Классификатором контент-анализа является общая таблица, в которую сведены все категории анализа и единицы счета. Основное предназначение подобного классификатора - четко зафиксировать, в каких единицах дана каждая категория. Классификатор можно также использовать в социологической анкете (категории анализа играют роль вопросов, а единицы анализа играют роль ответов). Классификатор является основным методическим документом.

Бланк (протокол ) контент-анализа включает в себя различные сведения о документе (автор, объем, время издания и т.д.). Кроме этого, протокол контент-анализа содержит итоги проведенного анализа. Протоколы обычно заполняются в закодированном виде для сжатия информации.

Инструкция кодировщика содержит описание единиц анализа и мер измерения, а также описание подсчета выделяемых характеристик.

Регистрационная карточка (кодировальная матрица) служит для учета количества единиц счета. Она содержит все классификационные единицы анализа - параметры и категории, обозначаемые обычно определенным кодом. При этом каждый вертикальный столбец в карточке означает отдельный документ (присвоенный ему номер), а каждая горизонтальная строка означает классификационные единицы и меры измерения, выраженные в определенных кодах.

Существуют специальные процедуры подсчета, которые приспособлены именно для нужд контент-анализа. Так, формула Яниса призвана исчислять соотношение между благоприятными и неблагоприятными суждениями, оценками, аргументами. 1 Применяется также построение шкал для оценки выделенных характеристик текста. Подсчет в контент-анализе аналогичен стандартным приемам классификации по выделенным группировкам, ранжирования и шкального изменения. «Например, изучая тематику газеты, мы произведем процентовку по сгруппированным смысловым единицам разного содержания. Можно предпринять перекрестную классификацию (содержание выдвигаемых идей, средства, предложенные для их осуществления, аргументы». 14

На заключительных этапах исследования методом контент-анализа осуществляется содержательная интерпретация результатов декомпозиции текста и квантификации выделенных элементов. При этом используются возможности и преимущества герменевтического и иных подходов. Выявляется, что хотел автор(ы) текста скрыть, подчеркнуть и т.д. Делаются определенные аналитические выводы (на основе некоторых концептуальных построений глубинной психологии и т.д.). При этом выводы и постулируемые положения, естественно, должны быть нацелены на решение поставленных в данном исследовании задач.

Квалифицированно проводимое исследование предполагает применение процедуры верификации полученных исследовательских результатов. Эта процедура совершается, как правило, путем соотнесения и сопоставления новых данных с теми, которые были получены ранее другими исследователями. Часто также используется метод повторения данной исследовательской процедуры (но уже другой группой исследователей). Если же полученная информация хорошо коррелирует с данными, которые были произведены в рамках других исследовательских процедур, то верификация полученных результатов считается вполне успешной.

Контент-анализ – метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах.

Контент-анализ – формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью. Контент-анализ не отменяет необходимости обычного (т.е. содержательного) анализа документов. Первый дополняет второй, их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл.

Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что:

А) существовало до него и получило в нем отражение,

б) наличествует только в нем,

в) будет после него, т.е. явится итогом его восприятия адресатом.

Объект контент-анализа - документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).

Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Стадии разработки и применения контент-анализа:

Формулируются тема, задачи и гипотезы исследования

Определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. Категории контент-анализа должны быть уместными, т.е. соответствовать решению исследовательских задач; исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. За единицу анализа может быть принято слово, предложение, тема, идея, автор, персонаж, социальная ситуация, часть текста, объединенная чем-то, что соответствует смыслу категории анализа. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа.

Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность). Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

  • < Назад
  • Вперёд >

Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.

Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.

Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.

В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.

Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.

Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.

Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

Понравилась статья? Поделиться с друзьями: