Методологія наукових досліджень_конспект

6 Математические методы и методы статистической обработки научных данных

Можно выделить следующие общие группы этих задач (см. табл. 6.1).

1. Описание данных - компактное описание имеющихся данных с помощью различных агрегированных (обобщенных) показателей и графиков. К этому классу можно отнести также задачу определения необходимого объема выборки^¹ (минимального числа исследуемых объектов), необходимого для того, чтобы сделать обоснованные выводы.

В практике научных исследований обычно имеется совокупность наблюдений (десятки, сотни, а иногда - тысячи результатов измерений индивидуальных характеристик), поэтому возникает задача компактного описания имеющихся данных. Для этого используют методы описательной статистики- описания результатов с помощью различных агрегированных показателей и графиков. Перечислим некоторые из них.

Для результатов измерений в шкале отношенийпоказатели описательной статистики можно разбить на несколько групп:

- показатели положенияописывают положение экспериментальных данных на числовой оси. Примеры таких данных

- максимальный и минимальный элементы выборки, среднее значение, медиана, модаи др.;

- показатели разбросаописывают степень разброса данных относительно своего центра (среднего значения). К ним относятся: выборочная дисперсия, разность между минимальным и максимальным элементами (размах, интервал выборки) и др.

Таблица 6.1 – Задачи анализа экспериментальных данных

ЗАДАЧА

Описание данных

Изучение сходства/различий

Исследование зависимостей

Снижение размерности

Классификация

МЕТОДЫ

- описательная статистика;

- определение необходимого объема выборки

Статистические критерии:

Крамера-Уэлча, Вилкоксона-Манна-Уитни, ², Фишера

- корреляционный анализ;

- дисперсионный анализ;

- регрессионный анализ

- факторный анализ;

- метод главных компонент

- дискриминантный анализ;

- кластерный анализ;

- группировка

- показатели асимметрии:положение медианы относительно среднего (величина разности их значений) и др.

- гистограммаи др.

Данные показатели используются для наглядного представления и первичного («визуального») анализа результатов измерений характеристик экспериментальной и контрольной группы.

2. Изучение сходства/различий(сравнение двух выборок). Например, требуется установить, достоверно ли различие конечных состояний экспериментальной и контрольной группы в эксперименте. Или, например, задача заключается в установлении совпадений или различий характеристик двух выборок (например, требуется установить, что средние значения доходов населения в двух регионах (или средние значения производительности труда в двух отраслях народного хозяйства и т.д.) совпадают или различаются). Для этого формулируются статистические гипотезы:

- гипотеза об отсутствии различий (так называемая нулевая гипотеза);

гипотеза о значимости (достоверности) различий (так называемая альтернативная гипотеза).

Для принятия решения о том, какую из гипотез (нулевую или альтернативную) следует принять, используют решающие правила - статистические критерии^². То есть, на основании информации о результатах наблюдений (характеристиках членов экспериментальной и контрольной группы) по известным формулам вычисляется число, называемое эмпирическим значением критерия. Это число сравнивается с известным (например, заданным таблично в соответствующих книгах по математической статистике эталонным числом, называемым критическим значением критерия.

Критические значения приводятся, как правило, для нескольких уровней значимости. Уровнем значимости называется вероятность ошибки, заключающейся в непринятии нулевой гипотезы, когда она верна, то есть вероятность того, что различия сочтены существенными, а они на самом деле случайны.

Обычно используют уровни значимости (обозначаемые а), равные вероятности 0,05, или 0,01, или 0,001. Или, переводя в проценты, выборки не различаются с вероятностями 5 %, 1 %, 0,1 %. Соответственно, вероятности того, что выборки различаются составят 0,95, 0,99, 0,999, или в процентах -95 %, 99 % и 99,9 %. В экономических, педагогических, психологических, медико-биологических экспериментальных исследованиях обычно ограничиваются значением 0,05, то есть допускается не более чем 5 %-ая возможность ошибки (95 % уровень достоверности различий). В естественных, технических науках чаще требуются уровни достоверности различий 99 % или 99,9 %.

Если полученное исследователем эмпирическое значение критерия оказывается меньше или равно критическому, то принимается нулевая гипотеза - считается, что на заданном уровне значимости (то есть при том значении а, для которого рассчитано критическое значение критерия) характеристики экспериментальной и контрольной групп совпадают. В противном случае, если эмпирическое значение критерия оказывается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза - характеристики экспериментальной и контрольной группы считаются различными с достоверностью различий 1 - а. Например, если а = 0,05 и принята альтернативная гипотеза, то достоверность различий равна 0,95 или 95%.

Другими словами, чем меньше эмпирическое значение критерия (чем левее оно находится от критического значения), тем больше степень совпадения характеристик сравниваемых объектов. И наоборот, чем больше эмпирическое значение критерия (чем правее оно находится от критического значения), тем сильнее различаются характеристики сравниваемых объектов.

Итак, если мы ограничимся уровнем значимости  = 0,05, то, если эмпирическое значение критерия оказывается меньше или равно критическому, то можно сделать вывод, что «характеристики экспериментальной и контрольной групп совпадают на уровне значимости 0,05». Если эмпирическое значение критерия оказывается строго больше критического, то можно сделать вывод, что «достоверность различий характеристик экспериментальной и контрольной групп равна 95 %».

Приведем алгоритм выбора статистического критерия (см. табл. 6.2). Во-первых, необходимо определить, какая

Таблица 6.2 – Алгоритм выбора статистического критерия

Шкала	Статистический критерий
измерений
Отношений	Крамера-Уэлча, Вилкоксона-Манна-Уитни
Порядковая	Вилкоксона-Манна-Уитни, ²
Номинальная	²
Дихотомическая	Фишера

шкала измерений используется - отношений, порядковая или номинальная.

Для шкалы отношений целесообразно использовать критерий Крамера-Уэлча. Если число различающихся между собой значений^³ в сравниваемых выборках велико (более десяти)^⁴, то возможно использование критерия Вилкоксона- Манна-Уитни.

Для порядковой шкалы целесообразно использовать критерий Вилкоксона-Манна-Уитни, возможно также использование критерия ².

Для номинальной шкалы следует использовать критерий ².

Для дихотомической шкалы (номинальной шкалы с двумя возможными значениями) следует использовать критерий Фишера.

3. Исследование зависимостей. Следующим шагом после изучения сходства/различий является установление факта наличия/отсутствия зависимости между показателями и количественное описание этих зависимостей. Для этих целей используются, соответственно, корреляционный и дисперсионный анализ, а также регрессионный анализ.

Корреляционный анализ. Корреляция (correlation) - связь между двумя или более переменными (в последнем случае корреляция называется множественной). Цель корреляционного анализа - установление наличия или отсутствия этой связи, то есть установление факта зависимости каких-либо явлений, процессов друг от друга или их независимости.

В случае, когда имеются две переменные, значения которых измерены в шкале отношений^⁵, используется коэффициент линейной корреляции Пирсона r, который принимает значения от -1 до +1 (нулевое его значение свидетельствует об отсутствии корреляции^⁶) - см. Рис. 6.1, на котором каждая точка соответствует отдельному объекту, описываемому двумя переменным - х и у. Термин «линейный» свидетельствует о том, что исследуется наличие линейной связи между переменными - если r(х, у) = 1, то одна переменная линейно зависит от другой (и, естественно, наоборот), то есть существуют константы а и b, причем, а > 0, такие что у = а х + b.

На рис. 6.1, а и в изображены ситуации, когда все экспериментальные точки лежат на прямой (абсолютное значение коэффициента линейной корреляции равно единице). В ситуации, изображенной на рис. 6.1, б, однозначно провести прямую через экспериментальные точки невозможно (коэффициент линейной корреляции равен нулю).

Если экспериментальные точки сгруппированы около некоторой прямой - см. рис. 6.1, г и д, то коэффициент линейной корреляции принимает значения, отличные от нуля, причем чем «ближе» точки к прямой, тем выше абсолютное значение коэффициента линейной корреляции. То есть, чем выше абсолютное значение коэффициента Пирсона, тем сильнее исследуемые переменные линейно связаны между собой.

Рисунок 6.1 – Величины коэффициента линейной корреляции в различных ситуациях

Для данных, измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена (он может применяться и для данных, измеренных в интервальной шкале, так как является непараметрическим и улавливает тенденцию - изменения переменных в одном направлении), который обозначаетсяsи определяется сравнениемрангов - номеров значений сравниваемых переменных в их упорядочении.

Коэффициент корреляции Спирмена является менее чувствительным, чем коэффициент корреляции Пирсона (так как первый в случае измерений в шкале отношений учитывает лишь упорядочение элементов выборки). В то же время, он позволяет выявлять корреляцию между монотонно нелинейно связанными переменными (для которых коэффициент Пирсона может показывать незначительную корреляцию.

Отметим, что большое (близкое к плюс единице или к минус единице) значение коэффициента корреляции говорит о связи переменных, но ничего не говорит о причинно- следственных отношениях между ними. Так, например, из высокой корреляции температуры воздуха за окном и времени суток нельзя делать вывод о том, что движение солнца обусловлено изменениями температуры воздуха. Поэтому для установления причин связей между какими-либо явлениями, процессами необходимы дополнительные исследования по содержательной интерпретации этих связей.

Дисперсионный анализ. Изучение наличия или отсутствия зависимости между переменными можно также проводить и с помощью дисперсионного анализа. Его суть заключается в следующем. Дисперсия характеризует «разброс» значений переменной. Переменные связаны, если для объектов, отличающихся значениями одной переменной, отличаются и значения другой переменной. Значит, нужно для всех объектов, имеющих одно и то же значение одной переменной (называемой независимой переменной), посмотреть, насколько различаются (насколько велика дисперсия) значения другой (или других) переменной, называемой зависимой переменной. Дисперсионный анализ как раз и дает возможность сравнить отношение дисперсии зависимой переменной (межгрупповой дисперсии) с дисперсией внутри групп объектов, характеризуемых одними и теми же значениями независимой переменной (внутригрупповой дисперсией).

Другими словами, дисперсионный анализ «работает» следующим образом. Выдвигается гипотеза о наличии зависимости между переменными: например, между возрастом и уровнем образования сотрудников некоторой организации. Выделяются группы элементов выборки (сотрудников) с одинаковыми значениями независимой переменной - возраста, то есть сотрудников одного возраста (или принадлежащих выделенному возрастному диапазону). Если гипотеза о зависимости уровня образования от возраста верна, то значения зависимой переменной (уровня образования) внутри каждой такой группы должны различаться не очень сильно (внутри- групповая дисперсия уровня образования должна быть мала). Напротив, значения зависимой переменной для различающихся по возрасту групп сотрудников должны различаться сильно (межгрупповая дисперсия уровня образования должна быть велика). То есть, переменные зависимы, если отношение межгрупповой дисперсии к внутригрупповой велико. Если же гипотеза о наличии зависимости между переменными не верна, то это отношение должно быть мало.

Регрессионный анализ. Если корреляционный и дисперсионный анализ дают ответ на вопрос, существует ли взаимосвязь между переменными, то регрессионный анализ предназначен для того, чтобы найти «явный вид» функциональной зависимости между переменными. Для этого предполагается, что зависимая переменная (иногда называемая откликом) определяется известной функцией (иногда говорят - моделью), зависящей от зависимой переменной или переменных (иногда называемых факторами) и некоторого параметра. Требуется найти такие значения этого параметра, чтобы полученная зависимость (модель) наилучшим образом описывала имеющиеся экспериментальные данные. Например, в простой^⁷ линейной регрессии предполагается, что зависимая переменная у является линейной функцией у = а х + b от независимой переменной х. Требуется найти значения параметров а и b, при которых прямая а х + Ъ будет наилучшим образом описывать (аппроксимировать) экспериментальные точки (х₁, у₁), (х₂, у₂), ..., (х_n, у_n).

Можно использовать полиномиальную регрессию, в которой предполагается, что зависимая переменная является полиномом (многочленом) некоторой степени от независимой переменной (напомним, что линейная зависимость является полиномом первой степени). Например, полиномом второй степени (знакомая всем из школьного курса алгебры парабола) будет зависимость вида у = а х² + b х + с и задачей регрессии будет нахождение коэффициентов а, b и с.

Выше мы рассмотрели простую регрессию (по одной независимой переменной) - линейную и нелинейную. Возможно также использование множественной регрессии - определения зависимости одной переменной от нескольких факторов (независимых переменных).

Регрессионный анализ, помимо того, что он позволяет количественно описывать зависимость между переменными, дает возможность прогнозировать значения зависимых переменных - подставляя в найденную формулу значения независимых переменных, можно получать прогноз значений зависимых. При этом следует помнить, что построенная модель «локальна», то есть, получена для некоторых вполне конкретных значений переменных. Экстраполяция результатов модели на более широкие области значений переменных может привести к ошибочным выводам.

4. Снижение размерности. Часто в результате экспериментальных исследований возникают большие массивы информации. Например, если каждый из исследуемых объектов описывается по нескольким критериям (измеряются значения нескольких переменных - признаков), то результатом измерений будет таблица с числом ячеек, равным произведению числа объектов на число признаков (показателей, характеристик). Возникает вопрос, а все ли переменные являются ин формативными. Конечно, исследователю желательно было бы выявить существенные переменные (это важно с содержательной точки зрения) и сконцентрировать внимание на них. Кроме того, всегда желательно сокращать объемы обрабатываемой информации (не теряя при этом сути). Чем тут могут помочь статистические методы?

Существует целый класс задач снижения размерности, цель которых как раз и заключается в уменьшении числа анализируемых переменных либо посредством выделения существенных переменных, либо/и построения новых показателей (на основании полученных в результате эксперимента).

Для снижения размерности используется факторный анализ, а основными методами являются кратко рассматриваемый ниже метод главных компонент и многомерное шкалирование.

Метод главных компонент заключается в получении нескольких новых показателей - главных компонент, являющихся линейными комбинациями исходных показателей (напомним, что линейной комбинацией называется взвешенная сумма), полученных в результате эксперимента. Главные компоненты упорядочиваются в порядке убывания той дисперсии, которую они «объясняют». Первая главная компонента объясняет большую часть дисперсии, чем вторая, вторая - большую, чем третья и т.д. Понятно, что чем больше главных компонент будет учитываться, тем большую часть изменений можно будет объяснить.

Преимущество метода главных компонент заключается в том, что зачастую первые несколько главных компонент (одна-две-три) объясняют большую часть (например, 80-90 %) изменений большого числа (десятков, а иногда и сотен) показателей. Кроме того, может оказаться, что в первые несколько главных компонент входят не все исходные параметры. Тогда можно сделать вывод о том, какие параметры являются существенными, и на них следует обратить внимание в первую очередь.

Решив задачи описания данных, установления сходства/отличий, проанализировав качественно и количественно зависимости между переменными и выявив существенные переменные, можно анализировать соотношение групп переменных и пытаться прогнозировать значения одних переменных в зависимости от значений других переменных или времени развития того или иного процесса.

5. Классификация. Обширную группу задач анализа данных, основывающихся на применении статистических методов, составляют так называемые задачи классификации. В близких смыслах (в зависимости от предметной области) используются также термины: «группировка», «систематизация», «таксономия», «диагностика», «прогноз», «принятие решений», «распознавание образов». Обсудим некоторые различия между этими терминами. Предложено выделить три подобласти теории классификации: дискриминация (дискриминантный анализ), кластеризация (кластерный анализ) и группировка. Здесь мы кратко остановимся на сути этих методов.

В дискриминантном анализе классы предполагаются заданными (например, обучающими выборками, для элементов которых известно, каким классам они принадлежат: например, больной-здоровый, правильно-неправильно, легкая степень заболевания - средняя - тяжелая и т.д.). Задача заключается в том, чтобы каждый вновь появляющийся объект отнести к одному из этих классов. У термина «дискриминация» имеется множество синонимов: диагностика (например, в медицине требуется поставить диагноз из конечного списка возможных диагнозов, если известны определенные характеристики пациента и известно, какие диагнозы ставились пациентам, вошедшим в обучающую выборку), распознавание образов с учителем, автоматическая (или статистическая) классификация с учителем и т.д.

Если в дискриминантном анализе классы заданы, то кластеризация и группировка предназначены для выявления и выделения классов. Синонимами являются: построение классификации, таксономия, распознавание образов без учителя, автоматическая классификация без учителя и т. д.

Задача кластерного анализа заключается в выделении по эмпирическим данным резко различающихся групп (кластеров) объектов, которые схожи между собой внутри каждой из групп.

При группировке, когда резких границ между кластерами не существует, исследователю приходится самому вводить границы между группами объектов.

Использование компьютера при анализе результатов эксперимента, несомненно, целесообразно. С одной стороны, ряд статистических методов реализован в такой популярной программе, как Microsoft Excel для Windows, входящей в стандартный комплект Microsoft Office, и установленной на любом современном компьютере. С другой стороны, на сегодняшний день существует множество специальных профессиональных программ, позволяющих осуществлять статистический анализ данных. Среди последних можно выделить и рекомендовать к использованию такие наиболее распространенные пакеты статистического анализа как: Statistice, StatGraphics и SPSS. Однако, упомянутые программы достаточно сложны и требуют значительных временных затрат для их освоения. Поэтому можно рекомендовать следующее: если для решения задач исследования хватает возможностей Ехсе1, то можно ограничиться использованием этой программы (недостатком ее, правда, является практически полное отсутствие вразумительных объяснений, которые помогли бы неподготовленному пользователю понять, что получилось в результате расчетов). Если возможностей Ехсеl недостаточно, то нужно обращаться к профессиональным статистическим программам. Каждая из них обладает своими достоинствами и недостатками (в одной более полно реализованы одни методы, в другой другие и т.д.). С методической точки зрения можно рекомендовать использовать программу StatGraphics (версии 5.0 и выше). Ее достоинством с позиций непрофессионального статистика является наличие «советчика», который разъясняет, что означает та или иная вычисленная величина, и что исследователю следует делать дальше.

Завершив описание статистических методов, отметим, что часто при организации исследования сложных явлений и процессов и обработке его результатов возникает необходимость использования агрегированных (комплексных) и/или векторных оценок. Рассмотрим кратко их специфику.

Агрегированные оценки. Во многих экспериментах имеется значительное число (десятки, сотни, а иногда и тысячи) объектов (субъектов). В результате измерения их показателей получается набор их частных оценок. Понятно, что сравнивать между собой и анализировать одновременно все частные оценки не всегда возможно и целесообразно, так как всегда существует их разброс, обусловленный неконтролируемым различием объектов эксперимента.

Поэтому для того, чтобы, во-первых, получить обозримое число характеристик и, во-вторых, для того, чтобы сгладить индивидуальные колебания, используют так называемые агрегированные (коллективные, групповые, производные) оценки. Например, если имелись частные (индивидуальные) оценки отдельных индивидуумов, то агрегированной оценкой будет «среднее» значение для их группы. Использование кавычек не случайно, так как получение агрегированных оценок на основании частных является их преобразованием, и преобразование это следует выполнять корректно.

Приведем некоторые корректные процедуры агрегирования для наиболее распространенных в экспериментальных исследованиях показателей.

Для величин, измеренных в шкале отношений, наиболее типичным является вычисление среднего арифметического по группе. Эта процедура вполне корректна, и обычно ее реализация не вызывает затруднений.

Наибольшее число ошибок возникает при агрегировании показателей, измеренных в порядковых шкалах. Отметим, что не следует складывать, вычитать, умножать или делить баллы друг на друга, да и на чтобы то ни было - все это абсолютно бессмысленные операции.В порядковой шкале для «усреднения» обычно используют медиану.

Если имеется набор индивидуальных баллов, то агрегированной характеристикой группы будет число ее членов, получивших тот или иной балл^⁸. Аналогичным образом агрегируется и информация о выделении уровней - если введены три уровня (например, уровни знаний: низкий, средний и высокий) и имеется информация о распределении всех членов нескольких групп (контрольных или экспериментальных) по этим уровням, то агрегированной информацией об объединенной группе будет число ее членов, обладающих тем или иным уровнем (вычисляемое как сумма по всем группам числа их членов, обладающих данным уровнем).

Если агрегирование частных оценок по группе экспериментальных объектов (субъектов) производится с целью получения характеристик группы в целом, то для описания различных аспектов, свойств и т.п. одного и того же объекта используются так называемые векторные оценки.

Векторные оценки. Нередко встречаются случаи, когда какое-либо изучаемое явление, процесс характеризуется несколькими показателями - вектором показателей. Например, при оценке труда какого-нибудь рабочего используются показатели качества труда (точности обработки деталей) и производительности труда (время выполнения операций). При этом часто возникает вопрос о возможности однозначной оценки этого явления, процесса или изучаемых их свойств одной величиной - комплексной оценкой. Например, во многих спортивных состязаниях победитель выявляется по комплексной оценке - сумме очков, баллов, набранных на отдельных этапах состязания или в отдельных играх, в многоборье - в отдельных видах спорта.

На практике комплексные оценки встречаются довольно часто и, очевидно, без них не обойтись, хотя способы их определения нередко и вызывают множество недоуменных вопросов. Но в любом случае такие комплексные оценки, применяемые в повседневной жизни, являются либо результатом определенных общественных соглашений, которые признаются всеми участниками, либо установлены каким- либо нормативным актом определенного директивного органа - министерства, ведомства и т.д. и в силу этого также признаются всеми заинтересованными лицами.

Другое дело - применение комплексных оценок в научном исследовании. Здесь сразу на первое место встает вопрос о научной, в том числе математической, строгости применяемой оценки. В частности, например, не вызывает сомнений возможность использования в организации труда такой комплексной оценки, как суммарные затраты времени на выполнение тех или иных технологических операций. Здесь суммируются однородные величины, измеренные в шкале отношений.

Между тем, при использовании шкалы рангов (порядковой шкалы) суммирование баллов довольно часто встречается в исследованиях по педагогике, психологии, медицине, биологии и другим наукам. Так, в одной «методологической» публикации для оценки эффективности деловой игры была использована следующая «формула»: Р = 50 - К - (В - 40), где Р - «комплексная» оценка в баллах, 50 - максимально возможное количество баллов, К - количество замечаний, сделанных ведущим, В - время в минутах. Как видим, здесь уж, что называется, «смешались в кучу кони, люди ...». Под знак суммы (разности) поставлены совершенно разнородные величины: баллы, количество замечаний, время, безразмерные числа.

Достаточно простым и интуитивно понятным (но, в то же время, корректным) методом агрегирования балльных оценок является использование так называемых матриц свертки, элементы которых содержат значения агрегированного показателя, а агрегируемые баллы задают номер строки и столбца.

В некоторое оправдание используемым на практике некорректным построениям комплексных оценок следует отметить, что проблема агрегирования векторных оценок на сегодняшний день исследована не полностью, а существующие результаты, даже для их применения на практике, зачастую требуют хорошего знания высшей математики. Качественно же проблема векторных оценок (или как ее иногда называют - проблема принятия решений при многих критериях) может быть проиллюстрирована на следующем простом примере из области экономики: имеются два инвестиционных проекта с одним и тем же размером первоначальных вложений (допустим, 100 единиц), причем первый характеризуется более высоким доходом (300 единиц), но и более высоким риском (предположим, что вероятность неуспеха равна 0,2), чем второй (доход - 250 единиц, вероятность неуспеха (риск) - 0,05). В какой из проектов следует осуществлять инвестиции?

Ответ неоднозначен. Если бы первый проект был более прибыльным и менее рискованным, то следовало бы выбирать его. Но имеются два критерия (доход и риск) и первая альтернатива (первый проект) «лучше» по одному критерию, но «хуже» по второму. В подобных ситуациях обычно поступают следующим образом. На первом шаге выделяют множество эффективных альтернатив (так называемых, недоминируемых по Парето, то есть таких альтернатив, что не существует других допустимых альтернатив, которые были бы «не хуже» по всем критериям, а по одному из критериев - «строго лучше»). В рассматриваемом примере оба проекта эффективны по Парето.

Дальше - на втором шаге - возможно несколько вариантов (и привести априори рациональное обоснование того, какой из них следует использовать в том или ином конкретном случае, невозможно):

ввести комплексный критерий, оценка по которому будет вычисляться агрегированием оценок по исходным критериям. В рассматриваемом примере таким критерием может быть ожидаемый доход (произведение дохода на вероятность его получения). Значение такого комплексного критерия для первого проекта равно 240 = 300 (1 - 0,2), для второго - 237,5 = =250 (1 - 0,05). С точки зрения максимизации ожидаемого дохода следует выбрать первый проект. В качестве комплексного критерия можно использовать ожидаемые потери (для первого проекта они равны 60 единиц, для второго - 12,5), тогда с точки зрения минимизации ожидаемых потерь следует выбрать второй проект;
упорядочить критерии по важности. Если считать доход более важным критерием, чем риск, то следует выбрать первый проект (так как он приносит в случае успеха больший доход: 300 > 250). Но, если считать риск более важным критерием, чем доход, то следует выбрать второй проект (так как он характеризуется меньшим риском: 0,05 < 0,2);

- возможны и другие варианты принятия решений, часть из которых будет «рекомендовать» выбрать первый проект, а другая часть - второй.

Даже из приведенного элементарного примера многокритериальной задачи принятия решений видно, что универсальных «рецептов» в этой области не существует. Но в любом случае при построении комплексных оценок нужно быть предельно внимательным и осторожным. Кстати, нередко можно обойтись и без них. Если получены количественные результаты по отдельным показателям, то можно ограничиться их качественной интерпретацией, не «загоняя под общий знаменатель», проанализировать и сравнить исследуемые объекты отдельно по каждому из показателей. И пусть по каким-то показателям результаты экспериментальных групп будут лучше контрольных, а по каким-то хуже – от этого исследование только обогатится, станет достовернее.

Контрольные вопросы

1. Перечислите задачи анализа экспериментальных данных.

2. Методы описательной статистики.

3. Приведите алгоритм выбора статистического критерия.

4. Корреляционный анализ.

5. Дисперсионный анализ.

6. Регрессионный анализ.

7. Использование компьютера при анализе результатов эксперимента.

Рекомендуемая литература

1. Новиков А. М. Методология научного исследования / А. М. Новиков, Д. А. Новиков. – М. : Либроком, 2010. – 280 с.

2. Лукашевич В. К. Основы методологии научных исследований : Учеб. пособие для студентов вузов / В. К. Лукашевич. – Мн. : ООО «Элайда», 2001. – 104 с.

3. Сабитов Р. А. Основы научных исследований : Учеб. пособие для вузов / Р. А. Сабитов. – Челябинск : Челябинский государственный университет, 2002. – 138 с.

4. Макогон Ю. В. Методика научных исследований внешнеэкономических связей / Ю. В. Макогон, В.В. Пилипенко. – Донецк : ДНУ, 2002. – 170 с.

5. Баскаков А. Я. Методология научного исследования : Учеб. пособие для вузов / А. Я. Баскаков, Н. В. Туленков. – К. : МАУП, 2004. – 216 с.

6. Новиков А. М. Методология / А. М. Новиков, Д. А. Новиков. – М. : СИНТЕГ, 2007. – 668 с.

7. Бургин М. С. Введение в современную точную методологию науки: структуры систем знания: Пособие для студентов вузов / М. С. Бургин, В. И. Кузнецов. – М. : АО «Аспект Пресс», 1994. – 304 с.

Содержание