Телефон:
+7 (499) 705-15-45
Написать нам

Общие принципы планирования экспериментов

Общие принципы планирования экспериментов

С момента своего появления наука ищет пути к познанию законов окружающего мира. Совершая одно открытие за другим, ученые поднимаются все выше и выше по лестнице знания, стирая границу неизвестности и выходя на новые рубежи науки. Этот путь лежит через эксперимент. Сознательно ограничивая бесконечное разнообразие природы искусственными рамками научного опыта, мы превращаем его в понятную для человеческого разума картину мира.

Эксперимент как научное исследование - это форма, в которой и посредством которой наука существует и развивается. Эксперимент требует тщательной подготовки перед его проведением. В биомедицинских исследованиях планирование экспериментальной части исследования имеет особенно большое значение по причине широкой вариабельности свойств, характерной для биологических объектов. Эта особенность является основной причиной трудностей при интерпретации результатов, которые могут значительно различаться от опыта к опыту.

Статистические проблемы обосновывают необходимость выбора такой схемы эксперимента, которая минимизировала бы влияние вариабельности на выводы ученого. Поэтому цель планирования эксперимента заключается в создании схемы, которая необходима для получения как можно большей информации при наименьших затратах для выполнения исследования. Более точно планирование эксперимента можно определить как процедуру выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Планирование эксперимента появилось в агробиологии и связано с именем английского статистика и биолога сэра Рональда Эйлмера Фишера. В начале XX века на агробиологической станции в Ротамстеде (Великобритания) начались исследования влияния удобрений на урожайность различных сортов зерновых. Ученые вынуждены были считаться как с большой изменчивостью объектов исследования, так и с большой продолжительностью опытов (около года). В этих условиях не было иного пути, кроме разработки продуманного плана эксперимента для уменьшения негативного влияния указанных факторов на точность выводов. Применив статистические знания к биологическим проблемам, Фишер пришел к разработке собственных принципов теории статистического вывода и положил начало новой науке о планировании и анализе экспериментов.

Сам Рональд Фишер объяснял основы планирования на примере эксперимента произведенного для выяснения способности некой английской леди различать, что было налито в чашку в первую очередь - чай или молоко. Следует отметить, что для настоящих английских леди важно, чтобы чай наливался в молоко, а не наоборот, нарушение последовательности будет признаком невежества и испортит вкус напитка.

Эксперимент проходит просто: леди пробует чай с молоком и по вкусу пытается понять, в какой очередности были налиты оба ингредиента. План, разработанный для этого исследования, характеризуется рядом свойств.

Сравнение. Во многих исследованиях точное определение результата измерения затруднительно или невозможно. Так, например, леди не сможет количественно оценить качество чая, она будет сравнивать его с эталоном правильно приготовленного напитка, вкус которого знаком ей с детства. Как правило, в научном эксперименте объект сравнивается либо с неким заранее заданным стандартом, либо с контрольным объектом.

Рандомизация. Это очень важный момент в планировании. В нашем примере рандомизация относится к тому, в каком порядке представлять чашки на дегустацию. Рандомизация необходима для того, чтобы стало возможным применение статистических методов для анализа результатов исследования.

Репликация. Повторяемость - это необходимый компонент постановки эксперимента. Недопустимо делать выводы о способности к определению качества чая только по одной чашке. Результат каждого отдельного измерения (дегустации) несет в себе долю неопределенности, возникшей под влиянием множества случайных факторов. Следовательно, для выявления источника вариабельности необходимо провести несколько испытаний. С этим свойством связана чувствительность эксперимента. Фишер отмечал, что пока число чашек чая не превысит некоторого минимума, невозможно сделать какие-либо однозначные выводы.

Однородность. Несмотря на необходимость повторения измерений (репликация), их число не должно быть слишком велико, чтобы не утратилась однородность. Разность температур чашек, притупление вкуса и т. п. при превышении некоторого предельного числа повторений, могут затруднить анализ результатов эксперимента.

Стратификация. Выходя за рамки примера Р. Фишера к более абстрактному описанию экспериментального плана можно дополнительно указать такое свойство как стратификация (блокировка). Стратификация - это распределение экспериментальных единиц в относительно однородные группы (блоки, слои). Процедура стратификации позволяет минимизировать эффект известных нам неслучайных источников вариабельности. Внутри каждого блока ошибку эксперимента предполагают меньшей относительно варианта со случайным отбором для эксперимента такого же количества объектов. Например, при исследовании нового лекарственного препарата мы имеем два уровня фактора - «препарат» и «плацебо», которые назначаются мужчинам и женщинам. В данном случае пол - это блокирующий фактор, по которому происходит разделение исследуемых на подгруппы.


Описанные выше характеристики экспериментального плана полностью или частично относятся к любому научному эксперименту. Однако для начала работы недостаточно одного только знания об общих свойствах исследования, необходима более тщательная подготовка. Создание подробного руководства в рамках одной статьи невозможно, поэтому здесь будет изложена наиболее общая информация об этапах планирования эксперимента.

Любое исследование начинается с постановки цели. Выбор проблемы для изучения и ее формулировка повлияют как на дизайн исследования, так и на выводы, которые будут сделаны по его результатам. В самом простом случае формулировка проблемы должна предполагать вопросы «Кто?», «Что?», «Когда?», «Почему?» и «Как?».

В качестве иллюстрации важности данного этапа планирования можно привести исследование, в котором проводится сбор информации о дорожно-транспортных происшествиях. В зависимости от постановки цели, работа может быть направлена на разработку нового автомобиля либо нового дорожного покрытия. Несмотря на то, что используется один и тот же набор данных, постановка задачи и выводы существенно различаются в зависимости от формулировки проблемы.

После выбора цели работы следует определить так называемые зависимые переменные. Это переменные, которые будут измеряться при проведении исследования. Например, показатели функционирования тех или иных систем организма человека или лабораторных животных (частота сердечных сокращений, артериальное давление, содержание ферментов в крови и т. п.), а также любые другие характеристики объектов исследования, изменение которых будет для нас информативно.

Поскольку есть зависимые переменные, то должны быть еще и независимые переменные. Другое их название - факторы. Факторами исследователь оперирует в эксперименте. Это может быть доза исследуемого препарата, уровень стресса, степень физической нагрузки и т. д. Взаимосвязь между фактором и зависимой переменной удобно представлять с помощью кибернетической системы, часто называемой «черный ящик».

Черный ящик - это система, механизм работы которой нам неизвестен. Однако исследователь имеет информацию о том, что происходит на входе и выходе черного ящика. При этом состояние выхода функционально зависит от состояния входа. Соответственно y1, y2, ..., yp - это зависимые переменные, величина которых зависит от факторов (независимых переменных x1, x2, ..., xk). Параметры w1, w2, ..., wn представляют собой возмущающие воздействия, не поддающиеся контролю или изменяющиеся со временем.

В общем виде это можно записать так: y=f(x1, x2, ..., xk).

Каждый фактор в опыте может принимать одно из нескольких значений. Такие значения называют уровнями фактора. Может оказаться, что фактор способен принимать бесконечное число значений (например, доза лекарственного препарата), однако на практике выбирается несколько дискретных уровней, количество которых зависит от задач конкретного опыта.

Фиксированный набор уровней факторов определяет одно из возможных состояний черного ящика. Вместе с тем, это есть условия проведения одного из возможных опытов. Если перебрать все возможные наборы таких состояний, то мы получим полное множество различных состояний данной системы, количество которых будет числом всех возможных экспериментов. Для того, чтобы вычислить количество возможных состояний, достаточно число уровней факторов q (если для всех факторов оно одинаково) возвести в степень количества факторов k.

N=qk

Совокупность всех возможных состояний определяет сложность черного ящика. Так, система из десяти факторов на четырех уровнях может находиться более чем в миллионе разных состояний. Очевидно, что в подобных случаях невозможно провести исследование, включающее все возможные опыты. Поэтому на этапе планирования решается вопрос о том, сколько опытов и каких именно необходимо провести для решения поставленной задачи.

Следует отметить, что свойства объекта исследования имеют существенное значение для эксперимента. Во-первых, нам надо иметь информацию о степени воспроизводимости результатов опытов с данным объектом. Для этого можно провести эксперимент, а затем повторить его через неравные промежутки времени и сравнить результаты. Если разброс значений не превышает наших требований к точности эксперимента, то объект удовлетворяет требованию воспроизводимости результатов. Другое требование к объекту - его управляемость. Управляемым считается объект, на котором можно провести активный эксперимент. В свою очередь, активный эксперимент - это такой эксперимент, в процессе которого исследователь имеет возможность выбора уровней факторов, представляющих для него интерес.

На практике не существует полностью управляемых объектов. Как уже говорилось выше, на реальный объект действуют как управляемые, так и неуправляемые факторы, что приводит к вариабельности результатов между отдельными объектами. Отделить случайные изменения от закономерных, вызванных различными уровнями независимых переменных, мы можем лишь с помощью статистических методов.

Но статистические методы эффективны лишь в определенных условиях. Одно их таких условий - это требование некоего минимального размера выборок, используемых в проведении эксперимента. Очевидно, что чем шире диапазон изменения признаков от объекта к объекту, тем больше должна быть повторность опыта, т. е. численность экспериментальных групп.

Поскольку, неоправданно большое число испытаний сделает исследование слишком дорогим, а недостаточный объем выборки может поставить под сомнение точность выводов, определение необходимого объема выборок играет решающую роль в планировании эксперимента. Методы вычисления минимального объема выборок подробно описаны в специальной литературе, поэтому привести их в статье не представляется возможным. Тем не менее, следует упомянуть, что они требуют предварительного определения средней величины исследуемого показателя и ее ошибки. Источником такой информации могут послужить публикации о похожих исследованиях. Если они еще не проводились, то возникает необходимость в выполнении предварительного «пилотного» исследования для оценки вариабельности признака.

Следующий этап в планировании экспериментов - это рандомизация. Рандомизация представляет собой процесс используемый для группировки объектов таким образом, чтобы у каждого из них была равная вероятность попасть в контрольную или опытную группу. Другими словами, выбор участников исследования должен происходить случайно, чтобы исследование не было отклонено в сторону «предпочтительного» для исследователя результата.

Рандомизация помогает предотвратить смещения, обусловленные причинами, которые не были непосредственно учтены в плане эксперимента. Для этого, например, формирование экспериментальных групп лабораторных животных производится случайным образом. Однако полная рандомизация возможна далеко не всегда. Так, в клинических исследованиях принимают участие пациенты  определенной возрастной группы, с заранее заданным диагнозом и тяжестью заболевания, а, следовательно, отбор участников не является случайным. Кроме того, ограничивают рандомизацию так называемые «блочные» планы экспериментов. Эти планы подразумевают, что отбор в каждый блок выполняется в соответствии с определенными неслучайными условиями, а случайный отбор объектов исследования возможен только внутри блоков. Процесс рандомизации легко осуществить с помощью специализированного статистического программного обеспечения или специальных таблиц.

В заключение необходимо сказать о необходимости учета в плане исследования помимо требований медицины и статистики еще и морально-этических норм. Не стоит забывать о том, что не только люди, но и лабораторные животные должны вовлекаться в эксперимент в соответствии с этическими принципами.


Название: Общие принципы планирования экспериментов
Детальное описание: 

С момента своего появления наука ищет пути к познанию законов окружающего мира. Совершая одно открытие за другим, ученые поднимаются все выше и выше по лестнице знания, стирая границу неизвестности и выходя на новые рубежи науки. Этот путь лежит через эксперимент. Сознательно ограничивая бесконечное разнообразие природы искусственными рамками научного опыта, мы превращаем его в понятную для человеческого разума картину мира.

Эксперимент как научное исследование - это форма, в которой и посредством которой наука существует и развивается. Эксперимент требует тщательной подготовки перед его проведением. В биомедицинских исследованиях планирование экспериментальной части исследования имеет особенно большое значение по причине широкой вариабельности свойств, характерной для биологических объектов. Эта особенность является основной причиной трудностей при интерпретации результатов, которые могут значительно различаться от опыта к опыту.

Статистические проблемы обосновывают необходимость выбора такой схемы эксперимента, которая минимизировала бы влияние вариабельности на выводы ученого. Поэтому цель планирования эксперимента заключается в создании схемы, которая необходима для получения как можно большей информации при наименьших затратах для выполнения исследования. Более точно планирование эксперимента можно определить как процедуру выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Планирование эксперимента появилось в агробиологии и связано с именем английского статистика и биолога сэра Рональда Эйлмера Фишера. В начале XX века на агробиологической станции в Ротамстеде (Великобритания) начались исследования влияния удобрений на урожайность различных сортов зерновых. Ученые вынуждены были считаться как с большой изменчивостью объектов исследования, так и с большой продолжительностью опытов (около года). В этих условиях не было иного пути, кроме разработки продуманного плана эксперимента для уменьшения негативного влияния указанных факторов на точность выводов. Применив статистические знания к биологическим проблемам, Фишер пришел к разработке собственных принципов теории статистического вывода и положил начало новой науке о планировании и анализе экспериментов.

Сам Рональд Фишер объяснял основы планирования на примере эксперимента произведенного для выяснения способности некой английской леди различать, что было налито в чашку в первую очередь - чай или молоко. Следует отметить, что для настоящих английских леди важно, чтобы чай наливался в молоко, а не наоборот, нарушение последовательности будет признаком невежества и испортит вкус напитка.

Эксперимент проходит просто: леди пробует чай с молоком и по вкусу пытается понять, в какой очередности были налиты оба ингредиента. План, разработанный для этого исследования, характеризуется рядом свойств.

Сравнение. Во многих исследованиях точное определение результата измерения затруднительно или невозможно. Так, например, леди не сможет количественно оценить качество чая, она будет сравнивать его с эталоном правильно приготовленного напитка, вкус которого знаком ей с детства. Как правило, в научном эксперименте объект сравнивается либо с неким заранее заданным стандартом, либо с контрольным объектом.

Рандомизация. Это очень важный момент в планировании. В нашем примере рандомизация относится к тому, в каком порядке представлять чашки на дегустацию. Рандомизация необходима для того, чтобы стало возможным применение статистических методов для анализа результатов исследования.

Репликация. Повторяемость - это необходимый компонент постановки эксперимента. Недопустимо делать выводы о способности к определению качества чая только по одной чашке. Результат каждого отдельного измерения (дегустации) несет в себе долю неопределенности, возникшей под влиянием множества случайных факторов. Следовательно, для выявления источника вариабельности необходимо провести несколько испытаний. С этим свойством связана чувствительность эксперимента. Фишер отмечал, что пока число чашек чая не превысит некоторого минимума, невозможно сделать какие-либо однозначные выводы.

Однородность. Несмотря на необходимость повторения измерений (репликация), их число не должно быть слишком велико, чтобы не утратилась однородность. Разность температур чашек, притупление вкуса и т. п. при превышении некоторого предельного числа повторений, могут затруднить анализ результатов эксперимента.

Стратификация. Выходя за рамки примера Р. Фишера к более абстрактному описанию экспериментального плана можно дополнительно указать такое свойство как стратификация (блокировка). Стратификация - это распределение экспериментальных единиц в относительно однородные группы (блоки, слои). Процедура стратификации позволяет минимизировать эффект известных нам неслучайных источников вариабельности. Внутри каждого блока ошибку эксперимента предполагают меньшей относительно варианта со случайным отбором для эксперимента такого же количества объектов. Например, при исследовании нового лекарственного препарата мы имеем два уровня фактора - «препарат» и «плацебо», которые назначаются мужчинам и женщинам. В данном случае пол - это блокирующий фактор, по которому происходит разделение исследуемых на подгруппы.


Описанные выше характеристики экспериментального плана полностью или частично относятся к любому научному эксперименту. Однако для начала работы недостаточно одного только знания об общих свойствах исследования, необходима более тщательная подготовка. Создание подробного руководства в рамках одной статьи невозможно, поэтому здесь будет изложена наиболее общая информация об этапах планирования эксперимента.

Любое исследование начинается с постановки цели. Выбор проблемы для изучения и ее формулировка повлияют как на дизайн исследования, так и на выводы, которые будут сделаны по его результатам. В самом простом случае формулировка проблемы должна предполагать вопросы «Кто?», «Что?», «Когда?», «Почему?» и «Как?».

В качестве иллюстрации важности данного этапа планирования можно привести исследование, в котором проводится сбор информации о дорожно-транспортных происшествиях. В зависимости от постановки цели, работа может быть направлена на разработку нового автомобиля либо нового дорожного покрытия. Несмотря на то, что используется один и тот же набор данных, постановка задачи и выводы существенно различаются в зависимости от формулировки проблемы.

После выбора цели работы следует определить так называемые зависимые переменные. Это переменные, которые будут измеряться при проведении исследования. Например, показатели функционирования тех или иных систем организма человека или лабораторных животных (частота сердечных сокращений, артериальное давление, содержание ферментов в крови и т. п.), а также любые другие характеристики объектов исследования, изменение которых будет для нас информативно.

Поскольку есть зависимые переменные, то должны быть еще и независимые переменные. Другое их название - факторы. Факторами исследователь оперирует в эксперименте. Это может быть доза исследуемого препарата, уровень стресса, степень физической нагрузки и т. д. Взаимосвязь между фактором и зависимой переменной удобно представлять с помощью кибернетической системы, часто называемой «черный ящик».

Черный ящик - это система, механизм работы которой нам неизвестен. Однако исследователь имеет информацию о том, что происходит на входе и выходе черного ящика. При этом состояние выхода функционально зависит от состояния входа. Соответственно y1, y2, ..., yp - это зависимые переменные, величина которых зависит от факторов (независимых переменных x1, x2, ..., xk). Параметры w1, w2, ..., wn представляют собой возмущающие воздействия, не поддающиеся контролю или изменяющиеся со временем.

В общем виде это можно записать так: y=f(x1, x2, ..., xk).

Каждый фактор в опыте может принимать одно из нескольких значений. Такие значения называют уровнями фактора. Может оказаться, что фактор способен принимать бесконечное число значений (например, доза лекарственного препарата), однако на практике выбирается несколько дискретных уровней, количество которых зависит от задач конкретного опыта.

Фиксированный набор уровней факторов определяет одно из возможных состояний черного ящика. Вместе с тем, это есть условия проведения одного из возможных опытов. Если перебрать все возможные наборы таких состояний, то мы получим полное множество различных состояний данной системы, количество которых будет числом всех возможных экспериментов. Для того, чтобы вычислить количество возможных состояний, достаточно число уровней факторов q (если для всех факторов оно одинаково) возвести в степень количества факторов k.

N=qk

Совокупность всех возможных состояний определяет сложность черного ящика. Так, система из десяти факторов на четырех уровнях может находиться более чем в миллионе разных состояний. Очевидно, что в подобных случаях невозможно провести исследование, включающее все возможные опыты. Поэтому на этапе планирования решается вопрос о том, сколько опытов и каких именно необходимо провести для решения поставленной задачи.

Следует отметить, что свойства объекта исследования имеют существенное значение для эксперимента. Во-первых, нам надо иметь информацию о степени воспроизводимости результатов опытов с данным объектом. Для этого можно провести эксперимент, а затем повторить его через неравные промежутки времени и сравнить результаты. Если разброс значений не превышает наших требований к точности эксперимента, то объект удовлетворяет требованию воспроизводимости результатов. Другое требование к объекту - его управляемость. Управляемым считается объект, на котором можно провести активный эксперимент. В свою очередь, активный эксперимент - это такой эксперимент, в процессе которого исследователь имеет возможность выбора уровней факторов, представляющих для него интерес.

На практике не существует полностью управляемых объектов. Как уже говорилось выше, на реальный объект действуют как управляемые, так и неуправляемые факторы, что приводит к вариабельности результатов между отдельными объектами. Отделить случайные изменения от закономерных, вызванных различными уровнями независимых переменных, мы можем лишь с помощью статистических методов.

Но статистические методы эффективны лишь в определенных условиях. Одно их таких условий - это требование некоего минимального размера выборок, используемых в проведении эксперимента. Очевидно, что чем шире диапазон изменения признаков от объекта к объекту, тем больше должна быть повторность опыта, т. е. численность экспериментальных групп.

Поскольку, неоправданно большое число испытаний сделает исследование слишком дорогим, а недостаточный объем выборки может поставить под сомнение точность выводов, определение необходимого объема выборок играет решающую роль в планировании эксперимента. Методы вычисления минимального объема выборок подробно описаны в специальной литературе, поэтому привести их в статье не представляется возможным. Тем не менее, следует упомянуть, что они требуют предварительного определения средней величины исследуемого показателя и ее ошибки. Источником такой информации могут послужить публикации о похожих исследованиях. Если они еще не проводились, то возникает необходимость в выполнении предварительного «пилотного» исследования для оценки вариабельности признака.

Следующий этап в планировании экспериментов - это рандомизация. Рандомизация представляет собой процесс используемый для группировки объектов таким образом, чтобы у каждого из них была равная вероятность попасть в контрольную или опытную группу. Другими словами, выбор участников исследования должен происходить случайно, чтобы исследование не было отклонено в сторону «предпочтительного» для исследователя результата.

Рандомизация помогает предотвратить смещения, обусловленные причинами, которые не были непосредственно учтены в плане эксперимента. Для этого, например, формирование экспериментальных групп лабораторных животных производится случайным образом. Однако полная рандомизация возможна далеко не всегда. Так, в клинических исследованиях принимают участие пациенты  определенной возрастной группы, с заранее заданным диагнозом и тяжестью заболевания, а, следовательно, отбор участников не является случайным. Кроме того, ограничивают рандомизацию так называемые «блочные» планы экспериментов. Эти планы подразумевают, что отбор в каждый блок выполняется в соответствии с определенными неслучайными условиями, а случайный отбор объектов исследования возможен только внутри блоков. Процесс рандомизации легко осуществить с помощью специализированного статистического программного обеспечения или специальных таблиц.

В заключение необходимо сказать о необходимости учета в плане исследования помимо требований медицины и статистики еще и морально-этических норм. Не стоит забывать о том, что не только люди, но и лабораторные животные должны вовлекаться в эксперимент в соответствии с этическими принципами.


Возврат к списку