ТИПОВАЯ ПРОГРАММА 
НЕДЕЛЬНОГО СЕМИНАРА ПО  БИОСТАТИСТИКЕ

Введение
Зарождение биостатистики и биометрики как наук. Роль Ф.Гальтона и К.Пирсона в развитии биометрики. Р.Фишер и его вклад в статистику и биометрику. История развития российской биометрики. Роль Лысенко в разгроме отечественной биометрической школы. Биометрические исследования и современная концепция доказательной биомедицины. Недостатки отечественной парадигмы экспериментальной биомедицины. 

Основные понятия теории вероятностей
Понятие о случайных событиях применительно к объектам биологии и медицины. Понятие случайной величины. Связь между случайным событием и случайной величиной. Основные виды случайных величин (СВ) в биомедицине. Непрерывные и дискретные СВ. Количественные и качественные СВ. Закон распределения вероятностей СВ. Одномодальные и полимодальные распределения биологических объектов. Нормальное распределение и его свойства. Специфика возникновения нормального распределения применительно к объектам биологии и медицины. Основные характеристики распределений: математическое ожидание и дисперсия, асимметрия и эксцесс. Закон больших чисел. 

Оценка параметров совокупностей
Понятие о генеральной совокупности, виды генеральных совокупностей и популяций. Выборки из генеральных совокупностей. Выборочный метод изучения генеральных совокупностей. Измерительные шкалы: шкала наименований, порядковые шкалы, шкала интервалов и абсолютная шкала. Деление на количественные и качественные признаки. Выборочные характеристики как оценки генеральных параметров совокупности. Точечные и интервальные оценки параметров совокупности. Понятие о доверительной вероятности. Интервальные оценки параметров нормального распределения. Меры положения, рассеяния и формы распределения. Специфические отличия мер положения, рассеяния и формы групп контрольных и опытных биомедицинских объектов. Проявление взаимосвязи среднего и дисперсии в группах здоровых (контроль) и больных (опыт). 

Основы проверки статистических гипотез
Понятие статистической гипотезы применительно к биомедицинским исследованиям. Основные ошибки, допускаемые исследователями в биомедицине при сравнении групп контроля и опытных групп. Ограниченность сдвиговой парадигмы отечественной экспериментальной биомедицины. Понятие о доверительной вероятности и уровне значимости. Ошибка первого рода. Нулевая и альтернативная гипотеза; односторонние и двусторонние гипотезы. Основные этапы проверки гипотезы. Основная гипотеза о проверке нормальности распределения. Критерии согласия: хи-квадрат Пирсона и Колмогорова-Смирнова. Применение критерия Шапиро-Уилки для проверки основной гипотезы. Применение графического способа оценки нормальности распределения. Сравнение графиков распределения признаков на вероятностной бумаге для групп больных и здоровых. Проверка гипотезы о равенстве математических ожиданий двух нормальных распределений. Типичные ошибки использования t-критерия Стьюдента при анализе биомедицинских данных. Проверка гипотезы о равенстве дисперсий двух нормальных распределений. Изменение дисперсии признаков в группе больных. Проверка гипотез о долях и отношениях. Параметрические и непараметрические критерии проверки гипотез.

Изучение взаимосвязи между качественными признаками
Важность проверки однородности сравниваемых популяций по распределениям качественных, дискретных признаков. Ошибка Берксона и классический пример такой ошибки в работе Пирла. Основные комбинации между переменными разной природы и особенности исследования их взаимосвязей. Двухвходовые таблицы сопряженности типа 2*2 и R*C. Использование таблиц сопряженности для проверки гипотез об однородности популяций. Анализ таблиц сопряженности с помощью критерия хи-квадрат и поправка Йетса на непрерывность. Меры связанности для таблиц R*C, основанные на статистике хи-квадрат: коэффициент сопряженности признаков Пирсона С, мера Крамера V. Углубленный анализ таблицы сопряженности при отвержении нулевой гипотезы.  Проверка статистических гипотез о долях и отношениях. 

Основы дисперсионного анализа
Линейные модели как один из основных инструментов статистического анализа биомедицинских данных. Однофакторный дисперсионный анализ (ANOVA). Основные допущения модели линейной модели. Статистические гипотезы проверяемые с помощью дисперсионного анализа. Оценка коэффициента детерминации. Метод линейных контрастов по Шеффе. Использование контрастов Шеффе для проверки объективности градаций группирующего признака. Последствия нарушений допущений используемых в ANOVA. Двухфакторный и многофакторный дисперсионный анализ. Основное отличие многофакторного анализа от однофакторного. Эффекты взаимодействия. 

Основы корреляционного анализа
Корреляции между признаками как отображение оптимальности развития организма в онтогенезе. Работы Гальтона, Гексли и Нидхэма по аллометрии. Основные понятия и задачи корреляционного анализа. Корреляционный эллипс. Вычисление парного коэффициента корреляции Пирсона и проверка его значимости. Понятие о частном коэффициенте корреляции. Изменения частного и парного коэффициентов корреляции в группе здоровых (контроль) и группе больных (опыт). Необходимость сравнения парного и частного коэффициентов корреляции. Нормализующее преобразование Фишера при построении доверительного интервала для коэффициента корреляции. Проверка гипотезы о равенстве двух и более коэффициентов корреляции. Коэффициент ранговой корреляции Спирмэна. Другие виды коэффициентов корреляции. 

Основы регрессионного анализа
Отображение структуры взаимодействия характеристик объекта. Основные понятия и задачи регрессионного анализа при изучении биомедицинских объектов. Семь основных положений регрессионного анализа. Виды регрессионного анализа. Метод наименьших квадратов (МНК). Множественный регрессионный анализ. Оценка параметров регрессионного уравнения. Регрессионные уравнения со свободным членом и без свободного члена. Анализ размерности переменных биомедицинских признаков и регрессионных коэффициентов. Методы генерации новых комплексных признаков с помощью методов анализа размерности и подобия. Безразмерные коэффициенты регрессии. Проверка значимости оценок параметров. Дисперсионный анализ уравнения регрессии. Коэффициент множественной корреляции и его вычисление в множественной регрессии. Показатель силы связи R-квадрат. Анализ остатков в регрессионном анализе. Оценка аномальных наблюдений в регрессионном анализе. Оценки аномальных наблюдений. Явление мультиколлинеарности в регрессионном анализе. Выбор наилучшей структуры регрессионной модели. Влияние нарушений основных предположений на результаты регрессионного анализа. Логистическая регрессия и ее применение. 

Исследование структуры признаков и объектов многомерными методами
Живые организмы как многомерные системы. Сдвиговая парадигма экспериментальной биомедицины как одномерное восприятие многомерных системы. Основные цели применения многомерных методов в анализе биомедицинских данных. Методы многомерной статистики: метод главных компонент и факторный анализ, дискриминантный анализ, кластерный анализ, анализ канонических корреляций. Их применение в исследовании структуры признаков и наблюдений. Интерпретация главных компонент и факторов. Основные методы вращения факторов. Оценка числа учитываемых компонент и факторов. Исследование подсистем живых объектов методами канонической корреляции. Цели применения дискриминантного анализа в исследовании структуры объектов и признаков. Проверка значимости дискриминантных функций. Анализ стандартизованных коэффициентов дискриминантных функций. Проверка информативности дискриминантных функций с помощью переклассификации наблюдений. Основные понятия и задачи кластерного анализа. Выбор метрик и алгоритмов кластеризации. Метод К-средних и иерархическая кластеризация. Подготовка переменных перед проведением кластерного анализа. Анализ дендрограмм кластерных решений. Методы оценки оптимальности полученных кластерных структур.

Обзор статистических пакетов для анализа биомедицинских данных

Данные Международного статистического института о пакетах программ, которые могут использоваться для статистического анализа. Классификация статистических пакетов.  Современные требования к статистическим пакетам, работающим на персональных компьютерах. Особенности структуры и интерфейса основных статистических пакетов (SAS, SPSS, STATGRAPHICS,  STATISTICA, NCSS, PASS,  S-PLUS, БИОСТАТИСТИКА, MedCalc, ORIGIN, MINITAB, JMP). Особенности приобретения статистических пакетов и обучения работе на них. Статистические возможности пакета EXCEL.

Принципы описания статистики  в биомедицинских публикациях
Единые требования к рукописям, представляемым в биомедицинские журналы" подготовленные Международным комитетом редакторов медицинских журналов - ICMJE и их недостатки. "Статистические гитики" и типичные ошибки описания статистики в биомедицинских диссертациях и статьях.  Цели описания статистических методов в публикациях. Взаимосвязь контекста и описания методов статистики.

С примерами проведения данных семинаров можно познакомиться на сайте БИОМЕТРИКА по адресам http://www.biometrica.tomsk.ru/irkutsk.htm и http://www.biometrica.tomsk.ru/hingan.htm

Обучение производится на основе результатов анализа реальных данных, которые высылаются слушателями за 1-2 месяца до проведения семинара. Объем анализируемых результатов составляет 200-600 Мбайт. Дополнительную информацию можно найти на сайте БИОМЕТРИКА по адресу http://www.biometrica.tomsk.ru/seminar.htm В случае необходимости мы готовы выполнить на
профессиональном уровне индивидуальный заказ по статистическому
анализу биомедицинских данных для диссертантов.

С предложениями об организации семинаров обращаться в Центр БИОСТАТИСТИКА и на факультет статистики Томского государственного университета по E-mail: point@stn.tomsk.ru


Зам. декана факультета статистики ТГУ,
редактор журнала БИОМЕТРИКА,
Леонов В.П.