Математична статистика для біологів

Загальний опис

Мета курсу - дати поглиблені знання про основні методи класичної статистики та принципи їх застосування для аналізу біомедичних даних. Математична статистика - це вирішальній інструмент для будь-кого, хто бажає зрозуміти свої дані та екстрагувати корисні патерни з масиву інформації. Ця галузь науки поєднує як методи класичної статистики, так і сучасні методи машинного навчання, які спрямовані на створення моделей, що описують складні взаємовідносини між даними, а також дозволять зробити необхідні висновки щодо природи цієї взаємодії.

Курс розрахований на бакалаврантів та магістрантів біологічних спеціальностей.

Реєстрація: з 05.09.2023 до 01.10.2023 (форма реєстрації).

Лекції
1. Основні визначення та принципи методів класичної статистики.

Статистика, основні визначення. Нульова та альтернативна гіпотези. Статистична значущість, величина ефекту.

2. Основні інструменти дослідника у проведенні статистичного аналізу.

Огляд основних інструментів для виконання статистичного навчання. Мови програмування R та Python як найбільш гнучкі та потужні варіанти.

3. Методи порівняння середніх між 2 групами.

Параметричні та непараметричні методи для порівняння середніх між 2 групами. Метод Уелча. Метод Ст’юдента. Перевірка нормальності та гомоскедастичності даних.

4. Метод однофакторного дисперсійного аналізу.

Основні принципи методу. Особливості застосування. Перевірка основних припущень методу. Корекція на множинність порівнянь.

5. Двофакторний дисперсійний аналіз. Дисперсійний аналіз із змішаними ефектами.

Особливості застосування двофакторного дисперсійного аналізу. Багатофакторний дисперсійний аналіз. Дисперсійний аналіз із повторними вимірами.

6. Оцінка сили зв’язку між змінними.

Кореляція та коваріація. Кореляція як величина ефекту. Основні види кореляцій. Часткова кореляція.

7. Оцінка частотної характеристики між змінними.

Особливості методу хі-квадрат. Розрахунок очікуваної частоти явища. Точний метод Фішера.

8. Метод лінійної регресії.

Основні принципи методи лінійної регресії. Метод найменших квадратів. Метод градієнтного спуску для визначення коефіцієнтів.

9. Основні види регуляризації.

Визначення регуляризації. Лассо регуляризація. Гребнева регуляризація. Еластична сітка.

10. Метод логістичної регресії.

Функція сигмоїди. Лінійна комбінація предикторів. Відношення шансів та інтерпретація коефіцієнтів регресії.

Семінари
1. Екосистема мови Python для аналізу даних.
2. Порівняння середніх між групами.
3. Кореляційний аналіз.
4. Дисперсійний аналіз.
5. Лінійна та логістична регресії.
Рівень
Бакалавранти, магістранти
Лекції
10 лекцій
Практичні заняття
5 занять
Тривалість
1 місяць
Мова
Українська
Сертифікат
1 кредит ЄКТС
Викладачі

Науковий співробітник відділу Загальної та молекулярної патофізіології імені О. Богомольця, м. Київ

Предмети курсу