Біоінформатика 10 2023
Основним завданням курсу «Біоінформатика» є ознайомлення студентів та аспірантів із базами біомедичних даних та методами роботи із ними, а також із основними підходами у аналізі послідовностей ДНК та білків. Курс охоплює принципи попарного та множинного вирівнювання, аналіз еволюційних зв'язків (еволюційна та популяційна генетика), побудова філогенетичних дерев, та основи медичної генетики людини. Курс розрахований на студентів, які володіють базовими знаннями з молекулярної біології та генетики. Він буде особливо корисним студентам, що планують змінювати заклад вищої освіти при вступі в магістратуру чи аспірантуру.
Курс розрахований на магістрантів та аспірантів біологічних спеціальностей, а також бакалаврантів 4го курсу. Максимальна кількість учасників – 40.
Тривалість курсу – 6 тижнів (з 02.10.2023 до 10.11.2023), 30 годин (1 кредит ЄКТС). Пари (лекції та практичні/семінари) проводитимуться онлайн в час, який не перекривається з основним навчанням студентів в університетах.
Кредити за курс можуть бути зараховані за основним місцем навчання. На сьогодні листи-підтвердження про погодження зарахування кредитів курсу для студентів-бакалаврів біологічних спеціальностей отримано від десяти університетів: Прикарпатського національного університету ім. В. Стефаника; Харківського національного університету ім. В. Н. Каразіна;
Херсонського державного унiверситету; Дніпровського національного університету ім. О. Гончара; Одеського національного університету ім. І. І. Мечникова; Львівського національного університету ім. І. Франка; Національного університету харчових технологій; Дніпровського державного медичного університету; Національного університету «Києво-Могилянська академія»;
Київського Академічного Університету.
Реєстрація: з 20.08.2023 до 20.09.2023 (завершено).
Якщо заявок буде більше, ніж передбачено грантовою програмою (максимум 40), перевага надаватиметься студентам та аспірантам з університетів, які сильно постраждали через війну.
Стипендія: 18 стипендій по 200 євро. Для студентів з родин, що сильно постраждали від війни. Умови фінансування передбачають успішне проходження курсу.
Походження терміну та сучасне визначення біоінформатики. Піонерські роботи проф. Маргарет Оклі Дейгофф. Від гену до ознаки. Зв’язки біоінформатики, компьютерних наук та системної біології. Проблеми сучасної біоінформатики.
Біоінформатичні бази даних – модель Національного Центру Біотехнології та Інформації (National Center for Biotechnology Information, NCBI): бази PubMed; Taxonomy; GenBank; Genome; Gene Expression Omnibus (GEO). Спеціалізовані бази даних на прикладі PATRIC. Поняття попарного вирівнювання, базова термінологія (співпадіння, неспівпадіння, пробіли). Гомологія послідовностей. Методи оцінювання попарних вирівнювань. Алгоритми вирівнювання: дінамічне програмування (ACS) та евристичний пошук (BLAST). Демонстрація інтерфейсу веб-сервісу BLAST. Статистика Карлін-Альтшуль та очікуване значення E.
Прогресивні методи множинного вирівнювання послідовностей. Нові інструменти множинного вирівнювання (T-COFFEE, MUSCLE, MSAProbs). Моделі основані на множинному вирівнюванні – консенсусна послідовність, позиціє-залежна матриця рахнуків (position-specific score matrices, PSSM), Weblogo, прихована модель Маркова (Hidden Markov model, HMM). Основні веб сервіс з основою HMM (TMHMM, GeneMark, Pfam, HHPred).
Порівняльний опис наукових та клінічних досліджень. Принципи EBM (evidence-based medicine, доказової медицини). Типи клінічних випробувань. Що таке керівництва клінічної практики (Clinical Practice Guidelines) як знайти та користуватись. Головні джерела клінічних даних: NCBI Clinical Trials, Drugs.com Database, Medscape, Cochrane Library. Альтернативні джерела Big Data з відкритим доступом.
Шляхи успадкування. Аналіз зчеплення. Робота з OMIM (An Online Catalog of Human Genes and Genetic Disorders). Молекуляра та генна терапія моногенних захворюваннь.
Робочий шлях NGS. Біоінформатичний аналіз даних NGS. Поширені інструменти для аналізу даних NGS. Сучасна номенклатура результатів NGS. Критерії для інтерпретації NGS, алгоритми прогнозування та необхідні бази даних. Клінічне застосування даних NGS. Представлення клінічних випадків.
Вимірювання впливу генетичних та середовищних факторів. Пошук геномних асоціацій (Genome-Wide Association Study – GWAS) – опис метода. Каталог GWAS. Аналіз GWAS (геномного пошуку асоціацій). Інтерпретація аналізу геному; визначення абсолютного ризику, відносного ризику, співвідношення імовірностей. Успішні GWAS (діабет, гіпертензія, шизофренія, рак). Цінність геномних досліджень в клінічній практиці.
Виникнення генетичної мінливості та базові концепції еволюційної біології та молекулярної еволюції. Еволюційні сили, доля алелю в популяції.
Блукання простіром генотипів.
Філогенетичні дерева: номенклатура, мислення деревами, їх редагування та зміни форматів. Три головні підходи до реконструкції еволюційної історії. Дистантні методи, Правдоподібність та Байесівська реконструкція філогенії. Моделі субституцій. Мультилокусний аналіз філогенії, коалесцентні методи.
Філогенія як скелет та нульова модель в еволюційній біології. Популяційна сторія, демографія та відбір. Метод філогенетичних контрастів. Тести на відбір. Fst викиди. Виклики та обмеження методів рекострукції філогенії за геномними даними. Генотипування секвенуванням та штучне скорочення даних. ddRAD секвенування.