Detail předmětu
Biostatistika a zpracování dat
FCH-MC_BZDAk. rok: 2022/2023
Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
Absolvováním tohoto předmětu posluchači rozšíří své znalosti v oblasti pokročilého statistického zpracování experimentálních dat. Naučí se ovládat komplexní statistický software Statistica. Tyto nové znalosti a dovednosti jsou široce aplikovatelné v mnoha technických a přírodovědných oborech. Dalším benefitem je přímé propojení tohoto předmětu s realizací diplomových prací. Může tak přispět k vyšší kvalitě VŠKP realizovaných na FCH VUT.
Prerekvizity
Dobrá znalost matematiky. Základní dovednosti práce v excelu. Schopnost základní analýzy a zpracování chemických a biologických dat.
Plánované vzdělávací činnosti a výukové metody
Přednáška -(2 vyučovací hodiny 1 za 14 dní): frontální výuka s využitím názorně demonstračních metod (PowerPoint, tabule).
Cvičení - (2 vyučovací hodiny 1 za 14 dní): výuka na pc - software Statistica, workshop, samostatné práce, diskuse.
Elektronická podpora: kurz Biostatistika zpracovaný v e-learningovém systému Moodle, video databáze přednášek a cvičení v platformě MS Stream
Způsob a kritéria hodnocení
1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10 bodech. Minimum pro úspěch: 5 bodů/úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu.
2. Zápočet sestává z testu (max. 50 bodů, minimum pro úspěch je 25 bodů), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.
Finální hodnocení vychází z průměru hodnocení domácích úloh (váha 33,3 %), zápočtového testu (váha 33,3 %) a prezentace (váha 33,3 %). Klasifikovaný zápočet bude přidělen podle klasifikace ECTS.
Osnovy výuky
Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.
Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací.
1. Úvod do biostatistiky, základní statistické pojmy a metody
2. Teorie pravděpodobnosti, distribuce dat, centrální limitní věta
3. Z a T distribuce, standardizace hodnot pomocí Z a T skóre, interval spolehlivosti, bodové odhady střední hodnoty, intervalové odhady střední hodnoty, posouzení správnosti a shodnosti výsledků, systematizace a eliminace chyb
4. Základní deskriptivní analýza dat – grafy, testy normality, identifikace odlehlých výsledků
5. Výběr a návrh designu experimentu
6. Parametrické hypotézové testy (T-testy, ANOVA)
7. Neparametrické hypotézové testy (U-test, Kruskal Wallisova ANOVA)
8. Korelační a regresní analýza dat
9. Aplikace lineární regrese v biotechnologické a chemické praxi. Polynomická regrese, určení stupně polynomu. Tvorba modelů.
10. Vícerozměrná analýza dat – Shluková analýza – hierarchická, K-průměr
11. Vícerozměrná analýza dat – Analýza hlavních komponent (PCA)
12. Vícerozměrná analýza dat – Diskriminační analýza
13. Tvorba klasifikačních modelů pomocí diskriminační analýzy
Cvičení přímo navazuje na přednášky, kde studenti řeší konkrétní statistické problémy za použití softwarů Statistica a Excel.
Učební cíle
Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10-ti bodech. Minimum pro úspěch: 5 bodů / úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu.
2. Zápočet sestává z testu (minimum pro úspěch je polovina správných odpovědi), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.
Základní literatura
Meloun M., Militký J.: Statistická analýza experimentálních dat. Academia, Praha 2004. (CS)
Doporučená literatura
Meloun M.: Statistická analýza vícerozměrných dat v příkladech, Karolinium, Praha, Česká republika, 2017. (EN)
Elearning
Zařazení předmětu ve studijních plánech
- Program NKCP_CHPL magisterský navazující 2 ročník, zimní semestr, povinně volitelný
- Program NPCP_CHPL magisterský navazující 2 ročník, zimní semestr, povinně volitelný
- Program NPCP_PCHBT magisterský navazující 2 ročník, zimní semestr, povinný
Typ (způsob) výuky
Konzultace v kombinovaném studiu
Vyučující / Lektor
Elearning