Detail předmětu
Biostatistika a zpracování dat
FCH-MC_BZDAk. rok: 2024/2025
Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Dobrá znalost matematiky. Základní dovednosti práce v excelu. Schopnost základní analýzy a zpracování chemických a biologických dat.
Pravidla hodnocení a ukončení předmětu
1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10 bodech. Minimum pro úspěch: 5 bodů/úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu.
2. Zápočet sestává z testu (max. 50 bodů, minimum pro úspěch je 25 bodů), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.
Finální hodnocení vychází z průměru hodnocení domácích úloh (váha 33,3 %), zápočtového testu (váha 33,3 %) a prezentace (váha 33,3 %). Klasifikovaný zápočet bude přidělen podle klasifikace ECTS.
1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10-ti bodech. Minimum pro úspěch: 5 bodů / úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu.
2. Zápočet sestává z testu (minimum pro úspěch je polovina správných odpovědi), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.
Učební cíle
Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.
Absolvováním tohoto předmětu posluchači rozšíří své znalosti v oblasti pokročilého statistického zpracování experimentálních dat. Naučí se ovládat komplexní statistický software Statistica. Tyto nové znalosti a dovednosti jsou široce aplikovatelné v mnoha technických a přírodovědných oborech. Dalším benefitem je přímé propojení tohoto předmětu s realizací diplomových prací. Může tak přispět k vyšší kvalitě VŠKP realizovaných na FCH VUT.
Základní literatura
Meloun M., Militký J.: Statistická analýza experimentálních dat. Academia, Praha 2004. (CS)
Doporučená literatura
Meloun M.: Statistická analýza vícerozměrných dat v příkladech, Karolinium, Praha, Česká republika, 2017. (EN)
Elearning
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.
Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací.
1. Úvod do biostatistiky, základní statistické pojmy a metody
2. Teorie pravděpodobnosti, distribuce dat, centrální limitní věta
3. Z a T distribuce, standardizace hodnot pomocí Z a T skóre, interval spolehlivosti, bodové odhady střední hodnoty, intervalové odhady střední hodnoty, posouzení správnosti a shodnosti výsledků, systematizace a eliminace chyb
4. Základní deskriptivní analýza dat – grafy, testy normality, identifikace odlehlých výsledků
5. Výběr a návrh designu experimentu
6. Parametrické hypotézové testy (T-testy, ANOVA)
7. Neparametrické hypotézové testy (U-test, Kruskal Wallisova ANOVA)
8. Korelační a regresní analýza dat
9. Aplikace lineární regrese v biotechnologické a chemické praxi. Polynomická regrese, určení stupně polynomu. Tvorba modelů.
10. Vícerozměrná analýza dat – Shluková analýza – hierarchická, K-průměr
11. Vícerozměrná analýza dat – Analýza hlavních komponent (PCA)
12. Vícerozměrná analýza dat – Diskriminační analýza
13. Tvorba klasifikačních modelů pomocí diskriminační analýzy
Cvičení přímo navazuje na přednášky, kde studenti řeší konkrétní statistické problémy za použití softwarů Statistica a Excel.
Konzultace v kombinovaném studiu
Vyučující / Lektor
Elearning