Podrobnosti k letním python projektům pro studenty VŠ

Podrobnosti k letním python projektům a odkaz na přihlášky.

Pokud si chceš vyzkoušet python na reálném projektu pod vedením zkušeného lektora, který Tě povede a bude ti radit, tak není nic jednoduššího, než si vybrat jedno z následujících témat a přihlásit se na něj skrze odkaz na konci této aktuality.

Detekce anomálií

Automatický systém periodicky stahuje obsah webových stránek. Čas od času dojde ke změně některého stahovaného webu nebo jiným technickým problémům, kvůli kterým je potřeba zásah administrátora. V současné době je nasazena detekce anomálií podle jednoduchých pravidel (např.: za poslední týden se nepodařilo stáhnout ani jednu stránku, počet chyb při stahování byl více než X procent, apod.). Ne všechny problémy se ale podaří odhalit (např. když počet stažených stránkek nápadně poklesne, ale nedochází k chybám při stahování; stahování začne trvat velmi dlouho, ale proběhne korektně; apod.) 

Cílem tohoto úkolu je navrhnout detekci anomálií na bázi strojového učení, která má jako vstup denní metriky ze stahování (počet nalezených/nových/úspěšně stažených článků, doba trvání stahování, apod.) a označí tuto posloupnost logů buď za standardní, nebo podezřelou.

Získávání PDF fulltextu

Cílem tohoto úkolu je implementovat robustní extrakci textového obsahu (plaintext) z PDF dokumentů. Důraz je kladen na korektní zpracování českého jazyka (háčky, čárky apod.), s ohledem na další strojové zpracování. Testovací PDF soubory budou poskytnuty.

Stahování příspěvků z FB
Cílem tohoto úkolu je vytvořit skript (scraper), který stáhne obsah veřejných příspěvků na zadané Facebook stránce - pro každý příspěvek jeho text a datum uveřejnění. Cílem je vytvořit nástroj pro periodické stahování informací, není potřeba stáhnout celý archiv příspěvků do minulosti.

Pokud Tě některý z těchto projektů zaujal, tak se na něj můžeš přihlásit skrze online google formulář.

Přejeme Ti pěkné léto a doufáme, že se uvidíme na některém z projektů.

autor: venca