'Big Data' elemzési módszerek
Alapadatok
Course coordinator
professor emeritus
Szoba: IB420
Tel.:
+36 1 463-3595 Email: pataric (*) mit * bme * hu |
Lecturers
honorary professor
Szoba: IE435 |
associate professor
Szoba: IB418
Tel.:
+36 1 463-2006 Email: ikocsis (*) mit * bme * hu |
professor emeritus
Szoba: IB420
Tel.:
+36 1 463-3595 Email: pataric (*) mit * bme * hu |
Announcements
Introduction
A nagymennyiségű adat elemzésénél, az ún. Big Data problémakörben az adatok óriási mennyisége (tera-, peta-, ill. hexabyte méretű adatbázisok) mellett nehézség a legkülönfélébb formában rendelkezésre álló adatok fúziója és homogenizálása is. Az egyre nagyobb feldolgozási kapacitású számítási eszközök mellett célalgoritmusok és -architektúrák biztosítják az óriási adatmennyiség elérhető árú és idő alatti hatékony elemzését.
Az új lehetőségek olyan új kérdéseket vetnek fel, mint a megfelelő adatok megszerzését biztosító kísérlettervezés, a mérés megtervezése, valamint a megszerzett adat elemzése. A Big Data körében kritikus szempont az adatelemzési módszerek megfelelő skálázhatósága, a számítási komplexitás növekedésének kézbentartása, továbbá a sokdimenziós adatok hatékony ábrázolása, vizualizációja.
A tárgy célja, a Big Data problémakör megoldását biztosító eszközök és módszerek áttekintése, a nagy adatmennyiségből adódó speciális problémák kezelése. A tárgyaláshoz több szempontból előnyös, közös nevező a komplex modellek használata, valamint az adatok hatékony ábrázolása, vizualizációja, ide értve a vizuális adatelemzés lehetőségeinek áttekintését is.
A tantárgy követelményeit eredményesen teljesítő hallgatók:
1. Ismerik az elemzésre szolgáló alkalmas legfontosabb dedikált hardver/szoftver eszközöket, valamint a kinyert tudás integrációját a tipikus informatikai kulcsterületeken. Ezen belül jártasak az elterjedten használt, nyílt forráskódú R nyelvű eszközök és azok Big Data irányú kiterjesztéseinek használatában.
2. Képesek az informatika széles területén az ismeretszerzési folyamatok tervezésére, végrehajtására és eredményük szabatos reprezentációjára. Ismerik a kísérlettervezés, adatminőség-biztosítás, adattisztítás, adatelemzés, értelmezés, döntéstámogatás és modellalkotás fázisait.
3. Ismerik a klasszikus statisztikai döntéselméleti alapokat, különös tekintettel az optimalizálási és mintavételi technikákra. Megismernek néhány, a ’Big Data’ informatika területén kulcsszerepet játszó területet (pl. ritka adat analízis).