Bárki indulhat rajta, akinek van magyar adószáma, tajszáma, lakcíme, azaz tipikusan a magyar állampolgárok, de verseny szervezői külön kidolgozták, hogy az itt dolgozó vagy tanuló külföldieknek is lehetőségük legyen versenyezni. A feladat igen összetett: három év anonimizált és torzított összes hazai lakossági hitel adatait felhasználva (lakáshitel, személyi kölcsön, hitelkártya, stb.), a szervezők megnézték, hogy kik vették fel (tipikusan több ember is tartozhat egy-egy termékhez), és hogy ebben a három évben melyik hitel dőlt be, melyiket törlesztették elő. A verseny fő kérdése, hogy mi a valószínűsége annak, hogy egy adott már hitelezett ügyfél legalább egy hitele be fog dőlni a következő 2 évben. Az adathalmazban van közel egymillió hitelszerződés, ezen már deep learning megoldások is hatékonyan futtathatók, de survival analysis, idősoros megközelítés, sőt a hitelfelvevők azonosítása miatt hálózatanalitikai megközelítés is működhet. Aki szereti kreativitást igénylő data science feladatokat, annak ez egy igazi kihívás! További információ: dataracing.hu |