Programování

3 Kaggle alternativy pro kolaborativní datovou vědu

Jaký je nejlepší způsob, jak získat dobrou odpověď na těžkou otázku? Zeptejte se spousty lidí a udělejte z toho soutěž. To je Kaggleův přístup k datové vědě už dlouho: Proměňte náročné mise, jako je zpřesnění detekce rakoviny plic, v soutěže odměňování, kde vyhrávají nejlepší týmy a nejlepší algoritmy.

Nyní se Kaggle zavádí do Googlu, a přestože všechny náznaky poukazují na to, že je prozatím zachováno tak, jak je, nyní se budou objevovat nervozity ohledně dlouhodobých vyhlídek na web s tak oddanou komunitou a výstředním přístupem.

Zde jsou další tři weby, které sdílejí podobnou misi, pokud nejsou výslovně následovány Kaggleovými stopami. (Upozorňujeme, že některé weby, například CrowdAnalytix, mohou považovat přijatá řešení v soutěžích za díla k pronájmu, a tedy za svůj majetek.)

DavAI

CrowdAI, produkt École Polytechnique Fédérale de Lausanne ve Švýcarsku, je open source platforma pro hostování výzev otevřených dat a získání přehledu o tom, jak byly dané problémy vyřešeny. Platforma je zcela nová, zatím nabízí pouze šest výzev, ale výukové programy odvozené od těchto výzev jsou podrobné a cenné a poskytují podrobné metodiky pro reprodukci této práce nebo vytvoření něčeho podobného. Stávající cvičení pokrývají běžné rámce jako Torch nebo TensorFlow, takže je dobrým místem pro získání praktických podrobností pro jejich použití.

DrivenData

DrivenData, vytvořená poradenskou společností zabývající se profesionálními problémy s daty, hostí online výzvy trvající několik měsíců. Každý z nich je zaměřen konkrétně na naléhavé problémy, kterým čelí svět jako celek, jako je předpovídání šíření nemocí nebo těžba dat Yelp za účelem zlepšení procesů inspekce v restauracích. Stejně jako Kaggle má DrivenData také tabulku se seznamem úloh v oblasti datových věd - funkce, které se lidé obávají, že by po akvizici Kaggle mohla zmizet.

CrowdAnalytix

CrowdAnalytix, podporovaný investory z Accel Partners a SAIF Partners, se spíše než na sdílení informací, které z nich vyplývají, zaměřuje na pořádání soutěží v řešení problémů založených na datech. Jsou nabízeny soutěže o hledání řešení problémů v kategoriích, jako je modelování, vizualizace a výzkum, a každá má odměnu v řádu tisíců dolarů. Mezi předchozí výzvy patří předpovídání skutečných nákladů na odškodnění zaměstnanců nebo zpoždění leteckých společností. Jiné soutěže však nejsou pořádány za peníze, ale za poskytnutí konkurenční možnosti učit se související disciplíně, jako je jazyk R.