Programování

Vytvářejte vlastní modely pomocí Azure Machine Learning Designer

Strojové učení je důležitou součástí vývoje moderních aplikací, nahrazuje většinu toho, co se dříve dělo pomocí složité řady pravidel, a rozšiřuje pokrytí na mnohem širší škálu problémů. Služby, jako jsou Azure Cognitive Services, poskytují předpřipravené, předem připravené modely, které podporují mnoho běžných případů použití, ale mnoho dalších vyžaduje vývoj vlastních modelů.

Zvyk s ML

Jak postupujeme při vytváření vlastních modelů strojového učení? Můžete začít na jednom konci pomocí jazyků statistické analýzy, jako je R, k vytváření a ověřování modelů, kde jste již získali představu o základní struktuře vašich dat, nebo můžete pracovat s funkcemi lineární algebry sady Python's Anaconda. Podobně nástroje, jako jsou PyTorch a TensorFlow, mohou pomoci při konstrukci složitějších modelů s využitím neuronových sítí a hlubokého učení při integraci se známými jazyky a platformami.

To je všechno dobré, pokud máte tým datových vědců a matematiků, kteří jsou schopni vytvářet, testovat a (hlavně) ověřovat jejich modely. Vzhledem k tomu, že je těžké najít odborné znalosti v oblasti strojového učení, jsou zapotřebí nástroje, které vývojářům pomohou provést proces vytváření modelů, které podniky potřebují. V praxi většina modelů strojového učení spadá do dvou typů: první identifikuje podobná data, druhý identifikuje odlehlé údaje.

První typ aplikace bychom mohli použít k identifikaci konkrétních položek na dopravníkovém pásu nebo při druhém hledání problémů v datech z řady průmyslových senzorů. Scénáře, jako jsou tyto, nejsou nijak zvlášť složité, ale stále vyžadují vytvoření ověřeného modelu, který zajistí, že dokáže identifikovat, co hledáte, a najít signál v datech, nikoli zesílit předpoklady nebo reagovat na šum.

Představujeme Azure Machine Learning Designer

Azure k tomu poskytuje různé nástroje spolu s předpřipravenými, předem připravenými a přizpůsobitelnými modely. Jeden, Azure Machine Learning Designer, vám umožní pracovat s vašimi stávajícími daty pomocí sady nástrojů vizuálního designu a ovládacích prvků přetažení.

K sestavení modelu nemusíte psát kód, i když v případě potřeby existuje možnost přivést vlastní R nebo Python. Jedná se o náhradu původního nástroje ML Studio, která přidává hlubší integraci do sad SDK pro strojové učení Azure a podporuje více než modely založené na CPU, nabízí strojové učení založené na GPU a automatizované školení a ladění modelů.

Chcete-li začít s Azure Machine Learning Designer, otevřete web Azure Machine Learning a přihlaste se pomocí účtu Azure. Začněte připojením k předplatnému a vytvořením pracovního prostoru pro vaše modely. Průvodce nastavením vás požádá o určení, zda mají výsledné modely veřejný nebo soukromý koncový bod a zda budete pracovat s citlivými daty před výběrem způsobu správy klíčů. Citlivá data budou zpracována v tom, co Azure definuje jako „pracovní prostor s vysokým dopadem na podnikání“, což snižuje množství diagnostických dat shromážděných společností Microsoft a přidává další úrovně šifrování.

Konfigurace pracovního prostoru strojového učení

Jakmile jste prošli průvodcem, Azure před vytvořením pracovního prostoru ML zkontroluje vaše nastavení. Užitečně vám nabízí šablonu ARM, abyste mohli v budoucnu automatizovat proces vytváření, poskytující rámec pro skripty, které mohou obchodní analytici použít z interního portálu ke snížení zatížení vašich správců Azure. Nasazení prostředků potřebných k vytvoření pracovního prostoru může nějakou dobu trvat, takže buďte připraveni chvíli počkat, než začnete vytvářet jakékoli modely.

Váš pracovní prostor obsahuje nástroje pro vývoj a správu modelů strojového učení, od návrhu a školení až po správu výpočetní techniky a úložiště. Pomůže vám také označit existující data a zvýšit hodnotu vaší tréninkové datové sady. Je pravděpodobné, že budete chtít začít se třemi hlavními možnostmi: pracovat s SDK Azure ML Python SDK v poznámkovém bloku typu Jupyter, používat automatizované tréninkové nástroje Azure ML nebo povrch návrháře s přetažením a přetahováním kódu.

Vytvoření modelu pomocí Azure ML Designer

Návrhář je nejrychlejší způsob, jak začít s vlastním strojovým učením, protože vám poskytuje přístup k sadě předpřipravených modulů, které lze zřetězit a vytvořit strojové učení API, které je připraveno k použití ve vašem kódu. Začněte vytvořením plátna pro váš kanál ML a nastavením cíle výpočtu pro váš kanál. Cíle výpočtu lze nastavit pro celý model nebo pro jednotlivé moduly v rámci kanálu, což vám umožní vhodně naladit výkon.

Nejlepší je považovat výpočetní prostředky vašeho modelu za výpočetní prostředky bez serveru, které se podle potřeby zvětšují a zmenšují. Pokud ji nepoužíváte, zmenší se na nulu a může trvat až pět minut, než se znovu roztočí. To může mít vliv na provoz aplikací, proto se ujistěte, že je k dispozici před spuštěním aplikací, které na něm závisí. Při výběru výpočetního cíle budete muset vzít v úvahu zdroje potřebné k trénování modelu. Složité modely mohou využívat výhody podpory GPU Azure s podporou většiny možností výpočtu Azure (v závislosti na vaší dostupné kvótě).

Jakmile nastavíte své výpočetní výpočetní zdroje, vyberte tréninkovou datovou sadu. Může to být vaše vlastní data nebo jeden ze vzorků společnosti Microsoft. Vlastní datové sady lze sestavit z místních souborů, z dat již uložených v Azure, z webu nebo z registrovaných otevřených datových sad (které jsou často vládními informacemi).

Používání dat v Azure ML Designer

Nástroje v Návrháři vám umožní prozkoumat datové sady, které používáte, takže si můžete být jisti, že máte správný zdroj pro model, který se pokoušíte vytvořit. Se zdrojem dat na plátně můžete začít přetahovat moduly a připojovat je ke zpracování tréninkových dat; například odstranění sloupců, které neobsahují dostatek dat, nebo vyčištění chybějících dat. Tento proces drag-and-connect je velmi podobný práci s nástroji s nízkým kódem, jako jsou nástroje v Power Platform. Zde se liší tím, že máte možnost použít své vlastní moduly.

Jakmile jsou data zpracována, můžete začít vybírat moduly, které chcete trénovat model. Microsoft poskytuje sadu běžných algoritmů a také nástroje pro rozdělení datových sad pro školení a testování. Výsledné modely lze skórovat pomocí jiného modulu, jakmile je projdete tréninkem. Skóre se předává vyhodnocovacímu modulu, abyste viděli, jak dobře váš algoritmus fungoval. K interpretaci výsledků potřebujete určité statistické znalosti, abyste pochopili typy chyb, které se generují, i když v praxi platí, že čím menší je hodnota chyby, tím lépe. Nemusíte používat připravené algoritmy, protože si můžete přinést svůj vlastní Python a R kód.

Vyškolený a testovaný model lze rychle převést na odvozovací kanál připravený k použití ve vašich aplikacích. To přidá do vašeho modelu vstupní a výstupní koncové body rozhraní REST API, připravené k použití ve vašem kódu. Výsledný model se poté nasadí do clusteru AKS inferencing jako kontejner připravený k použití.

Nechte Azure udělat vše za vás: Automated Machine Learning

V mnoha případech ani nemusíte tolik vyvíjet. Společnost Microsoft nedávno vydala možnost Automatizované ML na základě práce provedené ve společnosti Microsoft Research. Zde začínáte s datovou sadou dostupnou pro Azure, což musí být tabulková data. Je určen pro tři typy modelů: klasifikaci, regrese a předpovědi. Jakmile zadáte data a vyberete typ modelu, nástroj automaticky vygeneruje schéma z dat, která můžete použít k přepínání a zapínání konkrétních datových polí, sestavování experimentu, který se poté spustí a vytvoří a otestuje model.

Automatizovaný ML vytvoří a vyhodnotí několik modelů, které můžete prozkoumat, abyste zjistili, který je pro váš problém nejlepší. Jakmile najdete požadovaný model, můžete rychle přidat fáze vstupu a výstupu a nasadit je jako službu připravenou k použití v nástrojích, jako je Power BI.

Díky strojovému učení, který je stále důležitějším prediktivním nástrojem napříč mnoha různými typy obchodních problémů, jej může Azure Machine Learning Designer přinést mnohem širšímu publiku. Pokud máte data, můžete vytvářet analytické i prediktivní modely s minimální odborností v oblasti datové vědy. S novou automatizovanou službou ML je snadné přejít od dat ke službě k analýze bez kódu.

$config[zx-auto] not found$config[zx-overlay] not found