Programování

Recenze: Google Cloud AI rozsvítí strojové učení

Google má jeden z největších zásobníků strojového učení v oboru, který se v současné době soustředí na svoji Google Cloud AI a Machine Learning Platform. Google před lety roztočil TensorFlow jako open source, ale TensorFlow je stále nejzralejší a nejvíce citovaný rámec hlubokého učení. Podobně Google před lety předělal Kubernetes jako open source, ale stále je to dominantní systém správy kontejnerů.

Google je jedním z hlavních zdrojů nástrojů a infrastruktury pro vývojáře, datové vědce a odborníky na strojové učení, ale Google AI historicky nebyl tak atraktivní pro obchodní analytiky, kterým chybí seriózní data science nebo programovací prostředí. To se začíná měnit.

Platforma Google Cloud AI a Machine Learning zahrnuje stavební bloky AI, platformu AI a akcelerátory a řešení AI. Řešení AI jsou poměrně nová a zaměřují se spíše na obchodní manažery než na datové vědce. Mohou zahrnovat konzultace od společnosti Google nebo jejích partnerů.

Stavební bloky AI, které jsou předem vyškolené, ale přizpůsobitelné, lze použít bez důkladné znalosti programování nebo vědy o datech. Přesto je často používají zkušení datoví vědci z pragmatických důvodů, v podstatě k tomu, aby zvládli věci bez rozsáhlého tréninku modelu.

Platforma AI a akcelerátory jsou obecně pro seriózní datové vědce a vyžadují dovednosti kódování, znalosti technik přípravy dat a spoustu času na školení. Doporučuji jít tam až po vyzkoušení příslušných stavebních bloků.

V nabídce umělé inteligence Google Cloudu stále chybí některé odkazy, zejména při přípravě dat. Nejbližší věc, kterou má Google Cloud ke službě importu a úpravy dat, je Cloud Dataprep jiného výrobce od Trifacta; Zkusil jsem to před rokem a byl jsem ohromen. Inženýrství funkcí zabudované do tabulek Cloud AutoML je slibné a bylo by užitečné mít tento druh služby k dispozici pro jiné scénáře.

Tichá spodní strana umělé inteligence má co do činění s etikou a odpovědností (nebo jejím nedostatkem), spolu s přetrvávajícími předsudky modelu (často kvůli zkresleným údajům používaným pro školení). Google zveřejnil své principy AI v roce 2018. Jedná se o nedokončenou práci, ale jde o základ pro vedení, jak je popsáno v nedávném blogovém příspěvku o zodpovědné AI.

Na trhu AI existuje velká konkurence (více než tucet prodejců) a velká konkurence na trhu veřejných cloudů (více než půl tuctu důvěryhodných prodejců). Abych srovnával spravedlnost, musel bych napsat článek alespoň pětkrát delší než tento, takže i když je nerad vynechávám, budu muset většinu srovnání produktů vynechat. Pro nejlepší zřejmé srovnání mohu shrnout: AWS dělá většinu toho, co dělá Google, a je také velmi dobrý, ale obecně účtuje vyšší ceny.

Google Cloud AI Building Blocks

Google Cloud AI Building Blocks jsou snadno použitelné komponenty, které můžete začlenit do svých vlastních aplikací a přidat zrak, jazyk, konverzaci a strukturovaná data. Mnoho stavebních bloků AI je předem vyškolených neuronových sítí, ale lze je upravit pomocí přenosu učení a vyhledávání neuronových sítí, pokud neslouží vašim potřebám ihned po vybalení z krabice. Tabulky AutoML se trochu liší v tom, že automatizuje proces, který by datový vědec použil k nalezení nejlepšího modelu strojového učení pro tabulkovou datovou sadu.

AutoML

Služby Google Cloud AutoML poskytují přizpůsobené hluboké neuronové sítě pro překlad jazykových párů, klasifikaci textu, detekci objektů, klasifikaci obrázků a klasifikaci a sledování video objektů. Vyžadují označená data pro školení, ale nevyžadují významné znalosti hlubokého učení, přenosu učení nebo programování.

Google Cloud AutoML přizpůsobuje bitevně testované vysoce přesné hluboké neurální sítě pro vaše označená data. Spíše než začít od nuly, když trénujete modely z vašich dat, implementuje AutoML automatické hluboké přenosové učení (to znamená, že začíná od existující hluboké neurální sítě trénované na jiných datech) a vyhledávání neurální architektury (což znamená, že najde správnou kombinaci dalších síťových vrstev ) pro překlad jazykových párů a další služby uvedené výše.

V každé oblasti Google již má jednu nebo více předem vyškolených služeb založených na hlubokých neuronových sítích a obrovských sadách označených dat. Mohou dobře fungovat pro vaše data nezměněná a měli byste to otestovat, abyste ušetřili čas a peníze. Pokud nedělají to, co potřebujete, pomůže vám Google Cloud AutoML vytvořit model, který to udělá, aniž byste museli vědět, jak provádět přenosové učení nebo jak navrhovat neuronové sítě.

Přenos učení nabízí dvě velké výhody oproti tréninku neurální sítě od nuly. Nejprve to vyžaduje mnohem méně dat pro školení, protože většina vrstev sítě je již dobře proškolena. Zadruhé, trénuje mnohem rychleji, protože optimalizuje pouze konečné vrstvy.

Zatímco služby Google Cloud AutoML se dříve představovaly společně jako balíček, nyní jsou uvedeny s jejich základními předem vyškolenými službami. To, co většina ostatních společností nazývá AutoML, provádějí tabulky Google Cloud AutoML.

Přečtěte si celou recenzi Google Cloud AutoML

Tabulky AutoML

Obvyklým procesem datové vědy pro mnoho regresních a klasifikačních problémů je vytvoření tabulky dat pro trénink, vyčištění a kondicionování dat, provedení inženýrství funkcí a pokus o trénování všech příslušných modelů v transformované tabulce, včetně kroku optimalizace hyperparametry nejlepších modelů. Jakmile ručně identifikujete cílové pole, tabulky Google Cloud AutoML mohou celý tento proces provést automaticky.

Tabulky AutoML automaticky prohledávají strukturovaná data v modelové zoo společnosti Google, aby našli ten nejlepší model pro vaše potřeby, od lineárních / logistických regresních modelů pro jednodušší datové sady až po pokročilé metody hloubkového, souborového a architektonického vyhledávání u větších a složitějších. Automatizuje inženýrství funkcí u široké škály tabulkových datových primitiv - jako jsou čísla, třídy, řetězce, časová razítka a seznamy - a pomáhá vám detekovat a starat se o chybějící hodnoty, odlehlé hodnoty a další běžné problémy s daty.

Jeho bezkódové rozhraní vás provede celým životním cyklem strojového učení typu end-to-end, což usnadní komukoli ve vašem týmu vytváření modelů a jejich spolehlivé začlenění do širších aplikací. Tabulky AutoML poskytují rozsáhlé vstupní údaje a funkce vysvětlitelnosti chování modelu spolu se zábradlím, aby se zabránilo běžným chybám. Tabulky AutoML jsou k dispozici také v prostředí API a notebooků.

Tabulky AutoML soutěží s Driverless AI a několika dalšími implementacemi a rámci AutoML.

Vision API

Google Cloud Vision API je předem vyškolená služba strojového učení pro kategorizaci obrázků a extrahování různých funkcí. Může klasifikovat obrázky do tisíců předem vycvičených kategorií, od obecných předmětů a zvířat nalezených na obrázku (například kočka), přes obecné podmínky (například za soumraku) až po konkrétní orientační body (Eiffelova věž, Grand Canyon), a identifikovat obecné vlastnosti obrazu, například jeho dominantní barvy. Může izolovat oblasti, které jsou tvářemi, poté aplikovat geometrické (orientace obličeje a orientační body) a emocionální analýzy na tváře, i když nerozpozná tváře jako patřící konkrétním lidem, s výjimkou osobností (což vyžaduje speciální licenci k použití). Vision API používá OCR k detekci textu v obrazech ve více než 50 jazycích a různých typech souborů. Může také identifikovat loga produktů a detekovat obsah pro dospělé, násilí a lékařský obsah.

Přečtěte si celou recenzi rozhraní Google Cloud Machine Learning API

Video Intelligence API

Rozhraní Google Cloud Video Intelligence API automaticky rozpozná více než 20 000 objektů, míst a akcí v uloženém a streamovaném videu. Rozlišuje také změny scény a extrahuje bohatá metadata na úrovni videa, snímku nebo snímku. Dále provádí detekci a extrakci textu pomocí OCR, detekuje explicitní obsah, automatizuje skryté titulky a titulky, rozpoznává loga a detekuje tváře, osoby a pózy.

Google doporučuje rozhraní Video Intelligence API pro extrakci metadat k indexování, organizaci a vyhledávání vašeho video obsahu. Může přepisovat videa a generovat skryté titulky, stejně jako označovat a filtrovat nevhodný obsah, a to vše nákladově efektivněji než lidské přepisovače. Mezi případy použití patří moderování obsahu, doporučení obsahu, mediální archivy a kontextové reklamy.

Natural Language API

Zpracování přirozeného jazyka (NLP) je velkou součástí „tajné omáčky“, díky níž dobře funguje vstup do Vyhledávání Google a Google Assistant. Rozhraní Google Cloud Natural Language API poskytuje vašim programům stejnou technologii. Může provádět analýzu syntaxe (viz obrázek níže), extrakci entit, analýzu sentimentu a klasifikaci obsahu v 10 jazycích. Jazyk můžete určit, pokud ho znáte; jinak se API pokusí automaticky detekovat jazyk. Samostatné API, které je v současné době k dispozici pro včasný přístup na vyžádání, se specializuje na obsah související se zdravotní péčí.

Přečtěte si celou recenzi rozhraní Google Cloud Machine Learning API

Překlad

Rozhraní Google Cloud Translation API dokáže přeložit více než sto jazykových párů, může automaticky detekovat zdrojový jazyk, pokud jej nezadáte, a má tři varianty: základní, pokročilý a mediální překlad. Rozhraní Advanced Translation API podporuje glosář, dávkový překlad a použití vlastních modelů. Rozhraní Basic Translation API je v podstatě to, co používá spotřebitelské rozhraní Google Translate. AutoML Translation vám umožňuje trénovat vlastní modely pomocí přenosu učení.

Rozhraní Media Translation API překládá obsah přímo ze zvuku (řeči), buď zvukových souborů nebo streamů, ve 12 jazycích a automaticky generuje interpunkci. Existují samostatné modely pro video a audio hovory.

Přečtěte si celou recenzi rozhraní Google Cloud Machine Learning API

$config[zx-auto] not found$config[zx-overlay] not found