Programování

Smysl pro strategii databáze grafů společnosti Microsoft

Trvalo to nějakou dobu, ale nákup společnosti LinkedIn za 26 miliard dolarů konečně začíná ukazovat některé zajímavé výsledky, přičemž data z LinkedIn se začínají zobrazovat v nástrojích, jako je Outlook. Jedná se o první známku společnosti Microsoft využívající graf vztahů sociální sítě, což je komplexní soubor dat, který byl důvodem jedné z největších akvizic společnosti Microsoft v Silicon Valley.

Sociální síť jako LinkedIn není pod kapotou ničím jiným než obrovskou databází grafů NoSQL, která ke správě polostrukturovaných dat používá přístup bez schémat. Každý uzel v grafu je jednotlivec se všemi jeho profilovými údaji. Každý uzel je propojen s ostatními, desítky nebo stovky pro lidi s několika spojeními, tisíce pro vysoce propojené jednotlivce. Dotazy procházejí těmito spojeními a umožňují vám najít všechny lidi, které znáte při práci na AI, nebo kteří sídlí v Ontariu, nebo kteří dříve pracovali na LinkedIn.

Grafové databáze všude: Microsoft Graph, Common Data Service, Cosmos DB a Security Graph

Zájem společnosti Microsoft o data založená na grafech je jasná. Generální ředitelka Satya Nadella popsala rozhraní API Office 365, základ toho, co se nyní nazývá Microsoft Graph, jako „nejdůležitější“ sázku společnosti. Je to určitě velmi mocný nástroj a jeho otevření všem umožňuje organizacím prozkoumat, jak se vyvíjejí jejich interní týmy a jak jsou firemní znalosti ukládány v dokumentech a konverzacích - spolu s nástroji, které tyto informace zpřístupňují a zpřístupňují.

V aplikaci Microsoft Graph je spousta dat s nástroji jak pro informace pro spotřebitele, tak pro obchodní informace. Prvky přidružené k účtům Microsoft, jako je nový Stream aktivit a Graf zařízení, jsou základem pro funkce roamingu zařízení, jako jsou nástroje Pokračovat na mém počítači, které byly nedávno vydány pro iOS a Android (podobně jako schopnost předávání účtů Apple iCloud v systému iOS) „a který společnost Microsoft doporučuje vývojářům platformy Universal Window Platform (UWP) zabudovat do svého kódu jako součást projektu Rome a připravované funkce Windows Timeline.

Microsoft Graph a LinkedIn však nejsou jedinými grafy společnosti Microsoft s API:

  • Dynamics 365 má Common Data Service, způsob popisu standardních položek v podnikání. Díky Common Data Service můžete rozšířit standardní schéma o svůj model zákazníka nebo o vaše produkty.
  • Pak je tu cloudová Cosmos DB, která staví na databázi dokumentů JSON s různými sadami API, včetně jedné pro vývoj a správu vlastních databází grafů ve velkém.
  • I když to není úplně veřejné, Microsoft Security Graph se používá k hodnocení a správě hrozeb vystavených vašim aplikacím prostřednictvím nástrojů, jako je funkce podmíněného přístupu Azure Active Directory.

Jiný přístup společnosti Microsoft: Dotazování na více grafů

Zajímavé je použití dotazů na grafy napříč několika grafy a jejich použití k získání přehledů, které mohou pomoci řídit obchodní rozhodnutí. Často jsem hovořil o myšlence „informací ve správný čas“: správné informace ve správný čas dodávané správným lidem, aby mohli správně rozhodovat o správném výsledku podnikání. Možnost dotazovat se na hrany grafu, nikoli na uzlu, vám umožní pochopit vztahy mezi položkami, což je klíčový faktor při poskytování typu informační podpory, kterou moderní obchodní potřeby potřebuje.

Podporou více grafů nabízí společnost Microsoft alternativu k tradičním nástrojům podpory rozhodování založeným na databázi. Smícháním interních zaměstnanců a dat dokumentů v Microsoft Graph, externích vztahů prostřednictvím LinkedIn, základních obchodních informací ve službě Dynamics 365 Common Data Service a vlastního schématu v cloudu hostované Cosmos DB můžete provádět složité křížové dotazy zaměřené na než jednotlivé uzly v těchto grafech, ale také na vazbách mezi uzly. To vám umožní pracovat s mnohem složitějšími vztahy, než jaké jsou vystaveny v relačních databázích.

Jedním ze způsobů, jak to odhalit, je nový nástroj Bing pro firmy, který přidává informace z podnikové služby Active Directory a dalších zdrojů do vyhledávání Bingu, když je uživatel přihlášen k účtu Azure Active Directory. Výsledky se dynamicky generují z dotazů aplikace Microsoft Graph, které vracejí podrobnosti například o tom, kde je někdo v organizačním diagramu, spolu se souvisejícím obsahem z širšího webu a z dokumentů, které interně sdílí.

Je to jiný způsob, jak odhalit informace, které byly k dispozici v nástroji Microsoft Delve, a převzít je z aplikace, kterou bylo nutné spustit, než budete moci zadat dotaz do prohlížeče, který je vždy otevřený. Jako odvětví jsme zapracovali hledání do prohlížeče, takže je logické, aby se stal jedním z nástrojů, které používáme k prozkoumání grafů, které jsou základem našeho podnikání.

Počáteční vydání Bing pro firmy se zaměřuje na Microsoft Graph, spolu s nástroji, které umožňují správcům přidávat konkrétní intranetové odkazy pro konkrétní dotazy. Když tedy hledáte aktuální zásady výdajů, budete přesměrováni na příslušné samoobslužné nástroje. Budoucí vydání přinesou více grafů společnosti Microsoft, uzamknou vyhledávání na základě funkce podmíněného přístupu a odhalí externí vztahy prostřednictvím LinkedIn.

Chyba grafů Microsoftu: Používají různé gramatiky dotazů

Přestože celková vize různých vlastností společnosti Microsoft založených na grafech začíná být jasná, stále existují problémy s dotazováním z více zdrojů. Ačkoli všechny nabízejí rozhraní REST API, základní jazyky dotazů se mohou lišit. Například Microsoft Graph používá ve svých API vlastní gramatiku dotazů, zatímco CosmosDB staví na široce používaném dotazovacím jazyce grafů Apache Gremlin.

Dotazy založené na API bývají relativně jednoduché a zaměřují se na konkrétní vyhledávání. Složitější dotazy mají tendenci být zpracovány pomocí jazyků specifických pro doménu, jako je Gremlin, které jsou navrženy pro použití s ​​databázemi grafů. Jednou z nejzajímavějších funkcí Gremlin je jeho schopnost generovat nové mapy ze základních dat, která můžete analyzovat a používat ve svých aplikacích. Gremlin také zvládne porovnávání vzorů a také práci s rozsáhlými nástroji pro analýzu dat, jako je Hadoop; takže jej můžete použít k doručování dotazů z nástroje pro velké objemy dat HDInsight Azure vedle vašich grafů hostovaných v Cosmos DB.

Pokud chceme získat výhody všech různých vlastností grafů Microsoftu, budeme potřebovat společnou platformu dotazů, která může přijímat dotazy a rozdávat je napříč různými zdroji, asynchronně zpracovávat odpovědi a zajistit, aby byly dotazy vhodně konstruovány tak, aby cílit na konkrétní API.

Mohli byste vytvořit svůj vlastní multigrafický dotazovací stroj, ale toto je opravdu něco, co Microsoft potřebuje dodat, možná jako služba Azure. Tímto způsobem jej lze integrovat se stávajícími předplatnými a se známými metodami ověřování, ať už pro uživatele, nebo pro aplikace.

$config[zx-auto] not found$config[zx-overlay] not found