Éra hlasového vyhledávání a hlasem ovládaného softwaru je na nás. Jako vývojář žiji a umírám na klávesnici, ale už vidím znamení: Jako mnoho lidí například mluvím se svým telefonem s Androidem (například „Navigate to Lowes [or Starbucks or Harris Teeter]“) to dostat směr.
Ve zprávě Mary Meeker z roku 2016 Internet Trends Report uvádí, že vyhledávací dotazy Google Voice vzrostly od roku 2010 sedmkrát. Také jsem si všiml, že můj dvanáctiletý syn provádí téměř všechna vyhledávání pomocí hlasu - a můj přítelkyně mi takto píše pravidelně. Společnost, pro kterou pracuji, Lucidworks, také nedávno oznámila nové partnerství s IBM za účelem integrace funkcí Watson a převodu textu na řeč do našeho produktu podnikového vyhledávání.
Tato technologie funguje mnohem lépe než dříve a je snazší ji integrovat do aplikací. Pokud vyvíjíte pro Android nebo iOS, můžete se snadno připojit k API pro rozpoznávání řeči. Rozpoznávání řeči však nezačíná a nekončí jednoduchými řečovými příkazy a hlasovými příkazy.
Pochopení záměru hledání je velmi kontextuální úkol, zejména s mluveným jazykem. Lidé navíc mají tendenci používat více slov v přirozeném mluveném jazyce, než když jsou konfrontováni s vyhledávací lištou. V mluveném jazyce je více „šumových slov“ než v běžném textovém vyhledávání.
To jsou významné výzvy AI. Ale jak překonáme kontextový problém, vývojáři se naučí, že s hlasem lze udělat více než s textem. Role bude hrát emoční kontext. Pokud hledáte čerpací stanici, chcete nejlevnější nebo nejbližší? To by mohl naznačovat emotivní obsah vašeho hlasu. Jistě, možná objasníte, ale možná nebudete muset.
Vaše upovídaná budoucnost
Hlasová epocha není o samotném hledání. Ovlivní to celý způsob naší interakce s počítači. V nepříliš vzdálené budoucnosti budou klávesnice považovány za „kuriózní“, jak je Scotty skvěle popsal ve „Star Treku IV.“
Ale tento posun vyžaduje také zcela nové uživatelské rozhraní. Zde je starodávná ilustrace toho, co mám na mysli: Když vyšel Windows 95, IBM integrovala do svých počítačů hlasové příkazy. V té době jsem pracoval jako prodejce v Office Depot a rychle se ukázalo, jak nepraktické jsou hlasové příkazy. Okno rozhraní se k této formě interakce vůbec nehodilo.
Chci říct, jak sakra přesunete okno z cesty jinému oknu a změníte jeho velikost, aby se na obrazovku efektivně vešly hlasovými příkazy? Ty ne. Ty okna (a pravděpodobně Windows) úplně vypustíš. Hlasové uživatelské rozhraní nepoužívá stejné motivy. Na „Star Treku“ nikdy nevidíte okno.
Když už mluvíme o „Star Treku“, když lidé začnou kódovat nebo dělat něco technického, vždy přepnou na hmatové rozhraní (OK, ne úplně hmatové - vypadá to spíš jako mikrovlnná klávesnice překrytá secesními vykresleními desky s plošnými spoji). Je ale nutná regrese „psaní na stroji“? Je pravda, že si neumím představit použití hlasového rozhraní ke kódování ve Scale. Možná budou vyvinuty nové jazyky (bez závorek, na rozdíl od Scaly - a mých článků), které jsou speciálně přizpůsobeny hlasu.
Webové stránky určitě nevypadají stejně a nabídnou nová paradigmata navigace. Řeknete „ukážte mi nabídky na boty“ a to, co dostanete zpět, bude pravděpodobně lépe organizované a kontextově citlivější než váš průměrný web („nabídky“ a „boty“). Navíc nebudu chtít hodně rolovat nebo říkat „další stránka“, takže interakce budou muset být přizpůsobeny. Systém by už měl vědět, že chci pánské boty a nechci boty na podpatcích kvůli mé achillově tendonitidě. Možná ví, že mám raději tmavé barvy. Možná jsem to řekl nebo možná to analyzovalo mé chování.
Je to vůbec web? Jistě, když nakupuji boty, budu chtít vizuální znázornění, ale když mluvím, možná stroj mluví zpět. Možná mi to ukazuje boty, pak se zeptá: „Hledáte konkrétní druh obuvi? K čemu jsou tyto boty? Nosíte je na turistiku nebo na večírek?“
Éra hlasového vyhledávání změní vše od interakce se stroji po způsob kódování. Mnoho z technologií, které potřebujeme, je nám již dnes k dispozici, zatímco jiné teprve budou vynalezeny. Účinek na uživatelská rozhraní by mohl být hlubší než přechod z děrných štítků na klávesnice.
Tato rozsáhlá změna nepřijde najednou. Dnes není den, kdy byste měli odhodit klávesnici. Může to však být den, kdy začnete přemýšlet o přepracování vašeho webu tak, aby byl skutečně hlasově přístupný.