Mimořádná zpráva

Čeština má mezi jazyky Googlu unikátní postavení

LP Fish
16. 11. 2011 9:00
Šéf mapového týmu Googlu v Curychu Jaroslav Bengl je zodpovědný i za lokalizaci hlasových služeb v ČR. Podle něj klávesnici ještě zahazovat nemáme, ale hlasovým službám dává Google zelenou.
Foto: Aktuálně.cz

Ovládání hlasem je v kurzu. Rozpoznávání řeči se věnuje jak Apple, který se pyšní inteligentní asistentkou Siri, tak Google s hlasovým vyhledávání či překladačem.

Google nedávno do své centrály v Kalifornii povolal britského experta Davida Burkeho, který se na rozpoznávání řeči specializuje. Má se zaměřit na co nejdokonalejší využití tohoto současného fenoménu u telefonů na platformě Android.

Za jak dlouho se dočkáme pokročilých hlasových funkcí v češtině? A jak rozvoj ovlivňuje masové rozšíření mobilních telefonů? O tom Datarama mluvila s šéfem mezinárodního mapového týmu Googlu v Curychu Jaroslavem Benglem, který odpovídá i za lokalizaci hlasových služeb v České republice.

Datarama: Dá se srovnávat to, co dělá s hlasovými službami Google, a čím se zabývá Apple?

Jaroslav Bengl: Pokud bych srovnal to, na čem pracují u Applu, a to, co funguje na telefonech s Androidem, pak náš systém tzv. "voice actions" (fungujících jen v angličtině) je o něco jednodušší. Telefon je však možné ovládat jednoduššími, i když překvapivě účinnými  příkazy. Takže můžu telefonu říct, na kdy mi má nastavit budík, co mi má pustit za muziku, kam mě má odnavigovat. Nesnaží se odpovědět na otázku, ale snaží se porozumět příkazům. Důležité u nás také je, aby na druhé straně byl Google, protože dokáže zodpovědět velké spektrum otázek a zpátky můžu dostat spoustu informací. Ať se ptám na předpověď počasí, na kurzy měn, nebo ať hledám restaurace v okolí.

Takže se zaměřujete především na vyhledávání?

Vyhledávání bylo pro Google v ohledu hlasových mobilních služeb vždy primární. Takže nás i v oblasti hlasových služeb zajímaly třeba problémy, jak uživatelům zjednodušit zadání dotazu. Google skutečně věří, že hlasové vyhledávání má velkou budoucnost, a proto se je snaží lokalizovat do více jazyků. Mimochodem - desátým jazykem hlasového vyhledávání Googlu se stala čeština.

A hodláte portfolio hlasových služeb rozšiřovat? Třeba na kancelářskou oblast?

Portfolio věcí, ke kterým bude možný přístup hlasovým ovládáním, se zcela jistě bude rozšiřovat. Jestli ale bude možné nadiktovat e-mail, si nejsem úplně jistý. Spolehlivost toho, co program dělá, jde totiž vyladit na poměrně velkou míru u jednoduchých příkazů. Čím delší je text, který musí program zpracovat, tím víc cítíte, že na to, aby to fungovalo v různých jazycích, musí program rozumět také gramatice, čárkám ve větě a všem těmhle problémům. Prostě přidáváte další jednu komplexitu, která navíc rozumí danému jazykovému modelu. Napsat jednoduchou esemesku jako "zavolám později, teď nemohu" bychom zvládli, ale napsat firemní dopis, který má mít nějakou "štábní" úroveň? To zatím funguje možná v angličtině. Aby to bylo možné v češtině a řadě jiných jazycích, to myslím bude ještě chvíli trvat.

Jak v Googlu vzniklo to poměrně unikátní postavení češtiny? A jak dlouho vlastně trvá, upravit službu pro nějaký menší jazyk?

Lokalizace do různých jazyků se stanovuje podle toho, jak jsou používané. Česká republika ale měla možnost dostat některé věci přednostně. Lidé z českého Googlu také byli ochotní s tím pomáhat a zúčastnit se testování. V ČR je velmi konkurenční trh a pro nás je samozřejmě zajímavé přijít pro české uživatele s něčím novým. Určitě to vypovídá o dobrém postavení České republiky v rámci Googlu. Co se týká doby lokalizace do malých jazyků, tak záleží na jejich složitosti. U češtiny to byly dva až tři měsíce práce inženýrského týmu. Vedle toho jsme ale ještě museli nasbírat jazykové vzorky. Aby program fungoval co nejideálněji, je potřeba sesbírat ukázky z různých situací, od různých lidí, v různých prostředích: jede autem, jede tramvají, je na nádraží, je v tiché místnosti. Systém musí dostat úvodní balík vzorků, u kterých ví, co na nich bylo řečeno, a může se všechno naučit. Musíte dosáhnout nějaké úrovně, aby bylo příjemné službu používat. Je jasné, že někdy vám to neporozumí, ale kdyby se to stalo ve dvou případech ze tří, tak vás to po chvíli experimentování přestane bavit.

A když program vydáte, učí se dál od uživatelů?

Přesně tak. My dosáhneme určité úrovně, ale pak se ten systém používáním pořád zlepšuje. Čím víc lidí systém používá, tím víc vzorků hlasů z různých prostředí dostává a postupně se dál zdokonaluje a zlepšuje.

Čeština byla také mezi jazyky, které byly zařazeny do tzv. konverzačního módu Překladače Google. Do jaké míry jste spokojení s tím, jak funguje?

Pracuje na bázi statistického překladače. Překládá slova a když zná, jak se některé věci překládají na úrovni fráze, tak to samozřejmě taky přeloží. Překladač se učí z celého internetu, ze všech možných spárovaných textů. Když existuje nějaké ustálené spojení, tak ho najde. Je ale samozřejmě problém poznat, jaké překlady na internetu jsou opravdu dobré. Proto do toho může vstoupit člověk, který může říct: Takhle ne! Může vysvětlit, že takhle by se to překládat nemělo, a systém se učí i od něj. Podle mě překladač dává lidem možnost udělat si základní představu o tom, co nějaký text v jazyce, který vůbec neznají, znamená. Na to, aby si v takto člověk četl poezii, si ale ještě chvíli počkáme.

A je vůbec možné, aby se systém naučil překládat tak dobře?

Já bych neříkal nikdy nikdy. Před deseti lety by se i tohle zdálo jako utopie. Mobilní telefon všechno strašně zrychlil.

Možná spíš internet v něm...

A hlavně to, co můžete dneska díky internetu s mobilem udělat. Můžete s ním vyfotit obrázek, dát ho na internet a on vám řekne, co na něm je. A co se týká mého hlavního oboru - map - je neuvěřitelné, jak jejich dostupnost mění návyky lidí. Už loni jsme měli několik dnů, kdy byl přístup na mapy větší z mobilních telefonů, než z klasických prohlížečů. A dneska jsme v situaci, kdy víc než 50 procent objemu lidí , kteří v České republice koukají na mapy Googlu, přijde z mobilních telefonů. Celosvětově má Google na mobilních mapách kolem 200 milionů uživatelů. Ale aktivací telefonů s Androidem je celosvětově denně přes 500 000, takže by to mělo i růst. Před deseti lety, když byl člověk "geek", tak měl program, který uměl naplánovat trasu na mapě, vytiskli jsme to a teprve se jelo. Dneska člověk jede, řekne kam chce, a ani nemusím říct přesnou adresu a ono to dohledá.

Takže prognóza na dalších deset let?

No hlavně se musí vyřešit životnost baterek a datový roaming. Jinak snad všechno půjde dobře.

TIP: Líbí se vám naše články? Sledujte Dataramu na Facebooku, na Google+ nebo na Twitteru!

 

Právě se děje

Další zprávy