U příležitosti nedávného Globálního dne povědomí o přístupnosti (GAAD), během něhož technologické společnosti tradičně prezentují své novinky v oblasti zpřístupnění digitálních technologií, oznámila společnost Google významná vylepšení pro svůj operační systém Android.

Jedním z klíčových oznámení je zdokonalení integrované čtečky obrazovky TalkBack. Díky integraci jednoho z jazykových modelů Gemini dokáže tato funkce nově analyzovat a slovně popisovat obrázky zobrazené na displeji telefonu, a to i v případech, kdy snímky postrádají jakýkoli alternativní text, který by jejich obsah přibližoval. Uživatelé tak mohou například modelu Gemini klást doplňující otázky k fotografii.

Druhou významnou novinkou, kterou Google představil, je vylepšená verze funkce Expressive Captions. Tato funkce, jejíž první verze byla ohlášena koncem loňského roku, generuje v reálném čase titulky, které se snaží zachytit nejen samotná slova, ale i emocionální náboj mluveného projevu. Pokud například někdo během videohovoru otráveně zabručí v reakci na nepovedený vtip, telefon do transkripce kromě slov zahrne i textovou poznámku typu "[zabručení]".

Nová verze těchto titulků má být v tomto ohledu ještě pokročilejší a dokáže v titulcích reflektovat například i protažení slov, čímž lépe zprostředkuje dynamiku řeči.

Společnost Google naznačila, že podobný přístup založený na pokročilé AI plánuje v budoucnu využít i pro další vylepšení svých služeb a pro boj proti různým formám online podvodů.