Meta v úterý představila model umělé inteligence SeamlessM4T. Ten dokáže překládat mezi až stovkou jazyků, a to jak v psané, tak v mluvené podobě. Cílem je podle společnosti pomoct v komunikaci lidem, kteří mluví rozdílnými jazyky. Společnost je v přístupu k umělé inteligenci otevřená, a tak bude i SeamlessM4T dostupný pod licencí pro výzkum (CC BY-NC 4.0).

Meta zveřejnila i obrovský dataset SeamlessAlign s přeloženým obsahem. Jde podle společnosti o „dosud největší otevřený dataset multimodálních překladových dat s celkovým počtem 270 000 hodin přeložené řeči a textu“. Tato data by v budoucnu mohla umožnit vytvoření sofistikovaných překladačů i výzkumníkům mimo Metu.

Novou umělou inteligenci Meta přirovnala k Babylónské rybce známé ze Stopařova průvodce po Galaxii, která po přiložení k uchu dokázala v reálném čase přeložit kterýkoliv jazyk. Stovka jazyků je i podle společnosti pro takovou rybku málo, jde podle ní ale o důležitý krok k systému, který by se jí v budoucnu mohl vyrovnat.

Model je na rozdíl od předešlých pokusů Mety jen jeden. Jinými slovy se SeamlessM4T neskládá z vícero za sebou postavených modelů (na rozdíl od zvukového AudioCraftu), čímž se snižuje jeho chybovost. Nejde určitě o jediný pokročilý překladač, ukazuje ale, jak daleko jsme v tomto směru za pár let ušli.