Společnost OpenAI údajně použila svůj nástroj na rozpoznávání řeči, Whisper, k přepsání více než milionu hodin YouTube videí pro trénink svého modelu GPT-4, zatímco Google byl obviněn z trénování svých AI modelů na YouTube videích bez akce proti tomu, i když interně věděl o této praxi.

To přichází navzdory pravidlům Google, které zakazují neautorizované stahování obsahu z YouTube, a odhalení je v rozporu s nedávným prohlášením CEO YouTube o politikách platformy ohledně používání jejího obsahu.

Dále se uvádí, že Google v červnu 2023 požádal svůj tým, aby upravil zásady ochrany soukromí, aby lépe odrážely využití veřejně dostupného obsahu, včetně Google Docs a Google Sheets, pro trénink svých AI modelů. Změny byly učiněny údajně pro lepší srozumitelnost a byly zveřejněny v červenci, přičemž Google tvrdí, že tato data používá pouze se souhlasem uživatelů, kteří se zapojili do testování experimentálních funkcí firmy.

Otázky o etice a soukromí v kontextu trénování AI modelů zůstávají nezodpovězené, zatímco technologické giganty jako Google a OpenAI jsou pod lupou kvůli svým metodám shromažďování dat.