Magazín · Novinky · v pondělí 8. 4. 2024 19:18
OpenAI a Google čelí otázkám o trénování AI na datech z YouTube
Společnost OpenAI údajně použila svůj nástroj na rozpoznávání řeči, Whisper, k přepsání více než milionu hodin YouTube videí pro trénink svého modelu GPT-4, zatímco Google byl obviněn z trénování svých AI modelů na YouTube videích bez akce proti tomu, i když interně věděl o této praxi.
To přichází navzdory pravidlům Google, které zakazují neautorizované stahování obsahu z YouTube, a odhalení je v rozporu s nedávným prohlášením CEO YouTube o politikách platformy ohledně používání jejího obsahu.
Dále se uvádí, že Google v červnu 2023 požádal svůj tým, aby upravil zásady ochrany soukromí, aby lépe odrážely využití veřejně dostupného obsahu, včetně Google Docs a Google Sheets, pro trénink svých AI modelů. Změny byly učiněny údajně pro lepší srozumitelnost a byly zveřejněny v červenci, přičemž Google tvrdí, že tato data používá pouze se souhlasem uživatelů, kteří se zapojili do testování experimentálních funkcí firmy.
Otázky o etice a soukromí v kontextu trénování AI modelů zůstávají nezodpovězené, zatímco technologické giganty jako Google a OpenAI jsou pod lupou kvůli svým metodám shromažďování dat.
Zdroj: Greg Bulla / UnsplashGoogle nově spoléhá na jadernou energii