Ook Meta doet zijn best om met AI nieuwe tools te bieden. EN zoals je weet zijn AI's meestal gebaseerd op LLM's of Large Language Modellen . Meta echter heeft nu een MMS model uitgebracht, of een Massively Mltilingual Speech model in open source licentie. Dit model kan mer dan 4.000 gesproken talen herkennen, en tekst-naar-spraak stemmen creëren voor 1.100 daarvan.
Het opvallende daarbij is dat voor de meeste van die talen Meta niet de duizenden uren aan data nodig had die gewoonlijk vereist ois voor spraakherkenning en voor tekst-naar-spraak. Het is de AI die dit mogelijk maakte;
Nog een opmerkelijk feit: Meta maakte gebruik van verschillende religieuze teksten, gewoon omdat die in veel meer talen zijn vertaald en opgenomen dan andere teksten.
Deze aanpak verschilt toch wel van de Large Language Modellen die o.a. bij OpenAI gebruikt worden, en Meta waarschuwt dat de modellen niet perfect zijn, maar dat het die nu al in open source wil vrijgeven, om het publiek aan te moedigen ermee te werken en fouten te melden, zodat het MMS model verbeterd kan worden.
https://www.engadget.com/metas-open-source-speech-ai-recogni ...
|