De Canadese start-up MyShell heeft via X aangekondigd dat het een open source voice klone programma lanceert: OpenVoice. Dat werd ontwikkeld in samenwerking met wetenschappers van MIT en de Tsinghua Universiteit van Beijing.
Wat OpenVoice kan? Wel je kan een stem (die van jezelf bijvoorbeeld) klonen, en daarna het ritme ervan bepalen, de emotionele toon, pauzes, de intonatie. En de tool heeft slechts enkele seconden van de originele stem nodig, om te trainen.
Volgens een paper bij Arxiv.org zou het text-to-speech model getraind zijn op 30.000 zinnen van mensen die Engels, Chinees of Japans spreken. De functie om de toon van de spraak te beheren, zou getraind zijn op 300.000 stalen van meer dan 20.000 verschillende sprekers.
Wil je het uittesten? Dat kan, via MyShell en HuggingFace. Meer bij Venturebeat.
https://venturebeat.com/ai/open-source-ai-voice-cloning-arri ...
|