JohanP/johanlora02 · Sharing info: XTTS

Nov 10, 2024

I have compared lots of Text-To-Speech on HuggingFace and XTTS is a good one:

It handles French
It can clone a voice (even a foreign one)
The quality is quite good
The demo has unlimited usage

However:

You can't prompt emotions or background
You lose the voice id when you clone a foreign voice
The demo is limited to 200 characters

It exists on Pinokio. Beware! Despite the spaces say it runs on xtts_v2, it's running on xtts_v1. If you want to use xtts_v2, you can use xtts_v2 on fal.ai. xtts_v1 is good but xtts_v2 seems to be better.

See you next time on YT 🙂

Fabrice-TIERCELIN

Nov 20, 2024

Dans ta dernière vidéo, tu as coché v3.5 au lieu de v4 :(

https://www.youtube.com/watch?v=O_ORALKi8gs

JohanP

Owner Mar 18

•

edited Mar 18

@Fabrice-TIERCELIN Je viens de voir tes messages, un peu tard... Merci tout de même et bien à toi !

Fabrice-TIERCELIN

Mar 18

As-tu jeté un œil à Hunyuan3D 2.0, @JohanP ? Ça marche beaucoup mieux que Trellis ou Stable Fast 3D. Les personnages peuvent maintenant servir au second plan.

Désolé si tu l'as déjà présenté ^^ Sinon, fais gaffe aux quotas et n'utilise pas trop l'outil avant une démo. Cocktailpeanut ne semble pas l'avoir adapté pour Pinokio.

Fabrice-TIERCELIN

5 days ago

TripoSG semble encore mieux modéliser en 3D (ne pas confondre avec TripoSR). Ma petite astuce:

Modéliser le modèle entier
Recadrer un détail de l'image (comme le visage d'un personnage)
Modéliser le détail
Assembler dans un logiciel 3D les deux modèles obtenus
Répéter depuis l'étape 2 pour chaque autre détail important