Sharing info: XTTS

#1
by Fabrice-TIERCELIN - opened

Hi @JohanP ,

I have compared lots of Text-To-Speech on HuggingFace and XTTS is a good one:

  • It handles French
  • It can clone a voice (even a foreign one)
  • The quality is quite good
  • The demo has unlimited usage

However:

  • You can't prompt emotions or background
  • You lose the voice id when you clone a foreign voice
  • The demo is limited to 200 characters

It exists on Pinokio. Beware! Despite the spaces say it runs on xtts_v2, it's running on xtts_v1. If you want to use xtts_v2, you can use xtts_v2 on fal.ai. xtts_v1 is good but xtts_v2 seems to be better.

See you next time on YT 🙂

Dans ta dernière vidéo, tu as coché v3.5 au lieu de v4 :(

https://www.youtube.com/watch?v=O_ORALKi8gs

@Fabrice-TIERCELIN Je viens de voir tes messages, un peu tard... Merci tout de même et bien à toi !

As-tu jeté un œil à Hunyuan3D 2.0, @JohanP ? Ça marche beaucoup mieux que Trellis ou Stable Fast 3D. Les personnages peuvent maintenant servir au second plan.

Désolé si tu l'as déjà présenté ^^ Sinon, fais gaffe aux quotas et n'utilise pas trop l'outil avant une démo. Cocktailpeanut ne semble pas l'avoir adapté pour Pinokio.

TripoSG semble encore mieux modéliser en 3D (ne pas confondre avec TripoSR). Ma petite astuce:

  1. Modéliser le modèle entier
  2. Recadrer un détail de l'image (comme le visage d'un personnage)
  3. Modéliser le détail
  4. Assembler dans un logiciel 3D les deux modèles obtenus
  5. Répéter depuis l'étape 2 pour chaque autre détail important

Sign up or log in to comment