Pronuncia errada

#9
by nerdilord - opened

Opa, com vai, estou com um problema, de cada 5 frases que coloco para falar em portguês, duas a ia pula uma palavra ou fala embolado, como posso corrigir isso ?

Tente usar um audio de ref de 6 a 8s
Use o safetensors em vez do pt, que ocupa menos espaço na memória.

minha amotra tem 8 segundo de fala mais 1 segundo de silencio, vou reduzir ela mais um pouco, obrigado, eu tambem já estava usando o saferensors, so substituir o da versão em ingles pelo da português, vou fazer um novo teste com a amostra obrigado

Olá! 😁
Primeiramente parabéns pela iniciativa.
Sobre erros de pronúncia, fiz o teste com os dois modelos que atualmente existem para língua portuguesa do Brasil, esse e o outro do link abaixo:
https://huggingface.co/ModelsLab/F5-tts-brazilian/discussions/1
Fiz usando o Pinokio, que para quem não conhece é um browser que executa scripts de IA localmente na máquina, sendo o F5tts um deles. Percebi que esse acabou se saindo melhor do que o ModelsLab/F5-tts-brazilian. Testei tanto com a versão full (pt) quanto com a versão que usa menos memória (safetensors). Não notei muita diferença entre os dois, somente em relação ao outro modelo.
Sei que tudo isso é bem preliminar, mas fico feliz de saber que já existe a possibilidade. Como em tudo na tecnologia, é mesmo uma questão de tempo. Logo logo vamos conseguir chegar próximo do resultado obtido com o Hailuo! 😍
OBS: Meu notebook não tem GPU dedicada, então fiz os testes em CPU mesmo. Demora, mas é o que temos por aqui.
Abraço e continue firme com o projeto! 🤗

Olá! 😁
Primeiramente parabéns pela iniciativa.
Sobre erros de pronúncia, fiz o teste com os dois modelos que atualmente existem para língua portuguesa do Brasil, esse e o outro do link abaixo:
https://huggingface.co/ModelsLab/F5-tts-brazilian/discussions/1
Fiz usando o Pinokio, que para quem não conhece é um browser que executa scripts de IA localmente na máquina, sendo o F5tts um deles. Percebi que esse acabou se saindo melhor do que o ModelsLab/F5-tts-brazilian. Testei tanto com a versão full (pt) quanto com a versão que usa menos memória (safetensors). Não notei muita diferença entre os dois, somente em relação ao outro modelo.
Sei que tudo isso é bem preliminar, mas fico feliz de saber que já existe a possibilidade. Como em tudo na tecnologia, é mesmo uma questão de tempo. Logo logo vamos conseguir chegar próximo do resultado obtido com o Hailuo! 😍
OBS: Meu notebook não tem GPU dedicada, então fiz os testes em CPU mesmo. Demora, mas é o que temos por aqui.
Abraço e continue firme com o projeto! 🤗

Opa irmão tudo certo? Cara queria muito saber como instalar esse modelo no Pinokio, já tentei de tudo nada funciona mano, Se você pudesse me ajudar me salvaria muito! Tô igual doido atrás de uma solução pra isso, sou leigo nessa questão

Sign up or log in to comment