---
datasets:
- Porameht/processed-voice-th-169k
language:
- th
pipeline_tag: text-to-speech
base_model:
- SWivid/F5-TTS
license: cc0-1.0
---
#### F5-TTS-THAI
โมเดลหลัก : [SWivid/F5-TTS](https://huggingface.co/SWivid/F5-TTS)
Github : https://github.com/SWivid/F5-TTS
ชุดข้อมูลที่นำไปเทรน
- [Porameht/processed-voice-th-169k](https://huggingface.co/datasets/Porameht/processed-voice-th-169k)
- [Common Voice](https://commonvoice.mozilla.org/)
- จำนวน
- 200,000 เสียง
- ภาษาไทย ประมาณ 190 ชั่วโมง
- ภาษาอังกฤษ ประมาณ 40 ชัวโมง
- ขนาดโมเดลล่าสุด
- 600,000 Steps
- ภาษาที่รองรับ: ไทย และ อังกฤษ.
- การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
### การใช้งาน
Github : https://github.com/VYNCX/F5-TTS-THAI
```sh
git clone https://github.com/VYNCX/F5-TTS-THAI.git
cd F5-TTS-THAI
python -m venv venv
call venv/scripts/activate
pip install git+https://github.com/VYNCX/F5-TTS-THAI.git
#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.3.0+cu118 torchaudio==2.3.0+cu118 --extra-index-url https://download.pytorch.org/whl/cu118
```
สามารถรันไฟล์ `app-webui.bat` เพื่อใช้งานได้ หรือ
```sh
python src/f5_tts/f5_tts_webui.py
```
### ฝึกอบรม และ Finetune
ใช้งานบน Google Colab [Finetune](https://colab.research.google.com/drive/1jwzw4Jn1qF8-F0o3TND68hLHdIqqgYEe?usp=sharing) หรือ
- ติดตั้ง
```sh
cd F5-TTS-THAI
pip install -e .
```
- เปิด Gradio
```sh
f5-tts_finetune-gradio
```
### ตัวอย่างเสียง
- เสียงต้นแบบ
- ข้อความคำพูด : ฉันเดินทางไปเที่ยวที่จังหวัดเชียงใหม่ในช่วงฤดูหนาวเพื่อสัมผัสอากาศเย็นสบาย
- เสียงที่สร้างขึ้น
- Seed : 4213936761049775187
- ภาษาอังกฤษกับคำภาษาไทย
- เสียงต้นแบบ
- ข้อความคำพูด : When there is not enough fuel pressure, the engine may not start.
- เสียงที่สร้างขึ้น
- ข้อความ : Today I went to the market and bought some "ข้าวเหนียวหมูปิ้ง" before heading to the park for a picnic.