VocalNet
/

VocalNet-1B

SandO114 commited on 8 days ago

Commit

6b57937

verified ·

1 Parent(s): da5342f

Upload folder using huggingface_hub

Files changed (1) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/nas_works/467836/checkpoints/llama32-va432k-ep1-lora-va430k-ultrachat-ep1-lora",
   "architectures": [
     "OmniSpeech2SLlamaForCausalLM"
   ],
@@ -48,12 +48,12 @@
   "rope_theta": 500000.0,
   "special_tokens": 4,
   "speech_bos_token_id": 6561,
-  "speech_encoder": "/nas_works/467836/whisper",
   "speech_encoder_ds_rate": 5,
   "speech_encoder_hidden_size": 1280,
   "speech_encoder_type": "whisper",
   "speech_eos_token_id": 6563,
-  "speech_generator_config": "/ossfs/workspace/OraFlow/scripts/ar_mtp/ar_config_mtp5_1b.yaml",
   "speech_generator_type": "ar_mtp_v4",
   "speech_max_position_embeddings": 2048,
   "speech_padding_token_id": 6564,

 {
+  "_name_or_path": "./checkpoints/VocalNet-1B",
   "architectures": [
     "OmniSpeech2SLlamaForCausalLM"
   ],
   "rope_theta": 500000.0,
   "special_tokens": 4,
   "speech_bos_token_id": 6561,
+  "speech_encoder": "./models/speech_encoder/whisper_large_v3",
   "speech_encoder_ds_rate": 5,
   "speech_encoder_hidden_size": 1280,
   "speech_encoder_type": "whisper",
   "speech_eos_token_id": 6563,
+  "speech_generator_config": "./scripts/mtp/ar_config_5.yaml",
   "speech_generator_type": "ar_mtp_v4",
   "speech_max_position_embeddings": 2048,
   "speech_padding_token_id": 6564,