Hi, about multi-langual support #67

MonolithFoundation · 2025-01-09T12:02:45Z

Would try using WavTokenizer for TTS needs support multilangual, for English it should be OK. but for Chinese or Janpanese, what should be done for better adoption?

thanks for this wonderful work!

jishengpeng · 2025-01-10T07:28:59Z

Would try using WavTokenizer for TTS needs support multilangual, for English it should be OK. but for Chinese or Janpanese, what should be done for better adoption?

thanks for this wonderful work!

Thank you very much for your interest. Building upon the wavtokenizer checkpoint, further training on an additional 10,000 to 20,000 hours of Chinese and Japanese data would likely result in significantly improved performance.

MonolithFoundation · 2025-01-10T08:01:00Z

Does the training need words level timestamp? 10000 hours needs many audio data, does not very clean (like Emilla dataset) can fill the constraints?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Hi, about multi-langual support #67

Hi, about multi-langual support #67

MonolithFoundation commented Jan 9, 2025

jishengpeng commented Jan 10, 2025

MonolithFoundation commented Jan 10, 2025

Hi, about multi-langual support #67

Hi, about multi-langual support #67

Comments

MonolithFoundation commented Jan 9, 2025

jishengpeng commented Jan 10, 2025

MonolithFoundation commented Jan 10, 2025