High-Fidelity Speech Synthesis with Minimal Supervision: All Using Diffusion Models

Chunyu Qiang, Hao Li, Yixin Tian, Yi Zhao, Ying Zhang, Longbiao Wang, Jianwu Dang

Tianjin University, Tianjin, China Kuaishou Technology Co., Ltd, Beijing, China

Architecture

Speaker 1

Speaker 2

Speaker 3

Speaker 4

Speaker 5

Prompt	Synthesized Speech