about the team.
成熟的技术团队,有接触前沿科技的机会
about the job.
算法--ASR:负责语音识别中的语音转文字技术问题
算法--预处理:负责语音的降噪,背景音分离,多人语音分片等
算法--语音翻译:负责在传统TTS和MaskGct的语音模型下进行语音合成的模型优化和AI工程实现。
1、承担在语音大模型等方向上技术的研究与开发。包括声音克隆、zero-shot语音合成、文生语音、语音翻译、ASR、音效生成等。
2、承担背景音分离、降噪、说话人识别、VAD等语音基础技术的研发与工程化。 3、负责相关算法在移动端、PC端、云端等场景的产品化落地。
skills and experience required.
1. 要求人工智能、计算机类、数学类等相关专业,三年以上相关工作经验,硕士及以上学历,博士优先;
2. 精通深度学习、大模型训练、音频信号处理等领域的基础技术与原理,熟悉SeedTTS、ChatTTS、CosyVoice、SenseVoice等模型和技术;
3. 熟练掌握Python/C/C++语言,数据结构和算法基础扎实,了解CUDA开发和TensorRT;
4. 熟练掌握Tensorflow、Caffe、pytorch等任一种深度学习框架。
...