关于职位
负责多模态大模型(Large Multimodality Model)的数据和模型开发
负责voice generation、text to speech、voice clone模型的开发和产品应用。
关于要求
本科及以上学历,计算机科学/计算机工程/电子信息技术等相关专业;
有自然语言处理、语音合成与识别、语音生成等研究或者技术背景优先;
具备扎实的机器学习、深度学习和自然语言处理的理论基础。 熟悉至少一种主流深度学习框架(如 TensorFlow 或 PyTorch)
对主流的多模态语音大模型例如VITS/VALL-E/LLAVA等有深入的研究和理解。