Shujie Liu

Principal Researcher

Book：

李沐，刘树杰，张冬冬，周明. 《机器翻译》，高教出版社，2018.
周明，段楠，刘树杰，吴俣. 《人工智能导论 – 第11章：自然语言处理》. 中国科学技术出版社，2018.

Papers:

Hanchen Pei, Shujie Liu, Yanqing Liu, Jianwei Yu, Yuanhang Qian, Gongping Huang, Sheng Zhao, Yan Lu. A Unified Neural Codec Language Model for Selective Editable Text to Speech Generation. Arxiv 2026.
Shuyu Dai, Shujie LIU, Kun Yan, Jinglu Wang, Chenlong Yin, Ping Wang, Yan Lu. MedSCoDA: Self-Correction Reinforcement Learning for Medical Reasoning. Arxiv 2026.
Yifan Yang, Hui Wang, Bing Han, Shujie Liu, Jinyu Li, Yong Qin, Xie Chen. Position: Towards Responsible Evaluation for Text-to-Speech. ICML 2026.
Hui Wang, Jinghua Zhao, Yifan Yang, Shujie LIU, Junyang Chen, Yanzhe Zhang, Shiwan Zhao, Jinyu Li, Jiaming Zhou, Haoqin Sun, Yan Lu, Yong Qin. SpeechLLM-as-Judges: Towards General and Interpretable Speech Quality Evaluation. ACL 2026.
Cheng-Han Chiang, Xiaofei Wang, Linjie Li, Chung-Ching Lin, Kevin Lin, Shujie LIU, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang. Shanks: Simultaneous Hearing and Thinking for Spoken Language Models. ACL 2026.
Chaoren Wang, Heng Lu, Xueyao Zhang, Shujie LIU, Yan Lu, Jinyu Li, Zhizheng Wu. Closing the Modality Reasoning Gap for Speech Large Language Models. ACL 2026.
Hong Ting Tsang, Jiaxin Bai, Haoyu Huang, Qiao Xiao, Tianshi Zheng, Baixuan Xu, Shujie LIU, Yangqiu Song. AutoGraph-R1: End-to-End Reinforcement Learning for Knowledge Graph Construction. ACL 2026.
Dingdong Wang, Shujie Liu, Tianhua Zhang, Youjun Chen, Jinyu Li, Helen Meng. EmotionThinker: Prosody-Aware Reinforcement Learning for Explainable Speech Emotion Reasoning. ICLR (Oral) 2026.
Yuexi Du, Jinglu Wang, Shujie LIU, Nicha C Dvornek, Yan Lu. CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework, ICLR 2026.
Cheng-Han Chiang, Xiaofei Wang, Linjie Li, Chung-Ching Lin, Kevin Lin, Shujie LIU, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang. STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models . ICLR 2026.
Peng Xia, Jinglu Wang, Yibo Peng, Kaide Zeng, Zihan Dong, Xian Wu, Xiangru Tang, Hongtu Zhu, Yun Li, Linjun Zhang, Shujie LIU, Yan Lu, Huaxiu Yao. MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning. ICLR 2026.
Zhe LI, Shujie LIU, Man-Wai Mak, Mert Pilanci, Jiabao Sheng, Jinglu Wang, Helen M. Meng, Yan Lu. Reinforcement Learning Incentivized Medical Reasoning for Alzheimers Disease Detection From Spontaneous Speech. Arxiv 2025.
Yifan Yang, Ziyang Ma, Shujie Liu, Jinyu Li, Hui Wang, Lingwei Meng, Haiyang Sun, Yuzhe Liang, Ruiyang Xu, Yuxuan Hu, Yan Lu, Rui Zhao, Xie Chen. Interleaved Speech-Text Language Models are Simple Streaming Text to Speech Synthesizers. Arxiv 2025.
Yifan Yang, Shujie Liu, Jinyu Li, Yuxuan Hu, Haibin Wu, Hui Wang, Jianwei Yu, Lingwei Meng, Haiyang Sun, Yanqing Liu, Yan Lu, Kai Yu, Xie Chen. Pseudo-Autoregressive Neural Codec Language Models for Efficient Zero-Shot Text-to-Speech Synthesis. ACMMM 2025.
Hui Wang, Shujie Liu, Lingwei Meng, Jinyu Li, Yifan Yang, Shiwan Zhao, Haiyang Sun, Yanqing Liu, Haoqin Sun, Jiaming Zhou, Yan Lu, Yong Qin. FELLE: Autoregressive Speech Synthesis with Token-Wise Coarse-to-Fine Flow Matching. ACMMM 2025.
Yiwei Guo, Zhihan Li, Hankun Wang, Bohan Li, Chongtian Shao, Hanglei Zhang, Chenpeng Du, Xie Chen, Shujie Liu, Kai Yu. Recent Advances in Discrete Speech Tokens: A Review. TPAMI 2025.
Zezhong Jin, Shubhang Desai, Xu Chen, Biyi Fang, Zhuoyi Huang, Zhe LI, Chong-Xin Gan, Xiao Tu, Man-Wai Mak, Yan Lu, Shujie LIU. TrInk: Ink Generation with Transformer Network. EMNLP 2025.
Hui Wang, Yifan Yang, Shujie Liu, Jinyu Li, Lingwei Meng, Yanqing Liu, Jiaming Zhou, Haoqin Sun, Yan Lu, Yong Qin. StreamMel: Real-Time Zero-shot Text-to-Speech via Interleaved Continuous Autoregressive Modeling. IEEE SPL 2025.
Haiyang Sun, Shujie Hu, Shujie Liu, Lingwei Meng, Hui Wang, Bing Han, Yifan Yang, Yanqing Liu, Sheng Zhao, Yan Lu, Yanmin Qian. Zero-Shot Streaming Text to Speech Synthesis with Transducer and Auto-Regressive Modeling . Arxiv 2025.
Yifan Yang, Ziyang Ma, Shujie Liu, Jinyu Li, Hui Wang, Lingwei Meng, Haiyang Sun, Yuzhe Liang, Ruiyang Xu, Yuxuan Hu, Yan Lu, Rui Zhao, Xie Chen. Interleaved Speech-Text Language Models are Simple Streaming Text to Speech Synthesizers. Arxiv 2024.
Wenxi Chen, Ziyang Ma, Ruiqi Yan, Yuzhe Liang, Xiquan Li, Ruiyang Xu, Zhikang Niu, Yanqiao Zhu, Yifan Yang, Zhanxun Liu, Kai Yu, Yuxuan Hu, Jinyu Li, Yan Lu, Shujie Liu, Xie Chen. SLAM-Omni: Timbre-Controllable Voice Interaction System with Single-Stage Training, ACL Findings 2025.
Jeongsoo Choi, Ji-Hoon Kim, Jinyu Li, Joon Son Chung, Shujie Liu. V2SFlow: Video-to-Speech Generation with Speech Decomposition and Rectified Flow. ICASSP 2025 .
Hongkun Hao, Long Zhou, Shujie Liu, Jinyu Li, Shujie Hu, Rui Wang, Furu Wei. Boosting large language model for speech synthesis: An empirical study. ICASSP 2025.
Lingwei Meng, Long Zhou, Shujie Liu, Sanyuan Chen, Bing Han, Shujie Hu, Yanqing Liu, Jinyu Li, Sheng Zhao, Xixin Wu, Helen Meng, Furu Wei. Autoregressive Speech Synthesis without Vector Quantization. ACL 2025.
Chenyang Le, Yao Qian, Dongmei Wang, Long Zhou, Shujie Liu, Xiaofei Wang, Midia Yousefi, Yanmin Qian, Jinyu Li, Sheng Zhao, Michael Zeng. Transvip: Speech to speech translation system with voice and isochrony preservation, NeurIPS 2024.
Leying Zhang, Yao Qian, Long Zhou, Shujie Liu, Dongmei Wang, Xiaofei Wang, Midia Yousefi, Yanmin Qian, Jinyu Li, Lei He, Sheng Zhao, Michael Zeng. CoVoMix: Advancing zero-shot speech generation for human-like multi-talker conversations. NeurIPS 2024.
Ze Yuan, Yanqing Liu, Shujie Liu, Sheng Zhao. Continuous Speech Tokens Makes LLMs Robust Multi-Modality Learners. Arxiv 2024.
Leying Zhang, Yao Qian, Linfeng Yu, Heming Wang, Hemin Yang, Long Zhou, Shujie Liu, Yanmin Qian. DDTSE: Discriminative diffusion model for target speech extraction. SLT 2024.
Ruchao Fan, Bo Ren, Yuxuan Hu, Rui Zhao, Shujie Liu, Jinyu Li. AlignFormer: Modality Matching Can Achieve Better Zero-shot Instruction-Following Speech-LLM. IEEE STSP 2024.
Zhikang Niu, Sanyuan Chen, Long Zhou, Ziyang Ma, Xie Chen, Shujie Liu. NDVQ: Robust neural audio codec with normal distribution-based vector quantization. SLT 2024.
Jiaqi Li, Dongmei Wang, Xiaofei Wang, Yao Qian, Long Zhou, Shujie Liu, Midia Yousefi, Canrun Li, Chung-Hsien Tsai, Zhen Xiao, Yanqing Liu, Junkun Chen, Sheng Zhao, Jinyu Li, Zhizheng Wu, Michael Zeng. Investigating neural audio codecs for speech language model-based speech generation. SLT 2024.
Shengpeng Ji, Yifu Chen, Minghui Fang, Jialong Zuo, Jingyu Lu, Hanting Wang, Ziyue Jiang, Long Zhou, Shujie Liu, Xize Cheng, Xiaoda Yang, Zehan Wang, Qian Yang, Jian Li, Yidi Jiang, Jingzhen He, Yunfei Chu, Jin Xu, Zhou Zhao. Wavchat: A survey of spoken dialogue models. Arxiv 2024.
Zongyi Li, Shujie Hu, Shujie Liu, Long Zhou, Jeongsoo Choi, Lingwei Meng, Xun Guo, Jinyu Li, Hefei Ling, Furu Wei. ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation. ICLR 2024
Jiaqi Li, Dongmei Wang, Xiaofei Wang, Yao Qian, Long Zhou, Shujie Liu, Midia Yousefi, Canrun Li, Chung-Hsien Tsai, Zhen Xiao, Yanqing Liu, Junkun Chen, Sheng Zhao, Jinyu Li, Zhizheng Wu, Michael Zeng. Investigating Neural Audio Codecs for Speech Language Model-Based Speech Generation. SLT 2024
Shujie Hu, Long Zhou, Shujie Liu, Sanyuan Chen, Lingwei Meng, Hongkun Hao, Jing Pan, Xunying Liu, Jinyu Li, Sunit Sivasankaran, Linquan Liu, Furu Wei. WavLLM: Towards Robust and Adaptive Speech Large Language Model. EMNLP Findings 2024.
Xun Gong, Yu Wu, Jinyu Li, Shujie Liu, Rui Zhao, Xie Chen, and Yanmin Qian. Advanced long-content speech recognition with factorized neural transducer. TASLP, 2024.
Jiaqi Li, Dongmei Wang, Xiaofei Wang, Yao Qian, Long Zhou, Shujie Liu, Midia Yousefi, Canrun Li, Chung-Hsien Tsai, Zhen Xiao, Yanqing Liu, Junkun Chen, Sheng Zhao, Jinyu Li, Zhizheng Wu, Michael Zeng. Investigating Neural Audio Codecs for Speech Language Model-Based Speech Generation. SLT 2024.
Bing Han, Long Zhou, Shujie Liu, Sanyuan Chen, Lingwei Meng, Yanming Qian, Yanqing Liu, Sheng Zhao, Jinyu Li, Furu Wei. VALL-E R: Robust and Efficient Zero-Shot Text-to-Speech Synthesis via Monotonic Alignment. arxiv 2024.
Sanyuan Chen, Shujie Liu, Long Zhou, Yanqing Liu, Xu Tan, Jinyu Li, Sheng Zhao, Yao Qian, Furu Wei. VALL-E 2: Neural Codec Language Models are Human Parity Zero-Shot Text to Speech Synthesizers. arxiv 2024.
Detai Xin, Xu Tan, Kai Shen, Zeqian Ju, Dongchao Yang, Yuancheng Wang, Shinnosuke Takamichi, Hiroshi Saruwatari, Shujie Liu, Jinyu Li, Sheng Zhao. Rall-E: Robust codec language modeling with chain-of-thought prompting for text-to-speech synthesis. arxiv 2024.
Guangyu Chen, Yu Wu, Shujie Liu, Tao Liu, Xiaoyong Du, Furu Wei. WavMark: Watermarking for Audio Generation. arXiv 2023.
Xiaofei Wang, Manthan Thakker, Zhuo Chen, Naoyuki Kanda, Sefik Emre Eskimez, Sanyuan Chen, Min Tang, Shujie Liu, Jinyu Li, Takuya Yoshioka. Speechx: Neural codec language model as a versatile speech transformer. TASLP 2023.
Chenyang Le, Yao Qian, Long Zhou, Shujie Liu, Yanmin Qian, Michael Zeng, Xuedong Huang. Comsl: A composite speech-language model for end-to-end speech-to-text translation. NeurIPS 2023.
Ziqiang Zhang, Long Zhou, Chengyi Wang, Sanyuan Chen, Yu Wu, Shujie Liu, Zhuo Chen, Yanqing Liu, Huaming Wang, Jinyu Li, Lei He, Sheng Zhao, Furu Wei. Speak Foreign Languages with Your Own Voice: Cross-Lingual Neural Codec Language Modeling. arXiv 2023.
Sanyuan Chen, Chengyi Wang, Yu Wu, Ziqiang Zhang, Long Zhou, Shujie Liu, Zhuo Chen, Yanqing Liu, Huaming Wang, Jinyu Li, Lei He, Sheng Zhao, Furu Wei. Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. TASLP 2024.
Xun Gong, Yu Wu, Jinyu Li, Shujie Liu, Rui Zhao, Xie Chen, Yanmin Qian. LongFNT: Long-form Speech Recognition with Factorized Neural Transducer. TASLP 2023.
Sanyuan Chen, Yu Wu, Chengyi Wang, Shujie Liu, Daniel Tompkins, Zhuo Chen, Furu Wei. BEATs: Audio Pre-Training with Acoustic Tokenizers. ICML 2023.
Qiushi Zhu, Long Zhou, Ziqiang Zhang, Shujie Liu, Binxing Jiao, Jie Zhang, Lirong Dai, Daxin Jiang, Jinyu Li, Furu Wei. VATLM: Visual-Audio-Text Pre-Training with Unified Masked Prediction for Speech Representation Learning. IEEE Transactions on Multimedia 2023.
Peidong Wang, Eric Sun, Jian Xue, Yu Wu, Long Zhou, Yashesh Gaur, Shujie Liu, Jinyu Li. LAMASSU: Streaming Language-Agnostic Multilingual Speech Recognition and Translation Using Neural Transducers. arXiv 2023.
Kun Wei, Long Zhou, Ziqiang Zhang, Liping Chen, Shujie Liu, Lei He, Jinyu Li, Furu Wei. Joint Pre-Training with Speech and Bilingual Text for Direct Speech to Speech Translation. ICASSP 2023.
Xun Gong, Yu Wu, Jinyu Li, Shujie Liu, Rui Zhao, Xie Chen, Yanmin Qian. LongFNT: Long-form Speech Recognition with Factorized Neural Transducer. ICASSP 2023.
Yan Deng, Long Zhou, Yuanhao Yi, Shujie Liu, Lei He. Prosody-Aware Speech5 for Expressive Neural TTS. ICASSP 2023.
Heming Wang, Yao Qian, Hemin Yang, Nauyuki Kanda, Peidong Wang, Takuya Yoshioka, Xiaofei Wang, Yiming Wang, Shujie Liu, Zhuo Chen, DeLiang Wang, Michael Zeng. Data2Vec-SG: Improving Self-Supervised Learning Representations for Speech Generation Tasks. ICASSP 2023.
Qiushi Zhu, Long Zhou, Jie Zhang, Shujie Liu, Yuchen Hu, Lirong Dai. Robust Data2vec: Noise-robust Speech Representation Learning for ASR by Combining Regression and Improved Contrastive Learning. ICASSP 2023.
Haibin Yu, Yuxuan Hu, Yao Qian, Ma Jin, Linquan Liu, Shujie Liu, Yu Shi, Yanmin Qian, Edward Lin, Michael Zeng. Code-Switching Text Generation and Injection in Mandarin-English ASR. ICASSP 2023.
Chenda Li, Yao Qian, Zhuo Chen, Dongmei Wang, Takuya Yoshioka, Shujie Liu, Yanmin Qian, Michael Zeng.Target Sound Extraction with Variable Cross-Modality Clues. ICASSP 2023.
Yutong Chen, Ronglai Zuo, Fangyun Wei, Yu Wu, Shujie Liu, Brian Mak. Two-Stream Network for Sign Language Recognition and Translation. NeurIPS 2022.
Ziqiang Zhang, Sanyuan Chen, Long Zhou, Yu Wu, Shuo Ren, Shujie Liu, Zhuoyuan Yao, Xun Gong, Lirong Dai, Jinyu Li, Furu Wei. SpeechLM: Enhanced Speech Pre-Training with Unpaired Textual Data. Arxiv. 2022
Ziqiang Zhang, Long Zhou, Junyi Ao, Shujie Liu, Lirong Dai, Jinyu Li, Furu Wei. SpeechUT: Bridging Speech and Text with Hidden-Unit for Encoder-Decoder Based Speech-Text Pre-training. EMNLP. 2022.
Hyungchan Song, Sanyuan Chen, Zhuo Chen, Yu Wu, Takuya Yoshioka, Min Tang, Jong Won Shin, Shujie Liu. Exploring WavLM on Speech Enhancement. IEEE SLT 2022.
Ziqiang Zhang, Junyi Ao, Long Zhou, Shujie Liu, Furu Wei, Jinyu Li. The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline Shared Task. IWSLT. 2022.
Junyi Ao, Ziqiang Zhang, Long Zhou, Shujie Liu, Haizhou Li, Tom Ko, Lirong Dai, Jinyu Li, Yao Qian and Furu Wei. Pre-Training Transformer Decoder for End-to-End ASR Model with Unpaired Speech Data. Interspeech 2022.
Sanyuan Chen, Yu Wu, Chengyi Wang, Shujie Liu, Zhuo Chen, Peidong Wang, Gang Liu, Jinyu Li, Jian Wu, Xiangzhan Yu and Furu Wei. Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recognition? Interspeech 2022.
Shuo Ren, Shujie Liu, Yu Wu, Long Zhou and Furu Wei. Speech Pre-training with Acoustic Piece. Interspeech 2022.
Chengyi Wang, Yiming Wang, Yu Wu, Sanyuan Chen, Jinyu Li, Shujie Liu and Furu Wei. Supervision-Guided Codebooks for Masked Prediction in Speech Pre-training. Interspeech 2022.
Wangyou Zhang, Zhuo Chen, Naoyuki Kanda, Shujie Liu, Jinyu Li, Sefik Emre Eskimez, Takuya Yoshioka, Xiong Xiao, Zhong Meng, Yanmin Qian, Furu Wei. Separating Long-Form Speech with Group-Wise Permutation Invariant Training. Interspeech 2022.
Sanyuan Chen, Chengyi Wang, Zhengyang Chen, Yu Wu, Shujie Liu, Zhuo Chen, Jinyu Li, Naoyuki Kanda, Takuya Yoshioka, Xiong Xiao, Jian Wu, Long Zhou, Shuo Ren, Yanmin Qian, Yao Qian, Jian Wu, Micheal Zeng, Furu Wei. WavLM: Large-Scale Self-Supervised Pre-Training for Full Stack Speech Processing. IEEE Journal of Selected Topics in Signal Processing (JSTSP), (IEEE SPS Best Paper 2025). 2022.
Chengyi Wang, Yu Wu, Shujie Liu, Jinyu Li, Yao Qian, Kenichi Kumatani, Furu Wei. UniSpeech at scale: An Empirical Study of Pre-training Method on Large-Scale Speech Recognition Dataset. Arxiv. 2021.
Junyi Ao, Rui Wang, Long Zhou, Shujie Liu, Shuo Ren, Yu Wu, Tom Ko, Qing Li, Yu Zhang, Zhihua Wei, Yao Qian, Jinyu Li, Furu Wei. SpeechT5: Unified-Modal Encoder-Decoder Pre-training for Spoken Language Processing. ACL Main. 2022.
Wei Wang, Shuo Ren, Yao Qian, Shujie Liu, Yu Shi, Yanmin Qian, Michael Zeng. Optimizing Alignment of Speech and Language Latent Spaces for End-to-End Speech Recognition and Understanding. ICASSP 2022.
Zhengyang Chen, Sanyuan Chen, Yu Wu, Yao Qian, Chengyi Wang, Shujie Liu, Yanmin Qian, Michael Zeng. Large-scale Self-Supervised Speech Representation Learning for Automatic Speaker Verification. ICASSP 2022.
Sanyuan Chen, Yu Wu, Chengyi Wang, Zhengyang Chen, Zhuo Chen, Shujie Liu, Jian Wu, Yao Qian, Furu Wei, Jinyu Li, Xiangzhan Yu. UniSpeech-SAT: Universal Speech Representation Learning with Speaker Aware Pre-Training. ICASSP 2022.
Rui Wang, Junyi Ao, Long Zhou, Shujie Liu, Zhihua Wei, Tom Ko, Qing Li, Yu Zhang. Multi-View Self-Attention Based Transformer for Speaker Recognition. ICASSP 2022.
Long Zhou, Jinyu Li, Eric Sun, Shujie Liu. A Configurable Multilingual Model is All You Need to Recognize All Languages. ICASSP 2022.
Chengyi Wang, Yu Wu, Sanyuan Chen, Shujie Liu, Jinyu Li, Yao Qian, Zhenglu Yang. Self-Supervised Learning for speech recognition with Intermediate layer supervision. ICASSP 2022.
Heming Wang, Yao Qian, Xiaofei Wang, Yiming Wang, Chengyi Wang, Shujie Liu, Takuya Yoshioka, Jinyu Li, DeLiang Wang. Improving Noise Robustness of Contrastive Speech Representation Learning with Speech Reconstruction. ICASSP 2022.
Jiaqi Bai, Long Zhou, Ambrosio Blanco, Shujie Liu, Furu Wei, Ming Zhou, and Zhoujun Li. Jointly Learning to Repair Code and Generate Commit Messages. EMNLP 2021.
Leyang Cui, Yu Wu, Shujie Liu and Yue Zhang. A Knowledge Enhanced Fine-Tuning Method for Better Handling Unseen Entity in Dialogue Generation. EMNLP 2021.
Chengyi Wang, Yu Wu, Yao Qian, Kenichi Kumatani, Shujie Liu, Furu Wei, Michael Zeng, Xuedong Huang. UniSpeech: Unified Speech Representation Learning with Labeled and Unlabeled Data. ICML 2021.
Shuo Ren, Long Zhou, Shujie Liu, Furu Wei, Ming Zhou, and Shuai Ma. SemFace: Pre-training Encoder and Decoder with a Semantic Interface for Neural Machine Translation. ACL Main 2021.
Yu Tang, Long Zhou, Ambrosio Blanco, Shujie Liu, Furu Wei, Ming Zhou, and Muyun Yang. Grammar-Based Patches Generation for Automated Program Repair. ACL Findings 2021.
Sanyuan Chen, Yu Wu, Zhuo Chen, Jian Wu, Takuya Yoshioka, Shujie Liu, Jinyu Li, Xiangzhan Yu. Ultra Fast Speech Separation Model with Teacher-Student Learning. Interspeech 2021.
Jian Wu, Zhuo Chen, Sanyuan Chen, Yu Wu, Takuya Yoshioka, Naoyuki Kanda, Shujie Liu, Jinyu Li. Investigation of Practical Aspects of Single Channel Speech Separation for ASR. Interspeech 2021.
Eric Sun, Jinyu Li, Zhong Meng, Yu Wu, Jian Xue, Shujie Liu, Yifan Gong. Improving Multilingual Transformer Transducer Models by Reducing Language Confusions. Interspeech 2021.
Sanyuan Chen, Yu Wu, Zhuo Chen, Jinyu Li, Takuya Yoshioka, Chengyi Wang, Shujie Liu, Ming Zhou. Continuous Speech Separation with Conformer. ICASSP. 2021.
Sanyuan Chen, Yu Wu, Zhuo Chen, Takuya Yoshioka, Shujie Liu, Jinyu Li, Xiangzhan Yu. Don’t shoot butterfly with rifles: Multi-channel Continuous Speech Separation with Early Exit Transformer. ICASSP. 2021.
Xie Chen, Yu Wu, Zhenghao Wang, Shujie Liu, Jinyu Li. Developing Real-time Streaming Transformer Transducer for Speech Recognition on Large-scale Dataset. ICASSP. 2021.
Xiong Xiao, Naoyuki Kanda, Zhuo Chen, Tianyan Zhou, Takuya Yoshioka, Sanyuan Chen, Yong Zhao, Gang Liu, Yu Wu, Jian Wu, Shujie Liu, Jinyu Li, Yifan Gong. Microsoft Speaker Diarization System for the VoxCeleb Speaker Recognition Challenge 2020. ICASSP. 2021.
Shuo Ren, Daya Guo, Shuai Lu, Long Zhou, Shujie Liu, Duyu Tang, Ming Zhou, Ambrosio Blanco, Shuai Ma. CodeBLEU: a Method for Automatic Evaluation of Code Synthesis. Arxiv. 2020.
Daya Guo, Shuo Ren, Shuai Lu, Zhangyin Feng, Duyu Tang, Shujie Liu, Long Zhou, Nan Duan, Jian Yin, Daxin Jiang, Ming Zhou. GraphCodeBERT: Pre-training Code Representations with Data Flow. ICLR. 2021.
Chengyi Wang, Yu Wu, Liang Lu, Shujie Liu, Jinyu Li, Guoli Ye, Ming Zhou. Low Latency End-to-End Streaming Speech Recognition with a Scout Network. INTERSPEECH 2020
Chengyi Wang, Yu Wu, Yujiao Du, Jinyu Li, Shujie Liu, Liang Lu, Shuo Ren, Guoli Ye, Sheng Zhao, Ming Zhou. Semantic Mask for Transformer-based End-to-End Speech Recognition. INTERSPEECH 2020
Jinyu Li, Yu Wu, Yashesh Gaur, Chengyi Wang, Rui Zhao, Shujie Liu. On the Comparison of Popular End-to-End Models for Large Scale Speech Recognition. INTERSPEECH 2020
Naihan Li, Shujie Liu, Yanqing Liu, Sheng Zhao, Ming Liu and Ming Zhou. MoBoAligner: a Neural Alignment Model for Non-autoregressive TTS with Monotonic Boundary Search. INTERSPEECH 2020
Chengyi Wang, Yu Wu, Shujie Liu, Ming Zhou and Zhenglu Yang. Curriculum Pre-training for End-to-End Speech Translation. ACL, 2020
Shuo Ren, Shujie Liu, Ming Zhou and Shuai Ma. A Graph-based Coarse-to-fine Method for Unsupervised Bilingual Lexicon Induction. ACL, 2020
Shuo Ren, Yu Wu, Shujie Liu, Ming Zhou and Shuai Ma. A Retrieve-and-Rewrite Initialization Method for Unsupervised Machine Translation. ACL, 2020
Leyang Cui, Yu Wu, Shujie Liu, Yue Zhang, and Ming Zhou. MuTual: A Dataset for Multi-Turn Dialogue Reasoning. ACL, 2020
Ming Zhou, Nan Duan, Shujie Liu, Heung-Yeung Shum. Progress in Neural NLP: Modeling, Learning, and Reasoning. Engineering. 2020
Muyun Yang, Shujie Liu, Kehai Chen, Hongyang Zhang, Enbo Zhao, Tiejun Zhao. A Hierarchical Clustering Approach to Fuzzy Semantic Representation of Rare Words in Neural Machine Translation. IEEE Transactions on Fuzzy Systems. 2020
Chengyi Wang, Yu Wu, Shujie Liu, Zhenglu Yang, Ming Zhou. Bridging the Gap between Pre-Training and Fine-Tuning for End-to-End Speech Translation. AAAI, 2020
Naihan Li, Yanqing Liu, Yu Wu, Shujie Liu, Sheng Zhao, Ming Liu. RobuTrans: a Robust Transformer based Text-to-Speech Model. AAAI, 2020
Yu Wu, Yunli Wang, Shujie Liu. A Dataset for Low-Resource Stylized Sequence-to-Sequence Generation. AAAI, 2020
Chengyi Wang, Shuangzhi Wu, Shujie Liu. Accelerating Transformer Decoding via a Hybrid of Self-attention and Recurrent Neural Network. Arxiv, 2019
Chengyi Wang, Shuangzhi Wu, Shujie Liu. Source Dependency-Aware Transformer with Supervised Self-Attention. Arxiv, 2019
Shuo Ren, Yu Wu, Shujie Liu, Ming Zhou and Shuai Ma. Explicit Cross-lingual Pre-training for Unsupervised Machine Translation, EMNLP 2019.
Kun Zhou, Kai Zhang, Yu Wu, Shujie Liu and Jingsong Yu. Unsupervised Context Rewriting for Open Domain Conversation, EMNLP 2019.
Zhirui Zhang, Shuangzhi Wu, Shujie Liu, Mu Li, Ming Zhou, Enhong Chen. Regularizing Neural Machine Translation by Target-bidirectional Agreement. AAAI, 2019
Shuo Ren, Zhirui Zhang, Shujie Liu, Ming Zhou, Shuai Ma. Unsupervised Neural Machine Translation with SMT as Posterior Regularization. AAAI, 2019
Naihan Li, Shujie Liu, Yanqing Liu, Sheng Zhao, Ming Liu, Ming Zhou. Neural Speech Synthesis with Transformer Network. AAAI, 2019
Zhirui Zhang, Shujie Liu, Mu Li, Ming Zhou, Enhong Chen. Bidirectional Generative Adversarial Networks for Neural Machine Translation. CoNLL, 2018
Zhirui Zhang, Shujie Liu, Mu Li, Ming Zhou, Enhong Chen. Coarse-To-Fine Learning for Neural Machine Translation. NLPCC, 2018
Wenhu Chen, Guanlin Li, Shujie Liu, Zhirui Zhang, Mu Li, Ming Zhou. Approximate Distribution Matching for Sequence-to-Sequence Learning. Arxiv, 2018
Zhirui Zhang, Shuo Ren, Shujie Liu, Jianyong Wang, Peng Chen, Mu Li, Ming Zhou, Enhong Chen. Style Transfer as Unsupervised Machine Translation. Arxiv, 2018
Shuo Ren, Wenhu Chen, Shujie Liu, Mu Li, Ming Zhou and Shuai Ma, Triangular Architecture for Rare Language Translation. ACL – Association for Computational Linguistics, 2018.
Hany Hassan, Anthony Aue, Chang Chen, Vishal Chowdhary, Jonathan Clark, Christian Federmann, Xuedong Huang, Marcin Junczys-Dowmunt, William Lewis, Mu Li, Shujie Liu, Tie-Yan Liu, Renqian Luo, Arul Menezes, Tao Qin, Frank Seide, Xu Tan, Fei Tian, Lijun Wu, Shuangzhi Wu, Yingce Xia, Dongdong Zhang, Zhirui Zhang, and Ming Zhou. Achieving Human Parity on Automatic Chinese to English News Translation. Arxiv. 2018.
Zhirui Zhang, Shujie Liu, Mu Li, Ming Zhou, Enhong Chen. Joint Training for Neural Machine Translation Models with Monolingual Data. AAAI, 2018.
Zhao Yan, Duyu Tang, Nan Duan, Shujie Liu, Wendi Wang, Daxin Jiang, Ming Zhou and Zhoujun Li. Assertion-based QA with Question-Aware Open Information Extraction. AAAI, 2018.
Wenhu Chen, Guanlin Li, Shuo Ren, Shujie Liu, Zhirui Zhang, Mu Li, Ming Zhou. Generative Bridging Network in Neural Sequence Prediction. NAACL, 2018.
Duyu Tang, Nan Duan, Zhao Yan, Zhirui Zhang, Yibo Sun, Shujie Liu, Yuanhua Lv, Ming Zhou. Learning to Collaborate for Question Answering and Asking. NAACL, 2018.
Shuangzhi Wu, Dongdong Zhang, Shujie Liu, Ming Zhou. Modeling Indicative Context for Statistical Machine Translation. NLPCC. 2017.
Zhirui Zhang, Shujie Liu, Mu Li, Ming Zhou and Enhong Chen. Stack-based Multi-layer Attention for Transition-based Dependency Parsing, EMNLP, September 2017.
Shonosuke Ishiwatari, Jingtao Yao, Shujie Liu, Mu Li, Ming Zhou, Naoki Yoshinaga, Masaru Kitsuregawa and Weijia Jia, Chunk-based Decoder for Neural Machine Translation, ACL – Association for Computational Linguistics, 2017.
Chen Shi, Shujie Liu, Shuo Ren, Shi Feng, Mu Li, Ming Zhou, Xu Sun, and Houfeng Wang, Knowledge-Based Semantic Embedding for Machine Translation, ACL – Association for Computational Linguistics, 8 August 2016.
Shi Feng, Shujie Liu, Nan Yang, Mu Li, and Ming Zhou, Kenny Q.Zhu, Improving Attention Modeling with Implicit Distortion and Fertility for Machine Translation, COLING, December 2016.
Li Dong, Furu Wei, Shujie Liu, Ming Zhou, and Ke Xu, A Statistical Parsing Framework for Sentiment Classification, Computational Linguistics, December 2015.
Qinglin Li, Shujie Liu, Rui Lin, Mu Li, and Ming Zhou, Entity Translation with Collective Inference in Knowledge Graph, NLPCC, October 2015.
Rui Lin, Muyun Yang, Shujie Liu, Sheng Li, Tiejun Zhao. A maximum entropy approach to discourse coherence modeling. NLPCC. 2015.
Rui Lin, Shujie Liu, Muyun Yang, Mu Li, Ming Zhou, and Sheng Li, Hierarchical Recurrent Neural Network for Document Modeling, EMNLP, September 2015.
Shujie Liu, Li Dong, Jiajun Zhang, Furu Wei, Mu Li, and Ming Zhou, 深度学习在自然语言处理中的应用, in 中国计算机学会通讯, April 2015.
Jiajun Zhang, Shujie Liu, Mu Li, Ming Zhou, Chengqing Zong. Towards machine translation in semantic vector space. TALLIP. 2015.
Jiajun Zhang, Shujie Liu, Mu Li, Ming Zhou, and Chengqing Zong, Beyond Word-based Language Model in Statistical Machine Translation, arxiv, April 2015.
Jiajun Zhang, Shujie Liu, Mu Li, Ming Zhou, and Chengqing Zong, Machine Translation by Minimizing the Semantic Gap in the Vector Embedding Space, in ACM Transactions on Asian Language Information Processing(TALIP), ACM – Association for Computing Machinery, November 2014.
Jiajun Zhang, Shujie Liu, Mu Li, Ming Zhou, and Chengqing Zong, Mind the Gap: Machine Translation by Minimizing the Semantic Gap in Embedding Space, AAAI – Association for the Advancement of Artificial Intelligence, July 2014.
Lei Cui, Dongdong Zhang, Shujie Liu, Qiming Chen, Mu Li, Ming Zhou, and Muyun Yang, Learning Topic Representation for SMT with Neural Networks, ACL – Association for Computational Linguistics, June 2014.
Shujie Liu, Nan Yang, Mu Li, and Ming Zhou, A Recursive Recurrent Neural Network for Statistical Machine Translation, ACL, June 2014.
Jiajun Zhang, Shujie Liu, Mu Li, Ming Zhou, and Chengqing Zong, Bilingually-constrained Phrase Embeddings for Machine Translation, ACL, June 2014.
Bo Wang, Ming Zhou, Shujie Liu, Mu Li, Dongdong Zhang. Woodpecker: An Automatic Methodology for Machine Translation Diagnosis with Rich Linguistic Knowledge. J. Inf. Sci. Eng. 30(5): 1407-1424 (2014)
Lei Cui, Dongdong Zhang, Shujie Liu, Mu Li, and Ming Zhou, Collective Corpus Weighting and Phrase Scoring for SMT using Graph-based Random Walk, NLPCC, November 2013.
Zhengyan He, Shujie Liu, Yang Song, Mu Li, Ming Zhou, and Houfeng Wang, Efficient Collective Entity Linking with Stacking, EMNLP, October 2013.
Lei Cui, Xilun Chen, Dongdong Zhang, Shujie Liu, Mu Li, and Ming Zhou, Multi-Domain Adaptation for SMT Using Multi-Task Learning, EMNLP, October 2013.
Nan Yang, Shujie Liu, Mu Li, Ming Zhou, and Nenghai Yu, Word Alignment Modeling with Context-Dependent Deep Neural Network, ACL, August 2013.
Zhengyan He, Shujie Liu, Mu Li, Ming Zhou, Longkai Zhang, and Houfeng Wang, Learning Entity Representation for Entity Disambiguation, ACL, August 2013.
Lei Cui, Dongdong Zhang, Shujie Liu, Mu Li, and Ming Zhou, Bilingual Data Cleaning for SMT using Graph-based Random Walk, ACL – Association for Computational Linguistics, August 2013.
Shujie Liu, Chi-ho Li, Mu Li, and Ming Zhou, A Co-training Framework for Feature Weight Optimization of Statistical Machine Translation, in Journal of Software, July 2013.
Shujie Liu, Chi-Ho Li, Mu Li, and Ming Zhou, Re-training Monolingual Parser Bilingually for Syntactic SMT, EMNLP, July 2012.
Shujie Liu, Chi-Ho Li, Mu Li, and Ming Zhou, Learning Translation Consensus with Structured Label Propagation, ACL, July 2012.
Shujie Liu, Chi-Ho Li, and Ming Zhou, Statistic Machine Translation Boosted with Spurious Word Deletion, MT-SUMMIT, August 2011.
Shujie Liu, Chi-ho Li, and Ming Zhou, A Unified SMT Framework Combining MIRA and MERT, MT-SUMMIT, August 2011.
Chi-Ho Li, Shujie Liu, Chenguang Wang, and Ming Zhou, ENGtube: an Integrated Subtitle Environment for ESL, MT-SUMMIT, 2011.
Yinggong Zhao, Shujie Liu, Yangsheng Ji, and Jiajun Chen, Transductive Minimum Error Rate Training for Statistical Machine Translation, IJCNLP, 2011.
Chi-Ho Li, Nan Duan, Yinggong Zhao, Shujie Liu, Lei Cui, Mei-yuh Hwang, Amittai Axelrod, Jianfeng Gao, Yaodong Zhang, and Li Deng, DIALOG task: The MSRA Machine Translation System for IWSLT 2010, IWSLT, November 2010.
Shujie Liu, Chi-ho Li, and Ming Zhou, Improved Discriminative ITG Alignment using Hierarchical Phrase Pairs and Semi-supervised Training, COLING, October 2010.
Shujie Liu, Chi-Ho Li, and Ming Zhou, Discriminative Pruning for Discriminative ITG Alignment, ACL, July 2010.
Dongdong Zhang, Chi-ho Li, Nan Duan, Shujie Liu, Mu Li, and Ming Zhou, 微软亚洲研究院汉英翻译系统CWMT2009 评测技术报告, CWMT, 2009.
Ming Zhou, Bo Wang, Shujie Liu, Mu Li, Dongdong Zhang, and Tiejun Zhao, Diagnostic Evaluation of Machine Translation Systems Using Automatically Constructed Linguistic Check-Points, COLING, 2008.
Muyun Yang, Shujie Liu, Lei Wang, Sheng Li, Jufeng Li, Teijun Zhao, Haoliang Qi. An EMD Based Approach to Transliteration Unit Alignment between English and Chinese. ISCSLP. 2008.

Shujie Liu

Publications

Book：

Papers:

Contact Shujie Liu

Microsoft Research Lab – Asia