default search action

combined dblp search
author search
venue search
publication search

ask others

SLT 2021: Shenzhen, China

> Home > Conferences and Workshops > SLT

Refine list

refinements active!

zoomed in on ?? of ?? records

view refined list in

export refined list as

showing all ?? records

- view
  authority control:
- export record
  dblp key:
  - conf/slt/2021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/2021
IEEE Spoken Language Technology Workshop, SLT 2021, Shenzhen, China, January 19-22, 2021. IEEE 2021, ISBN 978-1-7281-7066-4
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiZD21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiZD21
Mohan Li, Catalin Zorila, Rama Doddipatla:
Transformer-Based Online Speech Recognition with Decoder-end Adaptive Computation Steps. 1-7
- view
  authority control:
- export record
  dblp key:
  - conf/slt/YehWSW0CS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/YehWSW0CS21
Ching-Feng Yeh, Yongqiang Wang, Yangyang Shi, Chunyang Wu, Frank Zhang, Julian Chan, Michael L. Seltzer:
Streaming Attention-Based Models with Augmented Memory for End-To-End Speech Recognition. 8-14
- view
  authority control:
- export record
  dblp key:
  - conf/slt/WangYSX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/WangYSX21
Xiong Wang, Zhuoyuan Yao, Xian Shi, Lei Xie:
Cascade RNN-Transducer: Syllable Based Streaming On-Device Mandarin Speech Recognition with a Syllable-To-Character Converter. 15-21
- view
  authority control:
- export record
  dblp key:
  - conf/slt/TsunooK021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/TsunooK021
Emiru Tsunoo, Yosuke Kashiwagi, Shinji Watanabe:
Streaming Transformer Asr With Blockwise Synchronous Beam Search. 22-29
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ParkKS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ParkKS21
Jinhwan Park, Chanwoo Kim, Wonyong Sung:
Convolution-Based Attention Model With Positional Encoding For Streaming Speech Recognition On Embedded Devices. 30-37
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SterpuSH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SterpuSH21
George Sterpu, Christian Saam, Naomi Harte:
Learning to Count Words in Fluent Speech Enables Online Speech Recognition. 38-45
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Zhang0LSCPLYPSZ21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Zhang0LSCPLYPSZ21
Xiaohui Zhang, Frank Zhang, Chunxi Liu, Kjell Schubert, Julian Chan, Pradyot Prakash, Jun Liu, Ching-Feng Yeh, Fuchun Peng, Yatharth Saraf, Geoffrey Zweig:
Benchmarking LF-MMI, CTC And RNN-T Criteria For Streaming ASR. 46-51
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MahadeokarSLKSL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MahadeokarSLKSL21
Jay Mahadeokar, Yuan Shangguan, Duc Le, Gil Keren, Hang Su, Thong Le, Ching-Feng Yeh, Christian Fuegen, Michael L. Seltzer:
Alignment Restricted Streaming Recurrent Neural Network Transducer. 52-59
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZhengAO21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZhengAO21
Huahuan Zheng, Keyu An, Zhijian Ou:
Efficient Neural Architecture Search for End-to-End Speech Recognition Via Straight-Through Gradients. 60-67
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuPSS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuPSS21
Ke Hu, Ruoming Pang, Tara N. Sainath, Trevor Strohman:
Transformer Based Deliberation for Two-Pass Speech Recognition. 68-74
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LuoZLX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LuoZLX21
Haoneng Luo, Shiliang Zhang, Ming Lei, Lei Xie:
Simplified Self-Attention for Transformer-Based end-to-end Speech Recognition. 75-81
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LuoWCJX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LuoWCJX21
Jian Luo, Jianzong Wang, Ning Cheng, Guilin Jiang, Jing Xiao:
Multi-Quartznet: Multi-Resolution Convolution for Speech Recognition with Multi-Layer Feature Fusion. 82-88
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZhangL0R21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZhangL0R21
Shucong Zhang, Erfan Loweimi, Peter Bell, Steve Renals:
On The Usefulness of Self-Attention for Automatic Speech Recognition with Transformers. 89-96
- view
  authority control:
- export record
  dblp key:
  - conf/slt/PellegriniZM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/PellegriniZM21
Thomas Pellegrini, Romain Zimmer, Timothée Masquelier:
Low-Activity Supervised Convolutional Spiking Neural Networks Applied to Speech Commands Recognition. 97-103
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KongWWGZWX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KongWWGZWX21
Yuxiang Kong, Jian Wu, Quandong Wang, Peng Gao, Weiji Zhuang, Yujun Wang, Lei Xie:
Multi-Channel Automatic Speech Recognition Using Deep Complex Unet. 104-110
- view
  authority control:
- export record
  dblp key:
  - conf/slt/PraveenPKRB21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/PraveenPKRB21
Kiran Praveen, Abhishek Pandey, Deepak Kumar, Shakti Prasad Rath, Sandip Shriram Bapat:
Dynamically Weighted Ensemble Models for Automatic Speech Recognition. 111-116
- view
  authority control:
- export record
  dblp key:
  - conf/slt/NakadaiFT21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/NakadaiFT21
Kazuhiro Nakadai, Yosuke Fukumoto, Ryu Takeda:
Investigation of Node Pruning Criteria for Neural Networks Model Compression with Non-Linear Function and Non-Uniform Network Topology. 117-124
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Hsu0SH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Hsu0SH21
Wei-Ning Hsu, Ann Lee, Gabriel Synnaeve, Awni Y. Hannun:
Semi-Supervised end-to-end Speech Recognition via Local Prior Matching. 125-132
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuhLHMC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuhLHMC21
Jaesung Huh, Minjae Lee, Heesoo Heo, Seongkyu Mun, Joon Son Chung:
Metric Learning for Keyword Spotting. 133-140
- view
  authority control:
- export record
  dblp key:
  - conf/slt/GeorgescuMOCB21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/GeorgescuMOCB21
Alexandru-Lucian Georgescu, Cristian Manolache, Dan Oneata, Horia Cucu, Corneliu Burileanu:
Data-Filtering Methods for Self-Training of Automatic Speech Recognition Systems. 141-147
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SwarupCSTAG21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SwarupCSTAG21
Prakhar Swarup, Debmalya Chakrabarty, Ashtosh Sapru, Hitesh Tulsiani, Harish Arsikere, Sri Garimella:
Efficient Large Scale Semi-Supervised Learning for CTC Based Acoustic Models. 148-155
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RiviereD21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RiviereD21
Morgane Rivière, Emmanuel Dupoux:
Towards Unsupervised Learning of Speech Features in the Wild. 156-163
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShiSL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShiSL21
Bowen Shi, Shane Settle, Karen Livescu:
Whole-Word Segmental Speech Recognition with Acoustic Word Embeddings. 164-171
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Liu0LKSZ21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Liu0LKSZ21
Chunxi Liu, Frank Zhang, Duc Le, Suyoun Kim, Yatharth Saraf, Geoffrey Zweig:
Improving RNN Transducer Based ASR with Auxiliary Tasks. 172-179
- view
  authority control:
- export record
  dblp key:
  - conf/slt/CaoZFM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/CaoZFM21
Songjun Cao, Yike Zhang, Xiaobing Feng, Long Ma:
Improving Speech Recognition Accuracy of Local POI Using Geographical Models. 180-185
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChangLLL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChangLLL21
Heng-Jui Chang, Alexander H. Liu, Hung-yi Lee, Lin-Shan Lee:
End-to-End Whispered Speech Recognition with Frequency-Weighted Approaches and Pseudo Whisper Pre-training. 186-193
- view
  authority control:
- export record
  dblp key:
  - conf/slt/DuLLWQ21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/DuLLWQ21
Chenpeng Du, Hao Li, Yizhou Lu, Lan Wang, Yanmin Qian:
Data Augmentation for end-to-end Code-Switching Speech Recognition. 194-200
- view
  authority control:
- export record
  dblp key:
  - conf/slt/WuS021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/WuS021
Bin Wu, Sakriani Sakti, Satoshi Nakamura:
Incorporating Discriminative DPGMM Posteriorgrams for Low-Resource ASR. 201-208
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiZZL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiZZL21
Xinwei Li, Yuanyuan Zhang, Xiaodan Zhuang, Daben Liu:
Frame-Level Specaugment for Deep Convolutional Neural Networks in Hybrid ASR Systems. 209-214
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KharitonovRSWMD21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KharitonovRSWMD21
Eugene Kharitonov, Morgane Rivière, Gabriel Synnaeve, Lior Wolf, Pierre-Emmanuel Mazaré, Matthijs Douze, Emmanuel Dupoux:
Data Augmenting Contrastive Learning of Speech Representations in the Time Domain. 215-222
- view
  authority control:
- export record
  dblp key:
  - conf/slt/PandeyLWS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/PandeyLWS21
Ashutosh Pandey, Chunxi Liu, Yun Wang, Yatharth Saraf:
Dual Application of Speech Enhancement for Automatic Speech Recognition. 223-228
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiSH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiSH21
Ruizhi Li, Gregory Sell, Hynek Hermansky:
Two-Stage Augmentation and Adaptive CTC Fusion for Improved Robustness of Multi-Stream end-to-end ASR. 229-235
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HoriguchiFN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HoriguchiFN21
Shota Horiguchi, Yusuke Fujita, Kenji Nagamatsu:
Block-Online Guided Source Separation. 236-242
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MengPSGKLCZLG21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MengPSGKLCZLG21
Zhong Meng, Sarangarajan Parthasarathy, Eric Sun, Yashesh Gaur, Naoyuki Kanda, Liang Lu, Xie Chen, Rui Zhao, Jinyu Li, Yifan Gong:
Internal Language Model Estimation for Domain-Adaptive End-to-End Speech Recognition. 243-250
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LeKCMFS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LeKCMFS21
Duc Le, Gil Keren, Julian Chan, Jay Mahadeokar, Christian Fuegen, Michael L. Seltzer:
Deep Shallow Fusion for RNN-T Personalization. 251-257
- view
  authority control:
- export record
  dblp key:
  - conf/slt/OneataCSC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/OneataCSC21
Dan Oneata, Alexandru Caranica, Adriana Stan, Horia Cucu:
An Evaluation of Word-Level Confidence Estimation for End-to-End Automatic Speech Recognition. 258-265
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChiuC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChiuC21
Shih-Hsuan Chiu, Berlin Chen:
Innovative Bert-Based Reranking Language Models for Speech Recognition. 266-271
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SenAGV21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SenAGV21
Bipasha Sen, Aditya Agarwal, Mirishkar Sai Ganesh, Anil Kumar Vuppala:
Reed: An Approach Towards Quickly Bootstrapping Multilingual Acoustic Models. 272-279
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SongZWH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SongZWH21
Minguang Song, Yunxin Zhao, Shaojun Wang, Mei Han:
Word Similarity Based Label Smoothing in Rnnlm Training for ASR. 280-285
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KyeCK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KyeCK21
Seong Min Kye, Joon Son Chung, Hoirin Kim:
Supervised Attention for Speaker Recognition. 286-293
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KyeKC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KyeKC21
Seong Min Kye, Yoohwan Kwon, Joon Son Chung:
Cross Attentive Pooling for Speaker Verification. 294-300
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZhouZW21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZhouZW21
Tianyan Zhou, Yong Zhao, Jian Wu:
ResNeXt and Res2Net Structures for Speaker Verification. 301-307
- view
  authority control:
- export record
  dblp key:
  - conf/slt/CaiL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/CaiL21
Danwei Cai, Ming Li:
Embedding Aggregation for Far-Field Speaker Verification with Distributed Microphone Arrays. 308-315
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuangCPW21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuangCPW21
Yiling Huang, Yutian Chen, Jason Pelecanos, Quan Wang:
Synth2Aug: Cross-Domain Speaker Recognition with TTS Synthesized Speech. 316-322
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SahidullahSVLSK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SahidullahSVLSK21
Md. Sahidullah, Achintya Kumar Sarkar, Ville Vestman, Xuechen Liu, Romain Serizel, Tomi Kinnunen, Zheng-Hua Tan, Emmanuel Vincent:
UIAI System for Short-Duration Speaker Verification Challenge 2020. 323-329
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiZLH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiZLH21
Zheng Li, Miao Zhao, Lin Li, Qingyang Hong:
Multi-Feature Learning with Canonical Correlation Analysis Constraint for Text-Independent Speaker Verification. 330-337
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RaoPK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RaoPK21
Hrishikesh Rao, Kedar Phatak, Elie Khoury:
Improving Speaker Recognition with Quality Indicators. 338-343
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChiCWHC0L21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChiCWHC0L21
Po-Han Chi, Pei-Hung Chung, Tsung-Han Wu, Chun-Cheng Hsieh, Yen-Hao Chen, Shang-Wen Li, Hung-yi Lee:
Audio Albert: A Lite Bert for Self-Supervised Learning of Audio Representation. 344-350
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SuL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SuL21
Bo-Hao Su, Chi-Chun Lee:
A Conditional Cycle Emotion Gan for Cross Corpus Speech Emotion Recognition. 351-357
- view
  authority control:
- export record
  dblp key:
  - conf/slt/NeumannV21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/NeumannV21
Michael Neumann, Ngoc Thang Vu:
Investigations on audiovisual emotion recognition in noisy conditions. 358-364
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MeyerXF21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MeyerXF21
Patrick Meyer, Ziyi Xu, Tim Fingscheidt:
Improving Convolutional Recurrent Neural Networks for Speech Emotion Recognition. 365-372
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MacaryTER21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MacaryTER21
Manon Macary, Marie Tahon, Yannick Estève, Anthony Rousseau:
On the Use of Self-Supervised Pre-Trained Acoustic and Linguistic Features for Continuous Speech Emotion Recognition. 373-380
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KharePS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KharePS21
Aparna Khare, Srinivas Parthasarathy, Shiva Sundaram:
Self-Supervised Learning with Cross-Modal Transformers for Emotion Recognition. 381-388
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Lee21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Lee21
Shi-wook Lee:
Domain Generalization with Triplet Network for Cross-Corpus Speech Emotion Recognition. 389-396
- view
  authority control:
- export record
  dblp key:
  - conf/slt/BairdAMS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/BairdAMS21
Alice Baird, Shahin Amiriparian, Manuel Milling, Björn W. Schuller:
Emotion Recognition in Public Speaking Scenarios Utilising An LSTM-RNN Approach with Attention. 397-402
- view
  authority control:
- export record
  dblp key:
  - conf/slt/GuoZSHX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/GuoZSHX21
Haohan Guo, Shaofei Zhang, Frank K. Soong, Lei He, Lei Xie:
Conversational End-to-End TTS for Voice Agents. 403-409
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiuHWYY0M21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiuHWYY0M21
Liangqi Liu, Jiankun Hu, Zhiyong Wu, Song Yang, Songfan Yang, Jia Jia, Helen Meng:
Controllable Emphatic Speech Synthesis based on Forward Attention for Expressive Speech Synthesis. 410-414
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZhouS021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZhouS021
Kun Zhou, Berrak Sisman, Haizhou Li:
Vaw-Gan For Disentanglement And Recomposition Of Emotional Elements In Speech. 415-422
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LeiYX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LeiYX21
Yi Lei, Shan Yang, Lei Xie:
Fine-Grained Emotion Strength Transfer, Control and Prediction for Emotional Speech Synthesis. 423-430
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShechtmanFH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShechtmanFH21
Slava Shechtman, Raul Fernandez, David Haws:
Supervised and unsupervised approaches for controlling narrow lexical focus in sequence-to-sequence speech synthesis. 431-437
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SunWCPZKX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SunWCPZKX21
Aolan Sun, Jianzong Wang, Ning Cheng, Huayi Peng, Zhen Zeng, Lingwei Kong, Jing Xiao:
GraphPB: Graphical Representations of Prosody Boundary in Speech Synthesis. 438-445
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChienL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChienL21
Chung-Ming Chien, Hung-yi Lee:
Hierarchical Prosody Modeling for Non-Autoregressive Speech Synthesis. 446-453
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuBPRML21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuBPRML21
Qiong Hu, Tobias Bleisch, Petko Petkov, Tuomo Raitio, Erik Marchi, Varun Lakshminarasimhan:
Whispered and Lombard Neural Speech Synthesis. 454-461
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChoiJK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChoiJK21
Yeunju Choi, Youngmoon Jung, Hoirin Kim:
Neural MOS Prediction for Synthesized Speech Using Multi-Task Learning with Spoofing Detection and Spoofing Type Classification. 462-469
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SongYHKKK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SongYHKKK21
Eunwoo Song, Ryuichi Yamamoto, Min-Jae Hwang, Jin-Seob Kim, Ohsung Kwon, Jae-Min Kim:
Improved Parallel Wavegan Vocoder with Perceptually Weighted Spectrogram Loss. 470-476
- view
  authority control:
- export record
  dblp key:
  - conf/slt/AiLWYL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/AiLWYL21
Yang Ai, Haoyu Li, Xin Wang, Junichi Yamagishi, Zhen-Hua Ling:
Denoising-and-Dereverberation Hierarchical Neural Vocoder for Robust Waveform Generation. 477-484
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZengWCX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZengWCX21
Zhen Zeng, Jianzong Wang, Ning Cheng, Jing Xiao:
MelGlow: Efficient Waveform Generative Network Based On Location-Variable Convolution. 485-491
- view
  authority control:
- export record
  dblp key:
  - conf/slt/YangYLF0X21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/YangYLF0X21
Geng Yang, Shan Yang, Kai Liu, Peng Fang, Wei Chen, Lei Xie:
Multi-Band Melgan: Faster Waveform Generation For High-Quality Text-To-Speech. 492-498
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiOLH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiOLH21
Song Li, Beibei Ouyang, Lin Li, Qingyang Hong:
Lightspeech: Lightweight Non-Autoregressive Multi-Speaker Text-To-Speech. 499-506
- view
  authority control:
- export record
  dblp key:
  - conf/slt/DuTX021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/DuTX021
Hongqiang Du, Xiaohai Tian, Lei Xie, Haizhou Li:
Optimizing Voice Conversion Network with Cycle Consistency Loss of Speaker Identity. 507-513
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuangLL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuangLL21
Tzu-hsien Huang, Jheng-Hao Lin, Hung-yi Lee:
How Far Are We from Robust Voice Conversion: A Survey. 514-521
- view
  authority control:
- export record
  dblp key:
  - conf/slt/XueYLXL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/XueYLXL21
Heyang Xue, Shan Yang, Yi Lei, Lei Xie, Xiulin Li:
Learn2Sing: Target Speaker Singing Voice Synthesis by Learning from a Singing Teacher. 522-529
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShibataZS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShibataZS21
Hayato Shibata, Mingxin Zhang, Takahiro Shinozaki:
Unsupervised Acoustic-to-Articulatory Inversion Neural Network Learning Based on Deterministic Policy Gradient. 530-537
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChenK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChenK21
Tianxiang Chen, Elie Khoury:
Spoofprint: A New Paradigm for Spoofing Attacks Detection. 538-543
- view
  authority control:
- export record
  dblp key:
  - conf/slt/GaoLRS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/GaoLRS21
Yang Gao, Jiachen Lian, Bhiksha Raj, Rita Singh:
Detection and Evaluation of Human and Machine Generated Speech in Spoofing Attacks on Automatic Speaker Verification Systems. 544-551
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuangLLL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuangLLL21
Chien-yu Huang, Yist Y. Lin, Hung-yi Lee, Lin-Shan Lee:
Defending Your Voice: Adversarial Attack on Voice Conversion. 552-559
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KaiTSK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KaiTSK21
Hiroto Kai, Shinnosuke Takamichi, Sayaka Shiota, Hitoshi Kiya:
Lightweight Voice Anonymization Based on Data-Driven Optimization of Cascaded Voice Modification Modules. 560-566
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KwonHHLC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KwonHHLC21
Youngki Kwon, Hee Soo Heo, Jaesung Huh, Bong-Jin Lee, Joon Son Chung:
Look Who's Not Talking. 567-573
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiK0W21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiK0W21
Qiujia Li, Florian L. Kreyssig, Chao Zhang, Philip C. Woodland:
Discriminative Neural Clustering for Speaker Diarisation. 574-581
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RajHK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RajHK21
Desh Raj, Zili Huang, Sanjeev Khudanpur:
Multi-Class Spectral Clustering with Overlaps for Speaker Diarization. 582-589
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Krishnamachari021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Krishnamachari021
Suchitra Krishnamachari, Manoj Kumar, So Hyun Kim, Catherine Lord, Shrikanth Narayanan:
Developing Neural Representations for Robust Child-Adult Diarization. 590-597
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KimHCL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KimHCL21
You Jin Kim, Hee Soo Heo, Soo-Whan Chung, Bong-Jin Lee:
End-To-End Lip Synchronisation Based on Pattern Classification. 598-605
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LuoWCJX21a
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LuoWCJX21a
Jian Luo, Jianzong Wang, Ning Cheng, Guilin Jiang, Jing Xiao:
End-To-End Silent Speech Recognition with Acoustic Sensing. 606-612
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SantosAWX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SantosAWX21
Timothy Israel Santos, Andrew Abel, Nick Wilson, Yan Xu:
Speaker-Independent Visual Speech Recognition with the Inception V3 Model. 613-620
- view
  authority control:
- export record
  dblp key:
  - conf/slt/GhorbaniGSL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/GhorbaniGSL21
Shahram Ghorbani, Yashesh Gaur, Yu Shi, Jinyu Li:
Listen, Look and Deliberate: Visual Context-Aware Speech Recognition Using Pre-Trained Text-Video Representations. 621-628
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SaekiMKOK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SaekiMKOK21
Mao Saeki, Yoichi Matsuyama, Satoshi Kobashikawa, Tetsuji Ogawa, Tetsunori Kobayashi:
Analysis of Multimodal Features for Speaking Proficiency Scoring in an Interview Dialogue. 629-635
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ParthasarathyS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ParthasarathyS21
Srinivas Parthasarathy, Shiva Sundaram:
Detecting Expressions with Multimodal Transformers. 636-643
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HGDR21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HGDR21
Muralikrishna H, Shikha Gupta, Dileep Aroor Dinesh, Padmanabhan Rajan:
Noise-Robust Spoken Language Identification Using Language Relevance Factor Based Embedding. 644-651
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ValkA21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ValkA21
Jörgen Valk, Tanel Alumäe:
VOXLINGUA107: A Dataset for Spoken Language Recognition. 652-658
- view
  authority control:
- export record
  dblp key:
  - conf/slt/TongHMJPCRM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/TongHMJPCRM21
Xiaosu Tong, Che-Wei Huang, Sri Harish Mallidi, Shaun Joseph, Sonal Pareek, Chander Chandak, Ariya Rastrow, Roland Maas:
Streaming ResLSTM with Causal Mean Aggregation for Device-Directed Utterance Detection. 659-664
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KangY021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KangY021
Fang Kang, Feiran Yang, Jun Yang:
Real-Time Independent Vector Analysis with a Deep-Learning-Based Source Model. 665-669
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MeghananiSR21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MeghananiSR21
Amit Meghanani, Chandran Savithri Anoop, A. G. Ramakrishnan:
An Exploration of Log-Mel Spectrogram and MFCC Features for Alzheimer's Dementia Recognition from Spontaneous Speech. 670-677
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ParkR21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ParkR21
Su Ji Park, Alan Rozet:
Film Quality Prediction Using Acoustic, Prosodic and Lexical Cues. 678-684
- view
  authority control:
- export record
  dblp key:
  - conf/slt/FengBE21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/FengBE21
Yulan Feng, Alan W. Black, Maxine Eskénazi:
Towards Automatic Route Description Unification in Spoken Dialog Systems. 685-692
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KhanalJB21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KhanalJB21
Subash Khanal, Michael T. Johnson, Narjes Bozorg:
Articulatory Comparison of L1 and L2 Speech for Mispronunciation Diagnosis. 693-697
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShenYSMS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShenYSMS21
Yang Shen, Ayano Yasukagawa, Daisuke Saito, Nobuaki Minematsu, Kazuya Saito:
Optimized Prediction of Fluency of L2 English Based on Interpretable Network Using Quantity of Phonation and Quality of Pronunciation. 698-704
- view
  authority control:
- export record
  dblp key:
  - conf/slt/WangEQM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/WangEQM21
Xinhao Wang, Keelan Evanini, Yao Qian, Matthew Mulholland:
Automated Scoring of Spontaneous Speech from Young Learners of English Using Transformers. 705-712
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LinWDF21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LinWDF21
Binghuai Lin, Liyuan Wang, Hongwei Ding, Xiaoli Feng:
Improving L2 English Rhythm Evaluation with Automatic Sentence Stress Detection. 713-719
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SudroD0P21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SudroD0P21
Protima Nomo Sudro, Rohan Kumar Das, Rohit Sinha, S. R. Mahadeva Prasanna:
Enhancing the Intelligibility of Cleft Lip and Palate Speech Using Cycle-Consistent Adversarial Networks. 720-727
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShekarBH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShekarBH21
Ram C. M. C. Shekar, Chelzy Belitz, John H. L. Hansen:
Development of CNN-Based Cochlear Implant and Normal Hearing Sound Recognition Models Using Natural and Auralized Environmental Audio. 728-733
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiAY21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiAY21
Haoyu Li, Yang Ai, Junichi Yamagishi:
Enhancing Low-Quality Voice Recordings Using Disentangled Channel Factor and Neural Waveform Model. 734-741
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShiCTL0H21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShiCTL0H21
Ying Shi, Haolin Chen, Zhiyuan Tang, Lantian Li, Dong Wang, Jiqing Han:
Can We Trust Deep Speech Prior? 742-749
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShiH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShiH21
Yanpei Shi, Thomas Hain:
Contextual Joint Factor Acoustic Embeddings. 750-757
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ShiH21a
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ShiH21a
Yanpei Shi, Thomas Hain:
Supervised Speaker Embedding De-Mixing in Two-Speaker Environment. 758-765
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiuYXWZC021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiuYXWZC021
Jianming Liu, Meng Yu, Yong Xu, Chao Weng, Shi-Xiong Zhang, Lianwu Chen, Dong Yu:
Neural Mask based Multi-channel Convolutional Beamforming for Joint Dereverberation, Echo Cancellation and Denoising. 766-770
- view
  authority control:
- export record
  dblp key:
  - conf/slt/JayasimhaP21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/JayasimhaP21
Aditya Jayasimha, Periyasamy Paramasivam:
Personalizing Speech Start Point and End Point Detection in ASR Systems from Speaker Embeddings. 771-777
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SatoOKDNA21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SatoOKDNA21
Hiroshi Sato, Tsubasa Ochiai, Keisuke Kinoshita, Marc Delcroix, Tomohiro Nakatani, Shoko Araki:
Multimodal Attention Fusion for Target Speaker Extraction. 778-784
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Li0ZSCKHHBC021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Li0ZSCKHHBC021
Chenda Li, Jing Shi, Wangyou Zhang, Aswin Shanmugam Subramanian, Xuankai Chang, Naoyuki Kamo, Moto Hira, Tomoki Hayashi, Christoph Böddeker, Zhuo Chen, Shinji Watanabe:
ESPnet-SE: End-To-End Speech Enhancement and Separation Toolkit Designed for ASR Integration. 785-792
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZorilaLD21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZorilaLD21
Catalin Zorila, Mohan Li, Rama Doddipatla:
An Investigation into the Multi-channel Time Domain Speaker Extraction Network. 793-800
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LamWSY21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LamWSY21
Max W. Y. Lam, Jun Wang, Dan Su, Dong Yu:
Effective Low-Cost Time-Domain Audio Separation Using Globally Attentive Locally Recurrent Networks. 801-808
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KandaCGWMCY21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KandaCGWMCY21
Naoyuki Kanda, Xuankai Chang, Yashesh Gaur, Xiaofei Wang, Zhong Meng, Zhuo Chen, Takuya Yoshioka:
Investigation of End-to-End Speaker-Attributed ASR for Continuous Multi-Talker Recordings. 809-816
- view
  authority control:
- export record
  dblp key:
  - conf/slt/NiXYWZYM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/NiXYWZYM21
Zhaoheng Ni, Yong Xu, Meng Yu, Bo Wu, Shi-Xiong Zhang, Dong Yu, Michael I. Mandel:
WPD++: An Improved Neural Beamformer for Simultaneous Speech Separation and Dereverberation. 817-824
- view
  authority control:
- export record
  dblp key:
  - conf/slt/0004HM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/0004HM21
Yi Luo, Cong Han, Nima Mesgarani:
Distortion-Controlled Training for end-to-end Reverberant Speech Separation with Auxiliary Autoencoding Loss. 825-832
- view
  authority control:
- export record
  dblp key:
  - conf/slt/WangKGCMY21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/WangKGCMY21
Xiaofei Wang, Naoyuki Kanda, Yashesh Gaur, Zhuo Chen, Zhong Meng, Takuya Yoshioka:
Exploring End-to-End Multi-Channel ASR with Bias Information for Meeting Transcription. 833-840
- view
  authority control:
- export record
  dblp key:
  - conf/slt/XueHF0GN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/XueHF0GN21
Yawen Xue, Shota Horiguchi, Yusuke Fujita, Shinji Watanabe, Paola García, Kenji Nagamatsu:
Online End-To-End Neural Diarization with Speaker-Tracing Buffer. 841-848
- view
  authority control:
- export record
  dblp key:
  - conf/slt/TakashimaF0HGN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/TakashimaF0HGN21
Yuki Takashima, Yusuke Fujita, Shinji Watanabe, Shota Horiguchi, Paola García, Kenji Nagamatsu:
End-to-End Speaker Diarization Conditioned on Speech Activity and Overlap Detection. 849-856
- view
  authority control:
- export record
  dblp key:
  - conf/slt/FuWHXX21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/FuWHXX21
Yihui Fu, Jian Wu, Yanxin Hu, Mengtao Xing, Lei Xie:
DESNet: A Multi-Channel Network for Simultaneous Speech Dereverberation, Enhancement and Separation. 857-864
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LiLHLYZDKBQ0C21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LiLHLYZDKBQ0C21
Chenda Li, Yi Luo, Cong Han, Jinyu Li, Takuya Yoshioka, Tianyan Zhou, Marc Delcroix, Keisuke Kinoshita, Christoph Böddeker, Yanmin Qian, Shinji Watanabe, Zhuo Chen:
Dual-Path RNN for Long Recording Speech Separation. 865-872
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChiuNHPZJPSNCW21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChiuNHPZJPSNCW21
Chung-Cheng Chiu, Arun Narayanan, Wei Han, Rohit Prabhavalkar, Yu Zhang, Navdeep Jaitly, Ruoming Pang, Tara N. Sainath, Patrick Nguyen, Liangliang Cao, Yonghui Wu:
RNN-T Models Fail to Generalize to Out-of-Domain Audio: Causes and Solutions. 873-880
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RajGH0PSK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RajGH0PSK21
Desh Raj, Leibny Paola García-Perera, Zili Huang, Shinji Watanabe, Daniel Povey, Andreas Stolcke, Sanjeev Khudanpur:
DOVER-Lap: A Method for Combining Overlap-Aware Diarization Outputs. 881-888
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZmolikovaDBNC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZmolikovaDBNC21
Katerina Zmolíková, Marc Delcroix, Lukás Burget, Tomohiro Nakatani, Jan Honza Cernocký:
Integration of Variational Autoencoder and Spatial Clustering for Adaptive Multi-Channel Neural Speech Separation. 889-896
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RajDCEHH0DYLKLW21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RajDCEHH0DYLKLW21
Desh Raj, Pavel Denisov, Zhuo Chen, Hakan Erdogan, Zili Huang, Maokui He, Shinji Watanabe, Jun Du, Takuya Yoshioka, Yi Luo, Naoyuki Kanda, Jinyu Li, Scott Wisdom, John R. Hershey:
Integration of Speech Separation, Diarization, and Recognition for Multi-Speaker Meetings: System Description, Comparison, and Analysis. 897-904
- view
  authority control:
- export record
  dblp key:
  - conf/slt/WangEWWR0CH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/WangEWWR0CH21
Zhong-Qiu Wang, Hakan Erdogan, Scott Wisdom, Kevin W. Wilson, Desh Raj, Shinji Watanabe, Zhuo Chen, John R. Hershey:
Sequential Multi-Frame Neural Beamforming for Speech Separation and Enhancement. 905-911
- view
  authority control:
- export record
  dblp key:
  - conf/slt/0002DLTL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/0002DLTL21
Li Chai, Jun Du, Diyuan Liu, Yanhui Tu, Chin-Hui Lee:
Acoustic Modeling for Multi-Array Conversational Speech Recognition in the Chime-6 Challenge. 912-918
- view
  authority control:
- export record
  dblp key:
  - conf/slt/JacobsMK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/JacobsMK21
Christiaan Jacobs, Yevgen Matusevych, Herman Kamper:
Acoustic Word Embeddings for Zero-Resource Languages Using Self-Supervised Contrastive Learning and Multilingual Adaptation. 919-926
- view
  authority control:
- export record
  dblp key:
  - conf/slt/StadenK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/StadenK21
Lisa van Staden, Herman Kamper:
A Comparison of Self-Supervised Speech Representations As Input Features For Unsupervised Acoustic Word Embeddings. 927-934
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HuSL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HuSL21
Yushi Hu, Shane Settle, Karen Livescu:
Acoustic Span Embeddings for Multilingual Query-by-Example Search. 935-942
- view
  authority control:
- export record
  dblp key:
  - conf/slt/UnluA21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/UnluA21
Merve Ünlü, Ebru Arisoy:
Uncertainty-Aware Representations for Spoken Question Answering. 943-949
- view
  authority control:
- export record
  dblp key:
  - conf/slt/BaharBSN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/BaharBSN21
Parnia Bahar, Tobias Bieschke, Ralf Schlüter, Hermann Ney:
Tight Integrated End-to-End Training for Cascaded Speech Translation. 950-957
- view
  authority control:
- export record
  dblp key:
  - conf/slt/KanoS021
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/KanoS021
Takatomo Kano, Sakriani Sakti, Satoshi Nakamura:
Transformer-Based Direct Speech-To-Speech Translation with Transcoder. 958-965
- view
  authority control:
- export record
  dblp key:
  - conf/slt/0007KGLAG21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/0007KGLAG21
Manoj Kumar, Varun Kumar, Hadrien Glaude, Cyprien de Lichy, Aman Alok, Rahul Gupta:
Protoda: Efficient Transfer Learning for Few-Shot Intent Classification. 966-972
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SenayIH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SenayIH21
Grégory Senay, Badr Youbi Idrissi, Marine Haziza:
VirAAL: Virtual Adversarial Active Learning for NLU. 973-980
- view
  authority control:
- export record
  dblp key:
  - conf/slt/NamazifarTH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/NamazifarTH21
Mahdi Namazifar, Gökhan Tür, Dilek Hakkani-Tür:
Warped Language Models for Noise Robust Language Understanding. 981-988
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Shivakumar0GN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Shivakumar0GN21
Prashanth Gurunath Shivakumar, Naveen Kumar, Panayiotis G. Georgiou, Shrikanth Narayanan:
RNN Based Incremental Online Spoken Language Understanding. 989-996
- view
  authority control:
- export record
  dblp key:
  - conf/slt/Wangh21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/Wangh21
Pu Wang, Hugo Van hamme:
A Light Transformer For Speech-To-Intent Applications. 997-1003
- view
  authority control:
- export record
  dblp key:
  - conf/slt/0001KDZA21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/0001KDZA21
Shang-Wen Li, Jason Krone, Shuyan Dong, Yi Zhang, Yaser Al-Onaizan:
Meta Learning to Classify Intent and Slot Labels with Noisy Few Shot Examples. 1004-1011
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MasumuraMITTO21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MasumuraMITTO21
Ryo Masumura, Naoki Makishima, Mana Ihori, Akihiko Takashima, Tomohiro Tanaka, Shota Orihashi:
Large-Context Conversational Representation Learning: Self-Supervised Learning For Conversational Documents. 1012-1019
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ZhouCHYL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ZhouCHYL21
Zhengyu Zhou, In Gyu Choi, Yongliang He, Vikas Yadav, Chin-Hui Lee:
Using Paralinguistic Information to Disambiguate User Intentions for Distinguishing Phrase Structure and Sarcasm in Spoken Dialog Systems. 1020-1027
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChangL0HZH21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChangL0HZH21
Ting-Yun Chang, Yang Liu, Karthik Gopalakrishnan, Behnam Hedayatnia, Pei Zhou, Dilek Hakkani-Tür:
Go Beyond Plain Fine-Tuning: Improving Pretrained Models for Social Commonsense. 1028-1035
- view
  authority control:
- export record
  dblp key:
  - conf/slt/LuLZZ21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/LuLZZ21
Zexin Lu, Jing Li, Yingyi Zhang, Haisong Zhang:
Getting Your Conversation on Track: Estimation of Residual Life for Conversations. 1036-1043
- view
  authority control:
- export record
  dblp key:
  - conf/slt/TakatsuOMHFK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/TakatsuOMHFK21
Hiroaki Takatsu, Mayu Okuda, Yoichi Matsuyama, Hiroshi Honda, Shinya Fujie, Tetsunori Kobayashi:
Personalized Extractive Summarization for a News Dialogue System. 1044-1051
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RutowskiSHLOC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RutowskiSHLOC21
Tomek Rutowski, Elizabeth Shriberg, Amir Harati, Yang Lu, Ricardo Oliveira, Piotr Chlebek:
Cross-Demographic Portability of Deep NLP-Based Depression Models. 1052-1057
- view
  authority control:
- export record
  dblp key:
  - conf/slt/ChenLL21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/ChenLL21
Huan-Yu Chen, Yun-Shao Lin, Chi-Chun Lee:
Through the Words of Viewers: Using Comment-Content Entangled Network for Humor Impression Recognition. 1058-1064
- view
  authority control:
- export record
  dblp key:
  - conf/slt/BaharBN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/BaharBN21
Parnia Bahar, Christopher Brix, Hermann Ney:
Two-Way Neural Machine Translation: A Proof of Concept for Bidirectional Translation Modeling Using a Two-Dimensional Grid. 1065-1070
- view
  authority control:
- export record
  dblp key:
  - conf/slt/EppsUK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/EppsUK21
Maya Epps, Juan Uribe, Mandy Korpusik:
A New Dataset for Natural Language Understanding of Exercise Logs in a Food and Fitness Spoken Dialogue System. 1071-1078
- view
  authority control:
- export record
  dblp key:
  - conf/slt/SemenzinHSKC21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/SemenzinHSKC21
Chiara Semenzin, Lisa Hamrick, Amanda Seidl, Bridgette Kelleher, Alejandrina Cristià:
Towards Large-Scale Data Annotation of Audio from Wearables: Validating Zooniverse Annotations of Infant Vocalization Types. 1079-1085
- view
  authority control:
- export record
  dblp key:
  - conf/slt/MariniVCZSFDDF21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/MariniVCZSFDDF21
Marco Marini, Mauro Viganò, Massimo Corbo, Marina Zettin, Gloria Simoncini, Bruno Fattori, Clelia D'Anna, Massimiliano Donati, Luca Fanucci:
IDEA: An Italian Dysarthric Speech Database. 1086-1093
- view
  authority control:
- export record
  dblp key:
  - conf/slt/HossainS21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/HossainS21
Delowar Hossain, Yoshinao Sato:
Efficient corpus design for wake-word detection. 1094-1100
- view
  authority control:
- export record
  dblp key:
  - conf/slt/FuYHWWYZXHBMO21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/FuYHWWYZXHBMO21
Yihui Fu, Zhuoyuan Yao, Weipeng He, Jian Wu, Xiong Wang, Zhanheng Yang, Shimin Zhang, Lei Xie, Dongyan Huang, Hui Bu, Petr Motlícek, Jean-Marc Odobez:
IEEE SLT 2021 Alpha-Mini Speech Challenge: Open Datasets, Tracks, Rules and Baselines. 1101-1108
- view
  authority control:
- export record
  dblp key:
  - conf/slt/RibeiroSZEWRR21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/RibeiroSZEWRR21
Manuel Sam Ribeiro, Jennifer Sanger, Jing-Xuan Zhang, Aciel Eshky, Alan Wrench, Korin Richmond, Steve Renals:
Tal: A Synchronised Multi-Speaker Corpus of Ultrasound Tongue Imaging, Audio, and Lip Videos. 1109-1116
- view
  authority control:
- export record
  dblp key:
  - conf/slt/YuYWAXOLLM21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/YuYWAXOLLM21
Fan Yu, Zhuoyuan Yao, Xiong Wang, Keyu An, Lei Xie, Zhijian Ou, Bo Liu, Xiulin Li, Guanqiong Miao:
The SLT 2021 Children Speech Recognition Challenge: Open Datasets, Rules and Baselines. 1117-1123

manage site settings

To protect your privacy, all features that rely on external API calls from your browser are turned off by default. You need to opt-in for them to become active. All settings here will be stored as cookies with your web browser. For more information see our F.A.Q.