Shigeki Karita

引用先

	すべて	2019 年以来
引用	3428	3371
h 指標	19	19
i10 指標	25	25

860

430

215

645

2017201820192020202120222023202410 37 188 442 776 743 843 375

共著者

Shinji WatanabeCarnegie Mellon University確認したメールアドレス: cmu.edu
Tomohiro NakataniNTT Communication Science Laboratories確認したメールアドレス: ieee.org
Marc DelcroixNTT Communication Science Laboratories確認したメールアドレス: ieee.org
Tomoki HayashiHuman Dataware Lab. Co., Ltd., Nagoya University確認したメールアドレス: g.sp.m.is.nagoya-u.ac.jp
Atsunori OgawaNTT Communication Science Laboratories確認したメールアドレス: ieee.org
Takaaki HoriApple確認したメールアドレス: apple.com
Hirofumi InagumaFundamental AI Research (FAIR) at Meta確認したメールアドレス: meta.com
Nanxin ChenMember of Technical Staff確認したメールアドレス: openai.com
Michiel BacchianiGoogle Inc.確認したメールアドレス: google.com
Jiro NishitobaRetrieva, Inc.確認したメールアドレス: retrieva.jp
Wangyou ZhangPh.D. candidate, Department of Computer Science and Engineering, Shanghai Jiao Tong University確認したメールアドレス: sjtu.edu.cn
Jahn HeymannApplied Scientist @ Amazon確認したメールアドレス: amazon.com
Yuma KoizumiGoogle確認したメールアドレス: google.com
Ryuichi YamamotoLY Corporation確認したメールアドレス: lycorp.co.jp
Xiaofei WangMicrosoft確認したメールアドレス: jhu.edu
Ziyan JiangAmazon AGI確認したメールアドレス: amazon.com
Keisuke KinoshitaResearch Scientist at Google確認したメールアドレス: ieee.org
Tomoharu IwataNTT確認したメールアドレス: hco.ntt.co.jp
Yotaro KuboGoogle Speech確認したメールアドレス: ieee.org
Nobutaka ItoUniversity of Tokyo, Japan (formerly NTT)確認したメールアドレス: k.u-tokyo.ac.jp

フォロー

Shigeki Karita

Google

確認したメールアドレス: google.com - ホームページ

Machine Learning Speech Recognition


タイトル引用回数順公開年順タイトル順	引用先引用先	年
ESPnet: End-to-end speech processing toolkit S Watanabe, T Hori, S Karita, T Hayashi, J Nishitoba, Y Unno, NEY Soplin, ... arXiv preprint arXiv:1804.00015, 2018	1548	2018
A comparative study on transformer vs rnn in speech applications S Karita, N Chen, T Hayashi, T Hori, H Inaguma, Z Jiang, M Someki, ... 2019 IEEE automatic speech recognition and understanding workshop (ASRU …, 2019	802	2019
Improving Transformer-based End-to-End Speech Recognition with Connectionist Temporal Classification and Language Model Integration S Karita, NEY Soplin, S Watanabe, M Delcroix, A Ogawa, T Nakatani Proc. Interspeech 2019, 1408-1412, 2019	254	2019
ESPnet-ST: All-in-one speech translation toolkit H Inaguma, S Kiyono, K Duh, S Karita, NEY Soplin, T Hayashi, ... arXiv preprint arXiv:2004.10234, 2020	162	2020
Semi-Supervised End-to-End Speech Recognition S Karita, S Watanabe, T Iwata, A Ogawa, M Delcroix INTERSPEECH, 2-6, 2018	79	2018
Frame-by-frame closed-form update for mask-based adaptive MVDR beamforming T Higuchi, K Kinoshita, N Ito, S Karita, T Nakatani IEEE International Conference on Acoustics, Speech and Signal Processing, 2018	63	2018
The 2020 espnet update: new features, broadened applications, performance improvements, and future plans S Watanabe, F Boyer, X Chang, P Guo, T Hayashi, Y Higuchi, T Hori, ... 2021 IEEE Data Science and Learning Workshop (DSLW), 1-6, 2021	53	2021
Semi-Supervised End-to-End Speech Recognition Using Text-to-Speech and Autoencoders S Karita, S Watanabe, T Iwata, M Delcroix, A Ogawa, T Nakatani IEEE International Conference on Acoustics, Speech, and Signal Processing, 2019	50	2019
DF-Conformer: Integrated architecture of Conv-TasNet and Conformer using linear complexity self-attention for speech enhancement Y Koizumi, S Karita, S Wisdom, H Erdogan, JR Hershey, L Jones, ... 2021 IEEE Workshop on Applications of Signal Processing to Audio and …, 2021	46	2021
Auxiliary feature based adaptation of end-to-end ASR systems M Delcroix, S Watanabe, A Ogawa, S Karita, T Nakatani INTERSPEECH, 2018	46	2018
Far-field speech recognition using CNN-DNN-HMM with convolution in time T Yoshioka, S Karita, T Nakatani 2015 IEEE international conference on acoustics, speech and signal …, 2015	39	2015
Rescoring n-best speech recognition list based on one-on-one hypothesis comparison using encoder-classifier model A Ogawa, M Delcroix, S Karita, T Nakatani IEEE International Conference on Acoustics, Speech and Signal Processing, 2018	27	2018
Sequence training of encoder-decoder model using policy gradient for end-to-end speech recognition S Karita, A Ogawa, M Delcroix, T Nakatani IEEE International Conference on Acoustics, Speech and Signal Processing, 2018	27	2018
Self-Distillation for Improving CTC-Transformer-Based ASR Systems. T Moriya, T Ochiai, S Karita, H Sato, T Tanaka, T Ashihara, R Masumura, ... INTERSPEECH, 546-550, 2020	24	2020
Knowledge transfer from large-scale pretrained language models to end-to-end speech recognizers Y Kubo, S Karita, M Bacchiani ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and …, 2022	23	2022
End-to-End SpeakerBeam for Single Channel Target Speech Recognition. M Delcroix, S Watanabe, T Ochiai, K Kinoshita, S Karita, A Ogawa, ... Interspeech, 451-455, 2019	23	2019
Espnet: End-to-end speech processing toolkit. arXiv 2018 S Watanabe, T Hori, S Karita, T Hayashi, J Nishitoba, Y Unno, NEY Soplin, ... arXiv preprint arXiv:1804.00015, 2018	20	2018
Online meeting recognition in noisy environments with time-frequency mask based MVDR beamforming S Araki, N Ito, M Delcroix, A Ogawa, K Kinoshita, T Higuchi, T Yoshioka, ... 2017 Hands-free Speech Communications and Microphone Arrays (HSCMA), 16-20, 2017	20	2017
Libritts-r: A restored multi-speaker text-to-speech corpus Y Koizumi, H Zen, S Karita, Y Ding, K Yatabe, N Morioka, M Bacchiani, ... arXiv preprint arXiv:2305.18802, 2023	19	2023
Learning device, learning method, and learning program A Ogawa, M Delcroix, S Karita, T Nakatani US Patent App. 16/966,056, 2020	19	2020

現在システムで処理を実行できません。しばらくしてからもう一度お試しください。

論文 1–20

年間引用数

重複した引用

結合された引用

共著者を追加共著者

フォロー

引用先

共著者