早稲田大学 知覚情報システム・メディアインテリジェンス研究室

アーカイブ 2022年

招待講演

2023/03

小川哲司,斎藤奨,中野鐵兵,“畜産農家が納得して意思決定するための繁殖牛の映像監視モデリング ,” 第10回計測自動制御学会制御部門マルチシンポジウム ,企画セッション:農・林・畜・水産業への計測制御技術応用,March 2023. [招待講演]

2022/12

鈴木駿吾, “英会話学習におけるInteLLAの可能性, ” ワールド・ファミリー バイリンガル サイエンス研究所第2回メディア向けセミナー「最先端のテクノロジーを活用した英語教育 〜研究者・教師・メディアが共に考える会〜」, Dec. 2022

2022/11

松山洋一,“人とAIの共進化と融合 ~英語教育での先端実践事例から語る~,” オンラインラーニングフォーラム2022,Nov. 2022.

2022/06

松山洋一,鈴木駿吾,“人と共に成長するオンライン語学学習支援AIシステム InteLLA,” ワールド・ファミリー バイリンガル サイエンス研究所第1回メディア向けセミナー「VRやAIを活用した最先端の英語学習法」,June 2022.

2022/06

Shungo Suzuki, “The role of creativity in L2 speech production: The importance of both cognitive and social-personality approaches,” International Online Symposium on Individual Differences and Creativity in L2 learning, Universidad de La Rioja, Spain, June 2022.

学術論文

2023/03

松山洋一,佐伯真於,高津弘明,松浦瑠希,倉田楓真,鈴木駿吾,“学習者の能力を引き出す言語運用能力判定 エージェントInteLLAの開発と運用,” 日本音響学会誌 79 巻 3 号(2023),小特集—第二言語習得・テストの目指すべき姿とその実現に向けた音声言語処理技術の可能性—,pp. 162–169,March 2023.

2023/03

鈴木駿吾,“第二言語スピーキング能力の機能的達成度は自動判定できるか?,” 日本音響学会誌 79 巻 3 号(2023),小特集—第二言語習得・テストの目指すべき姿とその実現に向けた音声言語処理技術の可能性—,pp. 177-183,March 2023.

2022/10

小川哲司,斎藤奨,中野鐵兵,“畜産農家の意思決定支援AI導入に向けた取組み,” ITUジャーナル,vol.52,no.10,pp.10-13,Oct. 2022.

2022/10

小川哲司,“映像監視に基づく繁殖牛の分娩予兆検知~ユーザが納得して意思決定できるような映像監視システムをどう構築し運用するか? ,” 計測と制御・特集「農・林・畜・水産業に挑む画像センシング技術 」,vol.61,no.10,pp.746-749,Oct. 2022.[DOI]

国際会議

2023/01

Jin Sakuma, Shinya Fujie, Tetsunori Kobayashi, “Response Timing Estimation for Spoken Dialog Systems Based on Syntactic Completeness Prediction,” 2022 IEEE Spoken Language Technology Workshop (SLT), pp. 369-374, Jan. 2023. [DOI]

2022/12

Ryo Yanagisawa, Susumu Saito, Teppei Nakano, Tetsunori Kobayashi, Tetsuji Ogawa, “PostMe: Unsupervised Dynamic Microtask Posting For Efficient and Reliable Crowdsourcing,” Proc. The 2022 IEEE International Conference on Big Data Workshop HMData 2022, pp.4039-4044, Dec. 2022. [DOI]

2022/12

Yosuke Higuchi, Brian Yan, Siddhant Arora, Tetsuji Ogawa, Tetsunori Kobayashi, Shinji Watanabe, “BERT Meets CTC: New Formulation of End-to-End Speech Recognition with Pre-trained Masked Language Model,” Proc.  The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP2022), Dec. 2022. [URL]

2022/11

Ryuki Matsuura, Mao Saeki, Shungo Suzuki, Tetsuji Ogawa, Yoichi Matsuyama, “Refinement of utterance fluency feature extraction and automated scoring of L2 oral fluency with dialogic features,” Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2022 (APSIPA2022), pp.1309-1317, Nov. 2022. [DOI]

2022/11

Riku Ogino, Kohei Saijo, Tetsuji Ogawa, “Design of discriminators in GAN-based unsupervised learning of neural post-processors for suppressing localized spectral distortion,”  Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2022 (APSIPA2022), pp.969-975, Nov. 2022. [DOI]

2022/11

Moe Yaegashi, Susumu Saito, Teppei Nakano, Tetsuji Ogawa, “Do you know how humans sound? Exploring a qualification test design for crowdsourced evaluation of voice synthesis quality,” Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2022 (APSIPA2022), pp.980-985, Nov. 2022. [DOI]

2022/10

Masato Takatsuka, Tetsunori Kobayashi, Yoshihiko Hayashi, “Phrase-Level Localization of Inconsistency Errors in Summarization by Weak Supervision,” Proceedings of the 29th International Conference on Computational Linguistics (COLING 2022), pp. 6151-6164, Oct. 2022. [URL]

2022/09

Mao Saeki, Kotoka Miyagi, Shinya Fujie, Shungo Suzuki, Tetsuji Ogawa, Tetsunori Kobayashi, Yoichi Matsuyama, “Confusion detection for adaptive conversational strategies of an oral proficiency assessment interview agent,” Proc. The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH2022), Sept. 2022. [DOI] [Scopus]

2022/09

Jin Sakuma, Shinya Fujie, Tetsunori Kobayashi, “Response timing estimation for spoken dialog system using dialog act estimation,” Proc. The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH2022), pp.4486-4490, Sept. 2022. [DOI]

2022/09

Hiroaki Sato, Tomoyasu Komori, Takeshi Mishima, Yoshihiko Kawai, Takahiro Mochizuki, Shoei Sato, Tetsuji Ogawa, “Text-only domain adaptation based on intermediate CTC,”  Proc. The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH2022), Sept. 2022. [DOI] [Scopus]

2022/09

Kohei Saijo, Tetsuji Ogawa, “Unsupervised training of sequential neural beamformer using coarsely-separated and non-separated signals,” Proc. The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH2022), Sept. 2022. [DOI] [Scopus]

2022/09

Yuta Ide, Susumu Saito, Teppei Nakano, Tetsuji Ogawa, “Can humans correct errors from system? Investigating error tendencies in speaker identification using crowdsourcing,” Proc. The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH2022), Sept. 2022. [DOI] [Scopus]

2022/06

Yuji Naraki, Tetsuya Sakai, Yoshihiko Hayashi, “Evaluating the Effects of Embedding with Speaker Identity Information in Dialogue Summarization,” Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pp.298–304, June 2022. [URL]

2022/05

Yosuke Higuchi, Keita Karube, Tetsuji Ogawa, Tetsunori Kobayashi, “Hierarchical conditional end-to-end ASR with CTC and multi-granular subword units,” Proc. 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2022), pp.7797-7801, May 2022. [DOI] [Scopus]

2022/05

Kohei Saijo, Tetsuji Ogawa, “Remix-cycle-consistent learning on adversarially learned separator for accurate and stable unsupervised speech separation,”  Proc. 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2022), pp.4373-4377, May 2022.  [DOI] [Scopus]

研究会・シンポジウム

2023/01

Zhao Huaibo, Shinya Fujie, Tetsuji Ogawa, Jin Sakuma, Yusuke Kida, Tetsunori Kobayashi, “Multiple latency CBS streaming ASR for conversational systems,” 情報処理学会研究報告 (SLP),vol.2022-SLP-146,no.9,pp.1-6,Feb. 2023.

2022/12

倉田楓真,佐伯真於,藤江真也,松山洋一,“視線・口・頭部の動作特徴量に着目したマルチモーダル発話終了予測,” 人工知能学会 言語・音声理解と対話処理研究会(SLUD)第13回対話システムシンポジウム,Dec. 2022.

2022/11

斎藤奨,中野鐵兵,小川哲司,“Tutti: データアノテーション用システム開発・運用基盤,” 第25回情報論的学習理論ワークショップ (IBIS2022),Nov. 2022.

2022/06

柳澤遼,斎藤奨,中野鐵兵,小林哲則,小川哲司,“クラウドソーシングにおける動的タスク発注モデルの教師無し学習,” 電子情報通信学会技術研究報告 (AI),vol.122,no.96,AI2022-14,pp.72-76,July 2022.

2022/06

西城耕平,小川哲司,“ブラインド音源分離の分離音と観測信号を教師信号として用いたSequential Neural Beamformerの教師なし学習,” 電子情報通信学会技術研究報告 (SP),vol.122,no.81,SP2022-25,pp.110-115,June 2022.[研究奨励賞]

2022/06

荻野里久,西城耕平,藤枝大,小川哲司,“局所的な真偽判定を用いた敵対的学習に基づく教師なし音声処理歪み補正,” 電子情報通信学会技術研究報告 (SP),vol.122,no.81,SP2022-13,pp.49-54,June 2022.

2022/06

八重樫萌絵,斎藤奨,中野鐵兵,小川哲司,“クラウドソーシングを用いた合成音声の音質主観評価のためのワーカ選抜基準,” 電子情報通信学会技術研究報告 (SP),vol.122,no.81,SP2022-24,pp.104-109,June 2022.

2022/06

趙懐博,樋口陽祐,木田祐介,小川哲司,小林哲則,“Transducer型ストリーミング音声認識におけるMask-CTCを用いた事前学習,” 情報処理学会研究報告 (SLP),vol.2022-SLP-142,no.61,pp.1-6,June 2022.

2022/06

松浦瑠希,鈴木駿吾,佐伯真於,藤江真也,小川哲司,松山洋一,“対話特徴を用いた第二言語発話の流暢性自動採点,” 情報処理学会研究報告 (SLP),vol.2022-SLP-142,no.47,pp.1-6,June 2022.

全国大会

2023/03

兒新治紀,中野鐵兵,宮澤泰正,小川哲司,“気象・海況情報を用いた良漁場予測における予測範囲の絞り込み,” 日本水産学会春季大会,March 2023.

2023/03

西城耕平,小川哲司,“Self-Remixing: 音源の分離と再混合による教師なし音源分離,” 日本音響学会研究発表会講演論文集,pp.161-164,March 2023.

2023/03

藤田雄介,小松達也,木田祐介,小川哲司,“中間層予測を用いたEnd-to-Endダイアライゼーション,” 日本音響学会研究発表会講演論文集,pp.665-666,March 2022.

2023/03

小堀智祥, 小林哲則, 林良彦,“対話型質問応答における質問書き換えのためのターン強調,” 言語処理学会第29回年次大会発表論文集,pp.2639-2644,March 2023. [URL]

2023/03

楢木悠士, 小林哲則, 林良彦,“指定要約長に応じたソフトな内容選択による要約長操作可能なEnd-to-End要約,” 言語処理学会第29回年次大会発表論文集,pp.3025-3030,March 2023. [URL]

2022/09

佐久間仁,藤江真也,小林哲則,“日本語人対人会話データにおける発話タイミングのモデリング,” 日本音響学会研究発表会講演論文集,pp.XXX-XXX,Sept. 2022.

2022/09

西城耕平,小川哲司,“ブラインド音源分離を教師としたTeacher-Student学習とUnmix-Remix無矛盾学習によるSequential Neural Beamformerの教師なし学習,” 日本音響学会研究発表会講演論文集,pp.359-362,Sept. 2022.

2022/09

荻野里久,西城耕平,小川哲司,“CycleGANを用いた教師無し音声処理歪み補正,” 日本音響学会研究発表会講演論文集,pp.371-374,Sept. 2022.

© 2015 Perceptual Computing Group, Waseda University. All Rights Reserved

page-archive-2022