早稲田大学 知覚情報システム・メディアインテリジェンス研究室

echo '';

アーカイブ 2025年

招待講演

2025/08

小川哲司,“風車の予知保全に向けた故障予兆検知技術,” 産業技術総合研究所 第87回人工知能セミナー「AI技術と風力発電」,オンライン開催,Aug. 2025. (host: 深山覚博士,産業技術総合研究所)

学術論文

2026/01

Hiroaki Takatsu, Shungo Suzuki, Masaki Eguchi, Ryuki Matsuura, Mao Saeki, Yoichi Matsuyama, “Gnowsis: Multimodal Multitask Learning for Oral Proficiency Assessments,” Computer Speech & Language, vol.95, 2026.

2025/12

Masaki Eguchi, Kotaro Takizawa, Mao Saeki, Fuma Kurata, Shungo Suzuki, Yoichi Matsuyama, Yasuyo Sawaki, “Human-versus artificial intelligence-delivered roleplay tasks for assessing interactional competence: An applied conversation analytic study,” TESOL J, 59, pp.S183-S219, 2025.

2025/11

Kohei Saijo, Tetsuji Ogawa, “Stabilizing and enhancing remixing-based unsupervised sound source separation,” APSIPA Trans. Signal & Infor. Process., vol.14, no.1, Nov. 2025.

国際会議

2026/01

Haruhisa Iseno, Atsumoto Ohashi, Tetsuji Ogawa, Shinnosuke Takamichi, Ryuichiro Higashinaka, “Investigating the effects of translation quality on LLM performance in machine-translated theory of mind benchmarks,” Proc. AAI 2026 Theory of Mind for AI (ToM4AI) Workshop, Jan. 2026.

2026/01

Yuto Abe, Mao Saeki, Atsumoto Ohashi, Shinnosuke Takamichi, Shiyna Fujie, Tetsunori Kobayashi, Tetsuji Ogawa, Ryuichiro Higashinaka, “Effects of dialogue corpora properties on fine-tuning a Moshi-based spoken dialogue model,” Proc. International Workshop on Spoken Dialogue Systems (IWSDS), Feb. 2026.

2026/01

Haruhisa Iseno, Atsumoto Ohashi, Tetsuji Ogawa, Shinnosuke Takamichi, Ryuichiro Higashinaka, “Analysis of the correlation between theory of mind and dialogue ability to identify essential ToM for dialogue systems,” Proc. The 39th Pacific Asia Conference on Language, Information and Computation (PACLIC 39), Dec. 2025.

2025/11

Haruki Konii, Teppei Nakano, Mari Wakabayashi, Tomomi Sato, Tetsuji Ogawa, “Image recognition framework via adaptive class descriptions with vision-language models,” Proc. The 8th Asian Conference on Pattern Recognition (ACPR 2025), pp.397-411, Nov. 2025.

2025/11

Michihiro Nakata, Teppei Nakano, Susumu Saito, Tetsuji Ogawa, “Towards farmers’ decision support: Explainable-by design modeling for calving sign detection in cattle,” Proc. The 8th Asian Conference on Pattern Recognition (ACPR 2025), pp.427-441, Nov. 2025.

2025/10

Tomoki Ariga, Jun Taniguchi, Yosuke Higuchi, Sayaka Toma, Kunihiro Abe, Rie Shigyo, Tetsuji Ogawa, “Lyric-aware karaoke background video selection using large language models and moment retrieval,” Proc. The 17th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA2025), pp.1492-1497, Oct. 2025.

2025/10

Kaito Kosaki, Teppei Nakano, Mari Wakabayashi, Tomomi Sato, Tetsuji Ogawa, “Strong eye closure detection in children with profound intellectual and multiple disabilities using robust temporal difference features,” Proc. The 17th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA2025), pp.2477-2482, Oct. 2025.

2025/10

Walid Gomaa, Abdelrahman Wael Ammar, Ismael Abbo, Mohamed Galal Nassef, Tetsuji Ogawa, Mohab Hossam, “Video-based vibration analysis for predictive maintenance: A motion magnification and random forest approach,” Proc. 22nd International Conference on Informatics in Control, Automation and Robotics (ICINCO2025), pp.445-452, Oct. 2025.

2025/09

Takuma Yabe, Moe Yaegashi, Teppei Nakano, Tetsuji Ogawa, “Necessity of voice sample selection in qualification tests for crowdsourced subjective audio quality evaluation,” Proc. the 33rd European Signal Processing Conference (EUSIPCO2025), pp.261-265, Sept. 2025.

2025/09

Kohei Saijo, Tetsuji Ogawa, “A comparative study on positional encoding for time-frequency domain dual-path transformer-based source separation models,” Proc. the 33rd European Signal Processing Conference (EUSIPCO2025), pp.446-450, Sept. 2025.

2025/08

Asahi Sakuma, Hiroaki Sato, Ryuga Sugano, Tadashi Kumano, Yoshihiko Kawai, Tetsuji Ogawa, “Speaker-distinguishable CTC: Learning speaker distinction using CTC for multi-talker speech recognition,” Proc. The 26th Annual Conference of the International Speech Communication Association (INTERSPEECH2025), pp.5503-5507, Aug. 2025.

2025/08

Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi, “End-to-end speech translation guided by robust translation capability of large language model,” Proc. The 26th Annual Conference of the International Speech Communication Association (INTERSPEECH2025), pp.21-25, Aug. 2025.

2025/04

Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi, “Harnessing the zero-shot power of instruction-tuned large language model for guiding end-to-end speech recognition,” Proc. 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2025), pp.1-5, April 2025.

研究会・シンポジウム

2026/01

佐藤丈一郎,樋口陽祐,小林哲則,小川哲司,“音声認識における文脈依存度の提案とMambaの有効性分析,” 電子情報通信学会研究報告 (SP),March 2026.

2026/01

小島啓吾,樋口陽祐,小林哲則,小川哲司,“局所・大域的注視に基づく発話重畳区間の中間表現補正を用いた複数話者音声認識,” 電子情報通信学会研究報告 (SP),March 2026.

2025/12

楠奈穂美,樋口陽祐,小川哲司,小林哲則,“階層的Deep Biasingを用いた低頻度語に頑健な音声認識,” 情報処理学会研究報告 (SLP),vol.2025-SLP-158,no.1,pp.1-8,Dec. 2025.

2025/07

有賀智輝,谷口純,当間佐耶佳,阿部国大,執行里恵,小川哲司,“大規模言語モデルによる歌詞解釈記述とモーメント検索を用いたカラオケ背景映像の選択,” 第28回画像の認識・理解シンポジウム (MIRU2025),IS-3-203,July 2025.

2025/07

兒新治紀,中野鐵兵,佐藤朝美,小川哲司,“視覚言語モデルを用いた適応的なクラス記述に基づく画像認識フレームワーク,” 第28回画像の認識・理解シンポジウム (MIRU2025),IS-1-146,July 2025.

2025/06

小原勇輝,小林哲則,小坂直敏,“楽曲の全体構造を構築可能なマルチトラック音楽生成,” 情報処理学会研究報告 (SLP),vol.2025-SLP-156,no.81,pp.1-6,June 2025.

全国大会

2026/01

伊勢野晴久,大橋厚元,小川哲司,高道慎之介,東中竜一郎,“Theory of mindのベンチマーク指標は対話能力と関係があるのか?LLMにおける対話能力とTheory of mindの相関分析,” 言語処理学科第32回年次大会発表論文集,March 2026.

2026/01

阪井瞭介,江舒,郭傲,高道慎之介,小川哲司,東中竜一郎,“一人称・三人称視点対話収録システムとエゴセントリック津軽弁音声対話コーパスの構築,” 言語処理学科第32回年次大会発表論文集,March 2026.

2026/01

阿部雄斗,佐伯真於,大橋厚元,高道慎之介,藤江真也,小林哲則,小川哲司,東中竜一郎,“Moshi音声対話モデルの日本語ファインチューニングにおける対話データ特性の影響,” 日本音響学会研究発表会講演論文集,March 2026.

2025/09

淺井航平,杉浦一瑳,中田亘,栗田修平,高道慎之介,小川哲司,東中竜一郎,“Common Crawl を用いた大規模音声音響データセットの構築,” 日本音響学会秋季研究発表会講演論文集,Sept. 2025.

2025/05

兒新治紀,中野鐵兵,宮澤泰正,小川哲司,“良漁場予測範囲絞り込みのためのPU学習を用いた未探索海域データの活用,” 2025年度人工知能学会全国大会(JSAI2025),1Q4-GS-10-03, May 2025.

2025/05

若山拓矢,井上太揮,深山覚,飯田誠,小川哲司,“振動信号による風車状態監視のための精密かつ少量データに頑健なモデリング,” 2025年度人工知能学会全国大会(JSAI2025),4R3-GS-10-03,May 2025.

2025/05

中田道寛,川島由理,中野鐵兵,春日良一,小川哲司,“映像を用いた繁殖牛分娩監視のための基盤モデルの開発と運用,” 2025年度人工知能学会全国大会(JSAI2025),2O1-GS-10-01,May 2025.

2025/05

小林恵輔,中野鐵兵,春日良一,日下裕美,坂口実,小川哲司,“映像からの繁殖牛発情行動検知における物体検出モデル利用に関する検討,” 2025年度人工知能学会全国大会(JSAI2025),3win5-82,May 2025.

2025/05

望田康太,中野鐵兵,若林麻里,佐藤朝美,小川哲司,“養育者に無理なく頼るモデル構築:重症児感情状態推定のための人間参加型学習および視覚言語モデルの活用,” 2025年度人工知能学会全国大会(JSAI2025),4LS-OS-38-03,May 2025.

© 2015 Perceptual Computing Group, Waseda University. All Rights Reserved

page-archive-2025