HAI-Lab Events


第61回 関西合同音声ゼミ
The 61st Kansai Joint Speech Seminar


開催案内・Event-Info



日付・Date: 2025年6月28日 (土)
June 28, 2025 (Sat)


時刻・Time: 13:00 - 19:00

場所・Place: 奈良先端科学技術大学院大学 ミレニアムホール
NAIST Millenium Hall

アクセス・Access: 奈良先端大へのアクセスについては下記をご覧ください.
バスの経路と利用は少々繁雑ですのでご注意ください.
Please see below for information on how to get to Nara Institute of Science and Technology.
Please note that bus routes and usage are somewhat complicated.

奈良先端大へのアクセス and キャンパスマップ
バススケジュール

Access map and campus map
Bus schedule

svg image


スケジュール・Schedule



12:30 – 13:00 受付 ・ Registration
場所・Place: ミレニアムホール(ロビー)・ Millenium Hall (Lobby)
備考・Note: 会場に到着の際は、受付で名簿にお名前をご記入のうえ、名札をお受け取りください。
名札は回収いたしますので、ご帰宅の際は忘れずに回収箱へお返しください。
Please register at the reception and pick up your name badge upon arrival.
As the badges will be collected, please return the badge to the collection box when leaving.

13:00 – 13:40 招待講演 ・ Invited lecture
場所・Place: ミレニアムホール(講義室)・ Millenium Hall (Lecture Room)
題目・Title: 産業タスク自動化に向けたスケーラブルSim-to-real強化学習
Scalable Sim-to-Real Reinforcement Learning for Industrial Task Automation
話者・Speaker: 松原崇充教授 (NAIST ロボットラーニング研究室)
Prof. Takamitsu MATSUBARA (NAIST Robot Learning Lab)

14:00 – 16:45 ポスターセッション ・ Poster Sessions
場所・Place: ミレニアムホール(ロビー)・ Millenium Hall (Lobby)
セッション・Sessions: 14:00 - 14:45 : 第1セッション ・ Session 1
15:00 - 15:45 : 第2セッション ・ Session 2
16:00 - 16:45 : 第3セッション ・ Session 3
備考・Note: ポスターパネルのサイズは縦168cm × 横92cmで、A0判の縦向きポスターに適しています。
パネルの両面を使用し、それぞれ別の発表に割り当てられます。
ポスター貼付用のテープは主催側で用意いたします。
Each poster panel has dimensions of 168 cm (H) × 92 cm (W),
suitable for an A0-size poster in portrait orientation.
Each side of the panel will be used for a separate presentation.
Tape for mounting posters will be provided.

デモ発表 ・ Demo Presentations
場所・Place: ミレニアムホール(講義室)・ Millenium Hall (Lecture Room)
備考・Note: デモ発表はポスターセッションと並行して実施します。
The demo presentations will be conducted in parallel with the poster session.

17:30 – 19:00 懇親会 ・ Social Gathering
場所・Place: ミレニアムホール(ロビー)・ Millenium Hall (Lobby)
備考・Note: 懇親会費(1人あたり2,000円)は、受付にて各研究室ごとに一括で徴収いたします。
事前に各研究室でちょうどの金額をご準備ください。
The social gathering fee (2,000 yen/person) will be collected per lab in a lump sum at the reception.
Please kindly prepare the exact amount in advance.


ポスター発表プログラム・Program



14:00 - 14:45 : 第1セッション ・ Session 1

番号
No.
タイトル
Title
発表者名
Presenter
大学名
University
研究室名
Laboratory
1 Hybrid H3-Conformerによる頑健な長時間音声認識 本多 智揮 京都大 河原研
2 Multi-lingual and Zero-Shot Speech Recognition by Incorporating Classification of Language-Independent Articulatory Features 馬越 亮 京都大 河原研
3 温州語音声から中国標準語テキストへの変換 高志鵬 同志社大 加藤研
4 口唇口蓋裂音声認識の性能向上に向けた効率的な学習データ収集方法の提案 土師 梧刀 神戸大 滝口研
5 事前学習済み条件付きGANによる感情字幕生成と主観評価 和田 航次郎 神戸大 滝口研
6 A Multifaceted Multi-Agent Framework for Zero-Shot Emotion Analysis and Recognition of Symbolic Music Jiahao Zhao 京都大 吉井研
7 ロボットによる親密行動に対するユーザの許容予測 小松 秀輔 奈良先端大 吉野研
8 Evaluating the contributions of auditory and tactile sensations in augmented sound-image perception using pre-virtual-leading hypersonic signals 今中 崚太 立命館大 西浦研
9 Design of Pin-spot Audio Using Double Sideband with Suppression Carrier Modulation with Sideband Division for Speech Leakage Reduction 岩上 瑞希 立命館大 西浦研
10 Evaluation of depth-directional sound image localization for acoustic metadata design based on video in object-based audio 加藤 昴 立命館大 西浦研
11 Voice conversion-based data augmentation with noise style encoder for optical laser microphone 中野 裕貴 立命館大 西浦研
12 GNNを用いた音源強調 森川 泰輔 龍谷大 片岡研
13 加齢性難聴者の聞き取り補助に向けた声質変換の有効性検証 大谷 蒼太 大阪大 駒谷研
14 複数話者TTSの合成音声において参照話者の再現に関する検討 張 珠煐 和歌山大 西村研
15 PixVoxLM: End-to-End Spoken Image Description via Vision Codec Language Models Chung Q. Tran 奈良先端大 サクテイ研
16 事前学習済みモデルを用いた小規模学習データにおける楽曲補完 苗村 公明 立命館大 高島研


15:00 - 15:45 : 第2セッション ・ Session 2

番号
No.
タイトル
Title
発表者名
Presenter
大学名
University
研究室名
Laboratory
1 日本語に対応した音楽理解言語モデルの構築 原田 優稀 立命館大 高島研
2 多人数チャットコーパスにおける参加者間の関係性の推定 福重 茜 京都大 河原研
3 Could MM-LLMs understand sign language? A novel approach to SLR Santiago P. Gutierrez 京都大 河原研
4 語用論理論はLLMの推意理解能力を強化する 佐藤 拓真 奈良先端大 吉野研
5 音響ベクトル時系列の自己注意重み特徴量を用いた吃音検出モデルのゼロショット・ クロスリンガル評価 宮原 絃造 同志社大 加藤研
6 主観による適合率を尺度としたE2E型擬音語認識手法の性能比較 森山 颯太 和歌山大 西村研
7 交換単位に心象ラベルが付与されたデータセットを用いた交換内部の心象推定 雪澤 大地 大阪大 駒谷研
8 Investigating Challenges Faced by Professional Interpreters in Japanese–English Simultaneous Translation Xi Hang 奈良先端大 サクテイ研
9 Speech-to-Articulatory Animation with wav2vec 2.0 and rtMRI for Visual Pronunciation Learning Mushaffa R. RIDHA 奈良先端大 サクテイ研
10 拡散モデルを用いた集中治療期脳波のデータ拡張 備後 拓真 神戸大 滝口研
11 想起音声分類のための電流源推定に基づく脳磁図データ拡張 能勢 幸樹 神戸大 滝口研
12 音源物体の3Dガウス群表現に基づく多チャネル音源分離 浅野 陽生 京都大 吉井研
13 時変空間モデルを用いた多チャネル非負値行列因子分解に基づく 複数移動音源分離・追跡 二瓶 竜乃介 京都大 吉井研
14 Evaluation of Distance Localization of Virtual Sound Source Based on Arrays of Electro-Dynamic Loudspeaker and Parametric Array Loudspeaker 山﨑 拓海 立命館大 西浦研
15 Evaluation of Near-Field Virtual Sound Source Construction Based on Early Reflection Suppression Using Inverse Filtering with a Parametric Array Loudspeaker 金綱 零 立命館大 西浦研
16 Evaluation of Direct-to-Reverberant Ratio Error between Real Sound Source and Virtual Sound Source Constructed Based on Direct-to-Reverberant Ratio Control Using a Line Array Loudspeaker Consisting of Parametric and Electrodynamic Loudspeakers 入口 巧海 立命館大 西浦研


16:00 - 16:45 : 第3セッション ・ Session 3

番号
No.
タイトル
Title
発表者名
Presenter
大学名
University
研究室名
Laboratory
1 Evaluation of Demodulated Sound Pressure in Pin-Spot Audio Using Multiple Carrier Waves with Reflected Signals 壷井 立成 立命館大 西浦研
2 Enhancement of Speech Signal at Audio-spot Based on Auditory Masking Using Parametric Array Loudspeakers 橋田 朋希 立命館大 西浦研
3 Listening Area Control Based on Intermodulation Masking Using Whitened Carrier Wave for Parametric Array Loudspeaker 森山 慶一 立命館大 西浦研
4 Cascaded Three-Stage Single-Channel Speech Separation Following by Noise Suppression and High-Frequency Components Reconstruction for Optical Laser Microphone 孫 胡傑 立命館大 西浦研
5 光レーザマイクロホンを用いたマルチチャネルANCシステムの複数実環境下における 実機性能評価 水谷 真絃 立命館大 西浦研
6 音楽分離のための音楽特徴量を用いたデータ拡張手法の提案 平原 裕雅 龍谷大 片岡研
7 Music Structure Labeling via Joint Learning of Feature Extraction and Clustering Tsung-Ping Chen 京都大 吉井研
8 参画型コンピュータ支援言語学習システムを用いた構文訓練における修正フィードバック の効果検証 田中 龍弥 同志社大 加藤研
9 日本人小学生による英単語復唱・音読における母音挿入・母音置換の経時変化 西岡 学人 同志社大 加藤研
10 対話型鑑賞法を用いた芸術共同鑑賞支援ロボットについて 岩田 実莉 神戸大 滝口研
11 ユーザ心象改善に向けたシステム発話の対話行為推移との関係分析 石田 晃大 大阪大 駒谷研
12 リアルタイム音声対話システムのための応答タイミングと短文応答の同時予測 大中 緋慧 奈良先端大 吉野研
13 アバター傾聴対話システムにおける多様な頷きのリアルタイム予測 加藤 利梓 京都大 河原研
14 Long-Term Memory in Chatbots 住田 龍宇一 京都大 河原研
15 発話者の年齢を考慮する音声対話システムの検討 八木 理一・
周 王子茜
奈良先端大 サクテイ研
16 話者年齢推定手法における半教師あり学習の検討 平間 光 和歌山大 西村研



参加者内訳・Participants



大学
University
研究室
Laboratory
参加者人数
#Participants
発表件数
#Presenters
懇親会参加者
Soc.Attendies
京都大学 河原研 24 6 24
京都大学 吉井研 13 4 12
神戸大学 滝口研 7 5 0
大阪工業大学 鈴木研 7 0 2
大阪産業大学 高橋研 8 0 0
大阪産業大学 岩居研 5 0 2
大阪大学 駒谷研 16 3 16
同志社大学 加藤研 10 4 7
奈良女子大学 須藤研 0 0 0
奈良先端科学技術大学院大学 吉野研 9 3 4
奈良先端科学技術大学院大学 SAKTI研 27 4 27
立命館大学 西浦研 26 12 26
立命館大学 高島研 4 2 4
龍谷大学 片岡研 8 2 4
和歌山大学 西村研 4 3 4
滋賀大学 市川研 0 0 0
滋賀大学 南條研 1 0 1
合計・Total 169 48 133



過去のゼミ・Past-Seminars



関西合同音声ゼミのページ