ヒライ シゲユキ   HIRAI SHIGEYUKI
  平井 重行
   所属   京都産業大学  情報理工学部 情報理工学科
   職種   教授
発表年月日 2025/06/14
発表テーマ 言語非依存な口真似による効果音合成手法PronounSEの評価
会議名 音学シンポジウム2025
主催者 情報処理学会 音声言語処理研究会, 音楽情報科学研究会, 電子情報通信学会 音声研究会
学会区分 研究会・シンポジウム等
発表形式 ポスター
単独共同区分 共同
国名 日本
開催地名 東京(早稲田大学)
開催期間 2025/06/13~2025/06/14
発表者・共同発表者 滝沢力, 平井 重行, 金崎朝子, 須田仁志
概要 人の調音器官(発音能力)に着目し,効果音の口真似を用いた効果音合成手法 PronounSE が提案されている.この技術は,頭の中の音のイメージを口で表現し,それが効果音として合成されるものである.そして,爆発音に焦点を当てた口真似データセットを用いて学習された PronounSE で,口真似の細かなニュアンス変化を反映した合成が実現されている.ただし,深層学習を用いた効果音・環境音合成に関する評価手法は確立されていないことから,Audio-to-Audio の合成技術に対し,「所望する音との類似 性」と「口真似ニュアンスの反映性」の観点で評価を試みた.本研究では,それら評価の観点に関して客観評価と主観評価を実施し,その結果を報告した.
researchmap用URL https://www.ipsj.or.jp/kenkyukai/event/mus143slp156.html