ヒライ シゲユキ
HIRAI SHIGEYUKI
平井 重行 所属 京都産業大学 情報理工学部 情報理工学科 職種 教授 |
|
発表年月日 | 2023/06/24 |
発表テーマ | オノマトペ音声を用いた効果音合成技術におけるニューラルボコーダの検討 |
会議名 | 音学シンポジウム2023 (第137回音楽情報科学・第147回音声言語情報処理合同研究発表会) |
主催者 | 情報処理学会 |
学会区分 | 研究会・シンポジウム等 |
発表形式 | ポスター |
単独共同区分 | 共同 |
国名 | 日本 |
開催地名 | 東京(電気通信大学) |
開催期間 | 2023/06/23~2023/06/24 |
発表者・共同発表者 | 滝沢力, 平井重行 |
概要 | メディア作品などの音響制作では,様々な知識や経験,スキルが要求される.望んだ音をイメージし,音韻や韻律などのニュアンスを含んだ擬音語を発話することは比較的容易であり,それらを入力として効果音に変換する生成モデルを本研究では提案している.そこでは,具体的な効果音として,様々なニュアンス表現が考えられる爆発音に焦点を当て,データセットの作成および学習,合成を試みた.その学習済モデルで,ある程度のニュアンスを考慮した合成が可能であるものの,合成音の品質向上に向けて取り組むべき課題がある.その課題のうち,今回はニューラルボコーダに注目し,iSTFTNet を用いた波形合成を試みた.本稿では,これまで利用してきた CBHG・Griffin-Lim アルゴリズムと,iSTFTNet のそれぞれで効果音を合成した結果から,その音質や波形の特徴について比較検討した内容を報告する. |
researchmap用URL | https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=226344&item_no=1&page_id=13&block_id=8 |