■ 研究概要
◆研究課題
遺伝的アルゴリズムを用いたカーネル型関数推定量のスパース化
◆研究概要
カーネル型密度関数推定量(以後, KDE)は, 事前に関数形を仮定することなく, どのような形の関数も推定可能な統計解析手法である. KDEが内在的に抱える問題として「次元の呪い」が知られており, ゲノムデータなどの超高次元データの場合においては, 関数推定量を真の関数に近づけるためには, 膨大な数のデータが必要となり, 収束までの計算時間も膨大になるというものである. こうした「次元の呪い」に対して, 決定的な問題解決法は現在のところ提案されていない.
本研究は, 遺伝的アルゴリズムを用いて, 大規模なデータセット(例えば数万個におよぶ)の中から, 推定上意味のある少数のデータ点(例えば20個程度)を選び出し, その少数のデータ点のみを使用して関数推定を行ってもなお, 元の全データ点を使用した時の関数推定よりも精度が高まる手法を提案することを目的とする. もたらす成果として, 物理的なデータサイズの大幅な圧縮と, 推定上意味のある少数のデータ点の抽出(個体の抽出)が可能となり, データを解釈する上での有意義な統計学的知見を得ることに寄与できる.またカーネル型回帰関数推定に適用し, 変数選択への活用可能性も模索する. |
|
|
|
|
|