センター試験をやったことがない俺が、解答の傾向を統計的に分析してみた
はじめに
2chまとめサイトである暇人速報を見ていたら、センター試験の解答を統計的に予測してみようという大胆なスレッド[1]がありました。そのスレッドでは、id:zFTNNFUn0さんがすごくがんばって分析していました。ですが、その分析が若干荒いように感じたので、僕も分析してみました。
続きを読む
【ラボ畜おすすめ】Nexus7という名のノートパソコン(周辺機器込み約3万円1kg)
Kindleで電子書籍を読んだり、Google Chromeでネットをやるのに最適なNexus7。
さらには300gぐらいの重さで、という軽さもあり、日々持ち歩いています。
ただ、ノートパソコンとNexus7を同時に持ち歩くと、正直邪魔だし、重いしでいいことがありません。
そこでNexus7でデスクトップパソコンにリモート接続することで、Nexus7を事実上のノートパソコンにしようという企みを試みました。
続きを読む
Random Forestで計算できる特徴量の重要度
(pixabay.comより)
1.背景とか
Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。
最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。
それで、いろいろな日本語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッチです。
そこで、この記事では特徴量の重要度について深堀りしていこうと思います。