Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと（追記注釈１）などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。

最近、Random Forestをカジュアルに使う例が多く（特にうちの研究室）、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。

それで、いろいろな日本語の資料をいくら読んでも、Random Forestがもつ特徴の１つである、特徴量の重要度の詳細に関してはほとんどノータッチです。

そこで、この記事では特徴量の重要度について深堀りしていこうと思います。

2013-12-06

今日から始めるデータサイエンス　はじめに

はじめに

昨今、新聞などで見られるビッグデータという記事。それと同時にチラッと見えるデータサイエンス（データ科学）とかデータサイエンティストとか。これらの話を利益とかあまり知らない学生の視点から説明していく一連の日記を書いてみます。今後はR言語やPythonを用いた解析例を交えて説明していく予定です。僕が燃え尽きたら知りません。（友達の参考資料になったらいいな

2013-10-27

R言語の手軽な連想配列（ハッシュ）のようなもの

R 小ネタプログラミング

Rには連想配列（ハッシュ）のパッケージ{hash}がありますが、もっと手軽なものを見つけました。リストを使う方法です。

2013-10-17

Bag-of-Featuresの実装

Python Scikit-learn OpenCV

Bag-of-Featuresが必要になったものの、OpenCVではPython用に実装されていないという悲しい現実が待ち受けていたので実装しました。(ちなみにコーディングスタイルはJavaです。)

なにメモ

コンピュータビジョンや機械学習関係の話題を書き綴ると思うブログです。

早慶よりも狙い目！？東大ボーイを彼氏にすべき理由

センター試験をやったことがない俺が、解答の傾向を統計的に分析してみた

はじめに

【ラボ畜おすすめ】Nexus7という名のノートパソコン（周辺機器込み約３万円1kg）

Random Forestで計算できる特徴量の重要度

１．背景とか

今日から始めるデータサイエンス　はじめに

はじめに

R言語の手軽な連想配列（ハッシュ）のようなもの

Bag-of-Featuresの実装