なにメモ

コンピュータビジョンや機械学習関係の話題を書き綴ると思うブログです。

Random Forestで計算できる特徴量の重要度

f:id:alfredplpl:20100613135223j:plain

(pixabay.comより)

1.背景とか

Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。


最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。

それで、いろいろな日本語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッチです。

そこで、この記事では特徴量の重要度について深堀りしていこうと思います。

続きを読む

今日から始めるデータサイエンス はじめに

はじめに

昨今、新聞などで見られるビッグデータという記事。それと同時にチラッと見えるデータサイエンス(データ科学)とかデータサイエンティストとか。これらの話を利益とかあまり知らない学生の視点から説明していく一連の日記を書いてみます。今後はR言語Pythonを用いた解析例を交えて説明していく予定です。僕が燃え尽きたら知りません。(友達の参考資料になったらいいな

 

続きを読む

Bag-of-Featuresの実装

Bag-of-Featuresが必要になったものの、OpenCVではPython用に実装されていないという悲しい現実が待ち受けていたので実装しました。(ちなみにコーディングスタイルはJavaです。)

 

続きを読む

【移植した過去記事】OpenCV 2.2での画像の貼り付けとアルファチャネルへの対応

注意:OpenCV 2.3.1以降、pngのアルファチャンネルの読み込みに対応したそうなので、そちらで対応してください。

 

OpenCV 2.2での画像の貼り付けは以下のとおり

続きを読む

【移植した過去記事】Windows7(64bit版)のKinectインストール方法(OpenNI)

Kinectを64bit版のWindows7で使おうとしたら、 とてもインストールが面倒だったので、手順を残しておこうと思う。

このインストールは以下のソフトを使った。

※インストールにはすべて32bit版を使った。

 

続きを読む

ブログ、ことはじめ

はてなに移ってからあまり時間が立ってないので、まだ技術的記事がありません。

過去に別のブログに書いたコンピュータビジョンや機械学習関係の話題を少しずつ移植していこうと考えています。

今後も研究や開発している中で気づいた技術的話題かとりとめのないことを少しずつ書いていこうと思います。

よろしくお願いします。