なにメモ

コンピュータビジョンや機械学習関係の話題を書き綴ると思うブログです。

早慶よりも狙い目!?東大ボーイを彼氏にすべき理由

昔から不動の人気を博している「慶應ボーイ」と「ワセ男」。確かに良い男は多いけど、他の大学の男の子はどうなの!?

 

実は今狙い目なのが東京大学の男の子通称「東大ボーイ」。モテモテ慶應ボーイより、ガッツあるワセ男より、東大ボーイを彼氏にする理由をご紹介します。

 

続きを読む

センター試験をやったことがない俺が、解答の傾向を統計的に分析してみた

はじめに

2chまとめサイトである暇人速報を見ていたら、センター試験の解答を統計的に予測してみようという大胆なスレッド[1]がありました。そのスレッドでは、id:zFTNNFUn0さんがすごくがんばって分析していました。ですが、その分析が若干荒いように感じたので、僕も分析してみました。

 

続きを読む

【ラボ畜おすすめ】Nexus7という名のノートパソコン(周辺機器込み約3万円1kg)

Kindle電子書籍を読んだり、Google Chromeでネットをやるのに最適なNexus7。

 

f:id:alfredplpl:20131227123318j:plain

 

さらには300gぐらいの重さで、という軽さもあり、日々持ち歩いています。

ただ、ノートパソコンとNexus7を同時に持ち歩くと、正直邪魔だし、重いしでいいことがありません。

そこでNexus7でデスクトップパソコンにリモート接続することで、Nexus7を事実上のノートパソコンにしようという企みを試みました。

 

続きを読む

Random Forestで計算できる特徴量の重要度

f:id:alfredplpl:20100613135223j:plain

(pixabay.comより)

1.背景とか

Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。


最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。

それで、いろいろな日本語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッチです。

そこで、この記事では特徴量の重要度について深堀りしていこうと思います。

続きを読む

今日から始めるデータサイエンス はじめに

はじめに

昨今、新聞などで見られるビッグデータという記事。それと同時にチラッと見えるデータサイエンス(データ科学)とかデータサイエンティストとか。これらの話を利益とかあまり知らない学生の視点から説明していく一連の日記を書いてみます。今後はR言語Pythonを用いた解析例を交えて説明していく予定です。僕が燃え尽きたら知りません。(友達の参考資料になったらいいな

 

続きを読む

R言語の手軽な連想配列(ハッシュ)のようなもの

Rには連想配列(ハッシュ)のパッケージ{hash}がありますが、もっと手軽なものを見つけました。リストを使う方法です。

続きを読む

Bag-of-Featuresの実装

Bag-of-Featuresが必要になったものの、OpenCVではPython用に実装されていないという悲しい現実が待ち受けていたので実装しました。(ちなみにコーディングスタイルはJavaです。)

 

続きを読む