なにメモ

コンピュータビジョンや機械学習関係の話題を書き綴ると思うブログです。

エンジニアによる街コンレポート

f:id:alfredplpl:20140622211339j:plain

写真:pixabay.com

 

こんにちは、エンジニア(?)のalf++です。

 

みなさん、恋愛してますか?

もちろん僕はしていません。

できるものならばさっさとしたいです。

 

さて、エンジニアの皆さんは異性との出会いが人生レベルで極端に少ないと思います。というのも、結婚に至る出会いの場所は大学や職場、知り合いの紹介で7割[1]なのだからだそうです。エンジニアの皆さんは大学にも職場にも友達にもほぼ女性なんていないでしょう。頼みの綱、見合いも現代ではほとんど廃れています(全体の5%)[1]。

 

そこで、手っ取り早い出会いの方法として合コン、そして街コンがあります。街コンとは、街ぐるみで行われる大型の合コンイベント[2]のことです。参加者は出会いを得て、企画者はまちおこしができるわけですね。

最近、勇気を振り絞り、街コンなるものに突撃したのでそのレポートをしてみようと思います。

 

続きを読む

RとPythonのデータをほぼそのままやりとりする方法(JSON編)

f:id:alfredplpl:20140225004438p:plain

はじめに

画像やWebページ、行動ログなどのデータを分析するときに、前処理はPython、分析はRという人が世の中多いと思います。この処理結果を途中で保存する場合、Pythonであればpickleモジュール、Rであればsave関数を使うと思いますが、この場合、PythonからRにデータを移行することができません。

この問題を解決する方法の1つにCSV形式でデータを記述することがあります。ただし、連想配列(ハッシュ)をCSVでやりとりするのは面倒ですし、二次元以上の配列も管理がややこしくなります。

そこでRとPythonのデータをほぼそのままやりとりする方法を調べてみました。

 

続きを読む

早慶よりも狙い目!?東大ボーイを彼氏にすべき理由

昔から不動の人気を博している「慶應ボーイ」と「ワセ男」。確かに良い男は多いけど、他の大学の男の子はどうなの!?

 

実は今狙い目なのが東京大学の男の子通称「東大ボーイ」。モテモテ慶應ボーイより、ガッツあるワセ男より、東大ボーイを彼氏にする理由をご紹介します。

 

続きを読む

センター試験をやったことがない俺が、解答の傾向を統計的に分析してみた

はじめに

2chまとめサイトである暇人速報を見ていたら、センター試験の解答を統計的に予測してみようという大胆なスレッド[1]がありました。そのスレッドでは、id:zFTNNFUn0さんがすごくがんばって分析していました。ですが、その分析が若干荒いように感じたので、僕も分析してみました。

 

続きを読む

【ラボ畜おすすめ】Nexus7という名のノートパソコン(周辺機器込み約3万円1kg)

Kindle電子書籍を読んだり、Google Chromeでネットをやるのに最適なNexus7。

 

f:id:alfredplpl:20131227123318j:plain

 

さらには300gぐらいの重さで、という軽さもあり、日々持ち歩いています。

ただ、ノートパソコンとNexus7を同時に持ち歩くと、正直邪魔だし、重いしでいいことがありません。

そこでNexus7でデスクトップパソコンにリモート接続することで、Nexus7を事実上のノートパソコンにしようという企みを試みました。

 

続きを読む

Random Forestで計算できる特徴量の重要度

f:id:alfredplpl:20100613135223j:plain

(pixabay.comより)

1.背景とか

Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。


最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。

それで、いろいろな日本語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッチです。

そこで、この記事では特徴量の重要度について深堀りしていこうと思います。

続きを読む

今日から始めるデータサイエンス はじめに

はじめに

昨今、新聞などで見られるビッグデータという記事。それと同時にチラッと見えるデータサイエンス(データ科学)とかデータサイエンティストとか。これらの話を利益とかあまり知らない学生の視点から説明していく一連の日記を書いてみます。今後はR言語Pythonを用いた解析例を交えて説明していく予定です。僕が燃え尽きたら知りません。(友達の参考資料になったらいいな

 

続きを読む