Tech Tips
Page List
(移動先: ...)
Entries
Resume
Apps
Words
▼
2015年6月14日日曜日
Facebook Recruiting IV: Human or Robot?
›
Kaggleの”Facebook Recruiting IV: Human or Robot?”の参加記を書こうと思います。 problem オークションサイトの活動状況を見て、ユーザーが人間かボットかを判定する。 ユーザーが参加したオークション、入札時間、ユーザーが...
2015年6月13日土曜日
PyplotでGradient Descentを可視化
›
目的関数を三次元グラフにプロット 以下では、目的関数をz = 2x 2 + 5y 2 - 4xyとする. まず目的関数をグラフ表示してみる. from mpl_toolkits . mplot3d import axes3d import matplotl...
2015年6月7日日曜日
scikit-learnで線形回帰
›
単純な線形回帰 まず簡単な例から。 y = 3 x + 1 + err という特性を満たすデータからサンプリングを行い、xとyの関係を求める。 ただし、err ~ N(0, 0.1 2 )とする。 import numpy as np import matp...
2015年5月25日月曜日
PandasでCSVを読んでmatplotlibでプロット
›
機械学習をするときに、抽出した特徴量の優劣を”見える化”できると便利だよねということでやってみた。 準備 CSVデータを用意する。中身は以下のようなかんじ。 x,label ..... 6.560467,1.000000 6.568159,-1.000000 ...
2015年5月5日火曜日
scikit-learn(4) Feature selection
›
Feature selection(特徴選択)について学習した。 特徴選択とは、識別の前処理において与えられた特徴ベクトルから重要な要素のみを選択する処理のこと[1]。 特徴選択と特徴量抽出は異なることに注意。 特徴選択は与えられた特徴量ベクトルの中から重要な部分空間...
2015年5月4日月曜日
特徴量の重要性
›
2,3日前からKaggleのコンテストに参加している。 最近はMachine Learningのライブラリが充実しているので、各アルゴリズムの詳しい知識がなくても識別問題を解くことが出来る。こうなってくると、どのような特徴量を用いるかが重要なファクターになってくると思う。 ...
2015年5月1日金曜日
scikit-learn(3) Random Forest
›
Random Forestの勉強をした。自分でも実装できる気がする。まぁ実装しないけど。 Random Forestの概要 複数個の決定木を用いたアンサンブル学習器 識別問題のときは最頻値を採用 回帰問題のときは平均値を採用 ブートストラップサンプリングを行い、...
‹
›
ホーム
ウェブ バージョンを表示