Page List

Search on the blog

2011年11月30日水曜日

SRM 525 DIV2 950 MagicalSquare

DPで解く問題。どのような状態を保持するかが悩ましかった。最初、dp[r][i][j][k]としてr行目まで見たときに、各カラムが先頭からi, j, k文字まで埋まっている場合のパターン数を保持するようにした。しかしよく考えると、kはi, jが決まれば一意にきまるので、dp[r][i][j]とした。

 計算量は、(行数 4) * (カラムの埋まっている文字 50^2) * (現在注目している行の文字の分割パターン 50^2) * (文字列比較 50)であやしかったけど、投げてみる。TLE。ループの中にbreakを入れて枝狩りをしてみる。Accept。

 んー、通ったものの、計算量はもう一段階落ちると思う。文字列の比較をハッシュとか使ってやればいいのかなー。Editorialに期待します。


  1. long long int dp[4][51][51];  
  2.   
  3. class MagicalSquare {  
  4. public:  
  5.     long long int getCount(vector<string> rowStrings, vector<string> columnStrings) {  
  6.         memset(dp, 0, sizeof(dp));  
  7.   
  8.         vector<string> rows(4);  
  9.         rows[0] = "";  
  10.         REP(i, rowStrings.size()) rows[i+1] = rowStrings[i];  
  11.   
  12.         dp[0][0][0] = 1;  
  13.         int rLen[4];  
  14.         int cLen[3];  
  15.   
  16.         REP(i, 4) rLen[i] = rows[i].length();  
  17.         REP(i, 3) cLen[i] = columnStrings[i].length();  
  18.   
  19.         if (rLen[1] + rLen[2] + rLen[3] != cLen[0] + cLen[1] + cLen[2])  
  20.             return 0;  
  21.   
  22.         int s = 0;  
  23.         REP (r, 3) {  
  24.             s += rLen[r];  
  25.             REP (i, cLen[0]+1) REP(j, cLen[1]+1) {  
  26.                 if (!dp[r][i][j]) continue;  
  27.   
  28.                 int k = s - i - j;  
  29.   
  30.                 REP(p, rLen[r+1]+1) {  
  31.                     string s1 = rows[r+1].substr(0, p);  
  32.                     if (columnStrings[0].substr(i, s1.length()) != s1) break;  
  33.   
  34.                     FOR (q, p, rLen[r+1]+1) {  
  35.                         string s2 = rows[r+1].substr(p, q-p);  
  36.                         string s3 = rows[r+1].substr(q);  
  37.   
  38.                         if (columnStrings[1].substr(j, s2.length()) != s2) break;  
  39.                         if (columnStrings[2].substr(k, s3.length()) != s3) continue;  
  40.   
  41.                         dp[r+1][i+s1.length()][j+s2.length()] += dp[r][i][j];  
  42.                     }  
  43.                 }  
  44.             }  
  45.         }  
  46.   
  47.         return dp[3][cLen[0]][cLen[1]];  
  48.     }  
  49. };  

2011年11月29日火曜日

SRM 525 DIV1 250 dropcoins

完敗(^O^)/
どうせ探索問題だろうとおもったのが、すべての敗因でした。このやり方知ってるのに出て来なかったのは悔しい。ばか、もうほんとばか。


  1. int cnt[31][31];  
  2. class DropCoins {  
  3. public:  
  4.     int getMinimum(vector<string> board, int K) {  
  5.         int r = board.size();  
  6.         int c = board[0].length();  
  7.   
  8.         int ret = INF;  
  9.         memset(cnt, 0, sizeof(cnt));  
  10.         FOR (i, 1, r+1) FOR (j, 1, c+1) {  
  11.             cnt[i][j] = cnt[i-1][j] + cnt[i][j-1] - cnt[i-1][j-1] + (board[i-1][j-1] == 'o');  
  12.         }  
  13.   
  14.         FOR (i, 1, r+1) FOR (j, 1, c+1) FOR (it, i, r+1) FOR (jt, j, c+1) {  
  15.             int x = cnt[it][jt] + cnt[i-1][j-1] - cnt[it][j-1] - cnt[i-1][jt];  
  16.   
  17.             if (x == K) {  
  18.                 int ans = (i-1)+(j-1)  
  19.                         + (r-it)+(c-jt)  
  20.                         + min(i-1, r-it)  
  21.                         + min(j-1, c-jt);  
  22.                 ret = min(ret, ans);  
  23.             }  
  24.         }  
  25.   
  26.         if (ret == INF) return -1;  
  27.         return ret;  
  28.     }  
  29. };  


2011年11月26日土曜日

C++の関数オブジェクト

前から気になっていたのですが、C++にgreater<int>というものがあります。例えば、vector<int> xsを降順にソートしたい場合に

  1. sort(xs.begin(), xs.end(), greater<int>());  

のようにして使います。また、priority_queue<int>のデータ構造でtopに最小のものがくるようにしたい場合、

  1. priority_queue<int, vector<int>, greater<int> >que;  

のようにします。

 ここで気になることがあります。sort()の場合は、greater<int>()と括弧つきで使用して、priority_queueの場合は括弧なしで使用しています。この違いは一体・・?そもそもこれは関数なのか、関数ポインタなのか?
ということで調べてみました。


 これは、関数オブジェクト(ファンクタ)と呼ばれるらしいです。operator()がオーバーロードされていてオブジェクトを通常の関数と同様の方法で呼び出し可能にする仕組みらしいです。ということでgreater<int>()は以下のように使うことができます。

  1. cout << greater<int>()(3,1) << endl;        // true  
  2. cout << greater<int>()(1,2) << endl;        // false  
  3. cout << greater<int>()(-1,-1) << endl;      // false  

または、こんなかんじ。こっちの書き方がオブジェクトを関数のように使ってるというのが分かりやすいかも。
  1. greater<int> g;  
  2.   
  3. cout << g(3,1) << endl;        // true  
  4. cout << g(1,2) << endl;        // false  
  5. cout << g(-1,-1) << endl;      // false  


 でも何だかもやもやしています。これって何が嬉しいんだろう。関数ポインタと一緒じゃ。。ということでまた調べてみました。


 関数ポインタと比べたときの関数オブジェクトの利点は以下の2つだそうです。
  • コンパイラがインライン展開しやすい
  • メンバ変数を持てるので状態を持った関数を作れる
 なるほど。。2つ目の利点が面白そうで、これってクロージャとかジェネレータとかがつくれるってことなんじゃ?と思って書いてみました。
 まず、クロージャ的なやつ(実行時に入力された数値によって挙動の異なる関数を生成したように見せかける)。

  1. template <typename T>  
  2. class Closure {  
  3.     T pw;  
  4.   
  5. public:  
  6.     T operator() (T x) {  
  7.         T ret = 1;  
  8.         for (int i = 0; i < pw; i++)  
  9.             ret *= x;  
  10.   
  11.         return ret;  
  12.     }  
  13.   
  14.     Closure(T pw) {  
  15.         this->pw = pw;  
  16.     }  
  17. };  
  18.   
  19. int main() {  
  20.     int n, m;  
  21.   
  22.     cin >> n >> m;  
  23.     Closure<int> f(n), g(m);  
  24.   
  25.     cout << f(10) << endl;           // 10^n  
  26.     cout << g(10) << endl;           // 10^m  
  27.   
  28.     return 0;  
  29. }  

 次に、ジェネレータ的なやつ(フィボナッチ数列生成器)。

  1. class Gen {  
  2.     int a, b;  
  3.   
  4. public:  
  5.     int operator() () {  
  6.         int tmp = a;  
  7.   
  8.         a = b;  
  9.         b += tmp;  
  10.   
  11.         return tmp;  
  12.     }  
  13.   
  14.     Gen() {  
  15.         a = 1;  
  16.         b = 1;  
  17.     }  
  18. };  
  19.   
  20. int main() {  
  21.     Gen gen;  
  22.   
  23.     for (int i = 0; i < 30; i++)  
  24.         cout << gen() << endl;  
  25.   
  26.     return 0;  
  27. }  


なんかここまでくると、関数型言語みたいなことができそうじゃなイカ!?と思ってfunction composition的なものを書いてみます。最初templateをプレースホルダーのように使って書いてみました。

  1. template <typename _T, typename _OuterFunction, typename _InnerFunction>  
  2. class Composite {  
  3. public:  
  4.     _T operator() (_T __x) {  
  5.         _OuterFunction __g = _OuterFunction();  
  6.         _InnerFunction __f = _InnerFunction();  
  7.         return __g(__f(__x));  
  8.     }  
  9. };  
  10.   
  11. template <typename _T>  
  12. class dbl {  
  13. public:  
  14.     _T operator() (_T __x) {  
  15.         return 2*__x;  
  16.     }  
  17. };  
  18.   
  19. template <typename _T>  
  20. class succ {  
  21. public:  
  22.     _T operator() (_T __x) {  
  23.         return __x + 1;  
  24.     }  
  25. };  
  26.   
  27. int main() {  
  28.     Composite<int, succ<int>, dbl<int> > comp1;  
  29.     Composite<int, dbl<int>, succ<int> > comp2;  
  30.   
  31.     cout << comp1(10) << endl;     // ((+1).(*2)) 10  
  32.     cout << comp2(10) << endl;     // ((*2).(+1)) 10  
  33.   
  34.     return 0;  
  35. }  


そのあと、動的に渡すような形で書けないかなーと試行錯誤して以下のようなものを書きました。

  1. template <typename _T, typename _OuterFunction, typename _InnerFunction>  
  2. _T composite(_OuterFunction __f, _InnerFunction __g, _T __x) {  
  3.     return __f(__g(__x));  
  4. }  
  5.   
  6. template <typename _T>  
  7. class dbl {  
  8. public:  
  9.     _T operator() (_T __x) {  
  10.         return 2*__x;  
  11.     }  
  12. };  
  13.   
  14. template <typename _T>  
  15. class succ {  
  16. public:  
  17.     _T operator() (_T __x) {  
  18.         return __x + 1;  
  19.     }  
  20. };  
  21.   
  22. int main() {  
  23.     cout << composite(succ<int>(), dbl<int>(), 10) << endl;    // ((+1).(*2)) 10  
  24.     cout << composite(dbl<int>(), succ<int>(), 10) << endl;    // ((*2).(+1)) 10  
  25.   
  26.     return 0;  
  27. }  

 書いた後、気付いたのですが、compositionの上のバージョンはpriority_queueと同様、下のバージョンはsort()と同様の書き方になっていました。こうやって見ると、priority_queueの場合は関数オブジェクトのクラスを、sort()の場合は関数オブジェクトのインスタンスを渡しているということに気付きます。たしかに、priority_queue<>の<>内で指定するものは"型"、sort()の引数で渡すのは実体を持った"値、または、インスタンス"であることを考えると、どっちに括弧付けないどっちに付けないのかってのは納得できます。実際にSTLのライブラリのソースを読んでみると、priority_queueの場合、第三引数で渡す_Compare(greater<int>に対応するもの)は"型"として使われていて、こういう使い方は関数ポインタだと書きづらいのかなと思いました。

木構造のメモリ確保

トライ木を使って以下の問題にトライしたところ、TLEを食らいました。


 最初に書いたコードはこれです。トライ木を構築して、語尾にあたる節点が子を持っていたらエラーとします。このエラー検出と同時に動的確保したメモリを解放しています。

  1. struct Trie {  
  2.     bool tail;  
  3.     Trie *next[10];  
  4.     Trie() {  
  5.         tail = false;  
  6.         fill(next, next+10, (Trie*)0);  
  7.     }  
  8. };  
  9.   
  10. Trie *find(char *t, Trie *r) {  
  11.     for (int i = 0; t[i]; ++i) {  
  12.         int c = t[i]-'0';  
  13.         if (!r->next[c]) r->next[c] = new Trie;  
  14.         r = r->next[c];  
  15.     }  
  16.     r->tail = true;  
  17.     return r;  
  18. }  
  19.   
  20. bool validate(Trie *r) {  
  21.     bool hasCld = false;  
  22.     bool ret = true;  
  23.     for (int i = 0; i < 10; i++) {  
  24.         if (r->next[i]) {  
  25.             hasCld = true;  
  26.             ret &= validate(r->next[i]);  
  27.         }  
  28.     }  
  29.   
  30.     if (r->tail && hasCld)  
  31.         ret = false;  
  32.   
  33.     delete r;  
  34.     return ret;  
  35. }  
  36.   
  37. int main() {  
  38.     int t, n;  
  39.     char num[12];  
  40.   
  41.     scanf("%d", &t);  
  42.     while (t--) {  
  43.         scanf("%d", &n);  
  44.         Trie *rt = new Trie;  
  45.         REP(i, n) {  
  46.             scanf("%s", num);  
  47.             find(num, rt);  
  48.         }  
  49.   
  50.         if (validate(rt))  
  51.             puts("YES");  
  52.         else  
  53.             puts("NO");  
  54.     }  
  55.   
  56.     return 0;  
  57. }  

 なんとか高速化する方法はないかと調べていたら、komiyamさんの日記におもしろいアイディアがあったので、参考にさせていただきました。毎回メモリを動的確保するのではなく、予め必要な分だけ静的領域に確保しておき、節点を生成するときは予め確保しておいたメモリのアドレスを渡すという方法です。これにより、メモリの確保/解放に係るオーバーヘッドがなくなります。また、メモリの解放をせずにすむために枝狩りができます。私の最初のソースでは、エラーを検出してもトライ木全体をトラバースしていました。これはメモリを解放するためです。メモリの解放がいらなくなると、エラーを検出した時点で探索をやめることができます。

  1. struct Trie {  
  2.     bool tail;  
  3.     Trie *next[10];  
  4.     Trie() {  
  5.         tail = false;  
  6.         fill(next, next+10, (Trie*)0);  
  7.     }  
  8. };  
  9.   
  10. Trie nodes[100000];  
  11. int ptr;  
  12.   
  13. Trie *find(char *t, Trie *r) {  
  14.     for (int i = 0; t[i]; ++i) {  
  15.         int c = t[i]-'0';  
  16.         if (!r->next[c]) {  
  17.             nodes[++ptr] = Trie();  
  18.             r->next[c] = nodes + ptr;  
  19.         }  
  20.         r = r->next[c];  
  21.     }  
  22.     r->tail = true;  
  23.     return r;  
  24. }  
  25.   
  26. bool validate(Trie *r) {  
  27.     for (int i = 0; i < 10; i++) {  
  28.         if (r->next[i]) {  
  29.             if (r->tail)  
  30.                 return false;  
  31.             if (!validate(r->next[i]))  
  32.                 return false;  
  33.         }  
  34.     }  
  35.     return true;  
  36. }  
  37.   
  38. int main() {  
  39.     int t, n;  
  40.     char num[12];  
  41.   
  42.     scanf("%d", &t);  
  43.     while (t--) {  
  44.         scanf("%d", &n);  
  45.         ptr = 0;  
  46.   
  47.         nodes[ptr] = Trie();  
  48.         Trie *rt = &nodes[ptr];  
  49.         REP(i, n) {  
  50.             scanf("%s", num);  
  51.             find(num, rt);  
  52.         }  
  53.   
  54.         if (validate(rt))  
  55.             puts("YES");  
  56.         else  
  57.             puts("NO");  
  58.     }  
  59.   
  60.     return 0;  
  61. }  


 以上がメイントピックですが、3点ほどちょっとしたTipsを書いておきます。
[C++のstructについて]
 C++のstructはCの構造体とは違います。C++の場合はstruct内にメンバ関数を持つことができます。classの場合アクセス修飾子を省略するとprivateになりますが、structの場合はpublicになるそうです。

[文字から数値への変換]
'0' - '9'のcharを0 - 9のintに変換するとき、komiyamさんはおもしろいやり方をしています。
c & 15
でchar -> intに変換されます。確かに、'0'は16進数だと0x30なので、0x0fでマスクしてあげるとintに変換できます。

[ローカル変数のdelete]
最初、rootの接点だけローカル変数で宣言していて、validateでメモリ解放するとクラッシュしました。当然っちゃ当然ですがスタックに積まれた変数をdeleteしようとすると予期せぬ結果が発生します。再帰的処理で一括してメモリ解放するときなどに、ある特別なデータだけスタック変数だったとか結構ありそうな落とし穴なので注意。

2011年11月23日水曜日

SRM 524 DIV2 1000 multipleswithlimit

modular arithmeticの絡んだ数論チックな問題(好きなタイプの問題)。余り毎にメモ化しておけばいいのはすぐ気付いたけど、最初のsubmissionでは、dp[2][10000]みたいにして、rolling table/flying tableを使って解いて、TLE。前回新しく更新されたところだけをpick upすればいいので、priority_queueを利用したダイクストラ法のようなやり方をすればいいのに気付く。これでAC。

(追記)editorial読んだら、queueでいいっぽい。最初に埋まったやつがbestになるから、確かにqueueでOK。


  1. typedef pair<int, pair<string, int> >  ISI;  
  2. string dp[10000];  
  3.   
  4. class MultiplesWithLimit {  
  5.     string format(string x) {  
  6.         if (x.length() < 9)  
  7.             return x;  
  8.   
  9.         char ret[512];  
  10.         sprintf(ret, "%s...%s(%d digits)", x.substr(0, 3).c_str(), x.substr(x.length()-3).c_str(), x.length());  
  11.   
  12.         return ret;  
  13.     }  
  14.   
  15.     bool contain(vector<int> vec, int n) {  
  16.         REP(i, vec.size())  
  17.             if (vec[i] == n)  
  18.                 return true;  
  19.   
  20.         return false;  
  21.     }  
  22.   
  23. public:  
  24.     string minMultiples(int N, vector<int> forbiddenDigits) {  
  25.         vector<int> nums;  
  26.   
  27.         REP(i, 10) {  
  28.             if (!contain(forbiddenDigits, i))  
  29.                 nums.push_back(i);  
  30.         }  
  31.   
  32.         priority_queue<ISI, vector<ISI>, greater<ISI> > Q;  
  33.         Q.push(MP(0, MP("", 0)));  
  34.         string ret = "";  
  35.   
  36.         REP(i, 10000) dp[i] = "";  
  37.         while (!Q.empty()) {  
  38.             string str = Q.top().second.first;  
  39.             int rm = Q.top().second.second;  
  40.   
  41.             Q.pop();  
  42.             if (rm == 0 && str != "") {  
  43.                 ret = str;  
  44.                 break;  
  45.             }  
  46.             if (dp[rm].length() < str.length() ||  
  47.                 (dp[rm].length() == str.length() && dp[rm] < str))  
  48.                 continue;  
  49.   
  50.             REP(i, nums.size()) {  
  51.                 int rm_t = (10 * rm + nums[i]) % N;  
  52.                 string str_t = str + (char)(nums[i] + '0');  
  53.   
  54.                 if (str_t == "0"continue;  
  55.                 if (dp[rm_t] == "" ||  
  56.                     str_t.length() < dp[rm_t].length() ||  
  57.                     (str_t.length() == dp[rm_t].length() && str_t < dp[rm_t])  
  58.                 ) {  
  59.                     dp[rm_t] = str_t;  
  60.                     Q.push(MP(str_t.length(), MP(str_t, rm_t)));  
  61.                 }  
  62.             }  
  63.         }  
  64.   
  65.         if (ret == "")  
  66.             return "IMPOSSIBLE";  
  67.   
  68.         return format(ret);  
  69.     }  
  70. };  


2011年11月22日火曜日

SRM 523 DIV2 1000 smallbricks31

 On top of the basement of size 1*1*w, we like to construct a building object using three types of bricks, whose sizes are 1*1*1, 1*1*2, 1*1*3, respectively. The height of the building is at most h. How many different type of buildings could you construct under some constraints? -- A concise summery is like that.

At first glance, I was like, "Umm, this is a simple bit DP problem." But it took me longer to implement the idea than I thought. Guess I have to solve this level of problem within 30 minutes to be a yellow coder. Just need more practices!!

  1. const LL MOD = 1000000007LL;  
  2.   
  3. LL dp[10+1][1<<10];  
  4. LL ptr[1<<10][1<<10];  
  5.   
  6. void init(int x, int y, int b) {  
  7.     if ((1<<b) > x) return;  
  8.   
  9.     init(x, y, b+1);  
  10.     if (x >> b & 1) {  
  11.         init(x, y | 1<<b, b+1);  
  12.         ++ptr[x][y | 1<<b] %= MOD;  
  13.     }  
  14.     if ((x >> b & 1) && (x >> (b+1) & 1)) {  
  15.         init(x, y | 3<<b, b+2);  
  16.         ++ptr[x][y | 3<<b] %= MOD;  
  17.     }  
  18.     if ((x >> b & 1) && (x >> (b+2) & 1)) {  
  19.         init(x, y | 7<<b, b+3);  
  20.         ++ptr[x][y | 7<<b] %= MOD;  
  21.     }  
  22. }  
  23.   
  24. class SmallBricks31 {  
  25. public:  
  26.     int countWays(int w, int h) {  
  27.         memset(dp, 0, sizeof(dp));  
  28.         memset(ptr, 0, sizeof(ptr));  
  29.   
  30.         REP(i, 1<<10) {  
  31.             if (i > 0) {  
  32.                 int b = 0;  
  33.                 while (!(i & 1<<b))  
  34.                     ++b;  
  35.                 init(i, 0, b);  
  36.             }  
  37.         }  
  38.   
  39.         dp[0][(1<<w)-1] = 1;  
  40.         REP(i, h) REP(j, 1<<w) {  
  41.             if (!dp[i][j]) continue;  
  42.   
  43.             REP(k, 1<<w) {  
  44.                 if (ptr[j][k]) {  
  45.                     LL tmp = dp[i][j] * ptr[j][k] % MOD;  
  46.                     dp[i+1][k] = (dp[i+1][k] + tmp) % MOD;  
  47.                 }  
  48.             }  
  49.         }  
  50.   
  51.         LL ret = 0;  
  52.         FOR (i, 1, h+1) REP(j, 1<<w) ret = (ret + dp[i][j]) % MOD;  
  53.   
  54.         return ++ret % MOD;  
  55.     }  
  56. };  

2011年11月21日月曜日

サーバー奮闘記(17) Hadoopインストール

"stone setting" by angela7dreams

 Hadoop(最新安定ver 0.20.203)試してみました。Pseudo-Distributedモードでexampleをいくつか動かしてみました。ほとんど公式ホームページにあるとおりにやればOKですが、いくつかひっかかったところがあったので、メモしておきます。

[SSHのオプション]
SSHのポートをデフォルトの22以外にしている場合は設定ファイルにsshのオプションを設定。

(例:ポート1234の場合)
conf/hadoop-env.sh に以下追記。
export HADOOP_SSH_OPTS="-p 1234"

[Webインターフェース]
NameNode、JobTrackerのステータス確認用のwebインターフェース

http://localhost:50070/
http://localhost:50030/

があって、プラスα的な機能かなと勝手に思い込んでいたら、このページを開かないとhdfsがきちんと機能しないらしい。

[データ保存領域の設定]
Ubuntuだと再起動後に、dfsのテンポラリーディレクトリに保存したファイルが消えてしまいます。保存先をデフォルトのtmpから変更してあげればOKです。
conf/core-site.xmlに以下の設定を追記。

  1. <property>  
  2.     <name>hadoop.tmp.dir</name>  
  3.     <value>/home/kenji/hadoop-data</value>  
  4.     <description>hadoopのデータ保存領域</description>  
  5. </property>  

[example実行]
bin/hadoop jar hadoop-examples-0.20.203.0.jar xxxx
とする。xxxxは実行したいサンプル。
wordcountを実行したい場合は、
bin/hadoop jar hadoop-examples-0.20.203.0.jar wordcount input output
のようにする。

2011年11月12日土曜日

サーバー奮闘記(16) SSHのRSA鍵設定、rm、emacsの設定など

vps初めて半年くらい経ちました。当初借りたは良いけど、何をしたらいいのか分からない状態でしたが、適当にwebサービスを作ったりしてまあまあ活用できている気がします。最近気に成っていたことがいくつかあったので、まとめて片づけました。
  1. SSHのRSA鍵設定
  2. aliasでrmをrm -i にする
  3. emacsのバックアップファイルを作成しないようにする
 まず1。プレインテキストでユーザー情報とかパスワード流すのやばいだろう。。(※訂正:teratermのオプションにプレインテキストって書いてあったので平文で流れているのかと思いましたが、mojavy先生曰くsshではすべての通信が暗号化されているため、プレインテキストでパスワードが流れるなんてことは無いそうです。)vpsで誰かがtcpdumpとかしてたら漏れ漏れじゃないですか@_@ と前々から思っていて、いつの間にか忘れていて、セキュリティの読み物見ていたら思い出して、即実行しました。

を参考にしました。

 上のサイトにあるようにローカルで鍵ペアを作成して、サーバーに公開鍵を送るようにしましょう。サーバーで作って、秘密鍵をローカルに転送とかやってたら本末転倒なので。
 あと、SSH認証を使いますっていうのをtera termの初期設定ファイルに保存しておくとログインがらくです。「設定」 -> 「SSH認証」 と進み、
  1. 「ユーザ名」にユーザ名を入力
  2. 「RSA/DSA鍵を使う」にチェック
  3. 「秘密鍵」項目で秘密鍵のファイルを選択
  4. 「OK」ボタン押下
とし、「設定」 -> 「設定の保存」を選んで、INIファイルに設定を保存します。

 2. はtypoでrm *とかやったら泣けるなーと思ってその予防策。
~/.bashrcに以下追記。

alias rm='rm -i'

 3. は、毎回チルダから始まるバックアップファイルを作っているのがemacsだと分かったので作らないように設定。
~/.emacsに以下の設定追記。

(setq make-backup-files nil)

ヨセフス数(Josephus Number)の求め方

ヨセフスの問題(Josephus problem)という有名問題があります。これの一般解を求める式があるらしいので調べてみました。

 以下では、円を組む人の数をn、スキップ数をkとします。本来は、n番目(つまり最後に)処刑される人の番号を求めればよいのですが、より汎用的にs番目に処刑される人の位置を求めることにします。

 ここのページにあるように、以下のソースコードでs番目に処刑される人の位置がわかります。


  1. int josephus(int n, int k, int s) {  
  2.     int ret = k * s;  
  3.   
  4.     while (ret > n)  
  5.         ret = ((ret - n) * k - 1) / (k - 1);  
  6.   
  7.     return ret;  
  8. }  

 えーーっと、よくわかりません。ということで、何故上のコードで答えがでるのか考えてみました。(結構がんばりました(汗)。)
まずは、正の整数xに対して、f_k: x -> (x * k - 1) / (k - 1)という写像が何をするのか考えます。

k = 2のとき
f_2(1) = 1
f_2(2) = 3
f_2(3) = 5
f_2(4) = 7
・・・・・

k = 3のとき
f_3(1) = 1
f_3(2) = 2
f_3(3) = 4
f_3(4) = 5
f_3(5) = 7
・・・・・

ふーむ、どうやらf_kは、自然数からなる点列(1,2,3,...)からkの倍数を取り除くような効果があるようです。本当か?ちょっと数学的に考えてみます。

f_k(x) = (k * x - 1) / (k - 1)なので、f_k(1) = (k*1 - 1) / (k - 1) = 1です。
f_k(2) = (k*2 - 1) / (k - 1) はコンピュータの整数演算では2ですが、数学上は、2余り1です。
同様に、
f_k(3) = 3余り2
f_k(4) = 4余り3
・・・・
f_k(k) = k余り(k-1)

です。f(k)は(k-1)余ってますが、(k-1)で割るのでこの余りは消えて商が1増えます。ということで、f(k) = k+1となります。これで、(1,2,3,.....k)という点列が(1,2,3,....,k-1, k+1)となりました。さらに続きを調べるために、g_k(x) = (k * x - 1) を (k-1)で割った余りが0になる場所を調べます。

g_k(1) = 0 (mod (k-1))
g_k(k) = 0 (mod (k-1))
g_k(2*k-1) = 0 (mod (k-1))
・・・・

なので、y = 1 + i * (k-1), i = 0,1,2,3,...なる正の整数yに対してg_k(y) = 0 (mod (k-1))となります。先の例で正の整数の点列からkが除去されることを確認しました。2*k-1という場所は本来2*kがある場所です。(kが無くなってるから1引かれる)。ここで同様に商の繰り上がりがおこることから、2*kは点列から除去されます。同様に3*k-2に対応する3*kも除去されます。以降同様にして、kの倍数がすべて除去されるというわけです。

 ここまでで、写像f_kがkの倍数だけを除いた整数点列を生成できることが分かりました。ソースコードを見ると、まず
ret = k * s;
としているので、retは、(1,2,3...n)の点列を拡張して、(1,2,3,....,n,n+1,n+2,....... k*s)にしたものを考えていることが分かります。ここから逆算して、k*sが区間[1,n]の整数のどれに対応しているかをみていこうというわけです。(ret - n)でnからはみ出ている分が分かります。このはみ出ている部分に対して、写像f_kを適用することで、retは消えたものを除いて数えた場合にそれがあるべき場所へとマッピングされます。これをret <= nになるまで繰り返しているというわけです。ちょっと説明足らずな感じなので、表で示します。n = 5, k = 3, s = 5とした場合、

k*s123456789101112131415
k*s - n -----12345678910
f_k(k*s - n)-----12457810111314

となります。例えば、処刑される順番は、k*s = 3, 6, 9, 12, 15の順です。それぞれ見て行きます。
1番目に処刑される人は、3番目の人です。
2番目に処刑されるのは、6ですが、これはnより大きいので、もともといる位置に変換します。表のf_k(k*s - n)を見ると1なので、1番目の人です。
3番目に処刑されるのは、9ですが、これも同様に対応位置に変換して5になります。
4番目に処刑されるのは、12 -> 10 -> 7 -> 2と変換されるので、2番目の人です。
同様に、最後に処刑されるのは、15 -> 14 -> 13 -> 11 -> 8 -> 4で4番目の人です。

ということで、(3, 1, 5, 2, 4)の順で処刑されるということです。4の位置に居れば助かりますね!

2011年11月10日木曜日

アセンブラを出力して遊ぶ

簡単なプログラムをアセンブラで出力して、スタックの動きを追ってみます。簡単なプログラムですが、結構面白いです。環境は、Ubuntu、gcc 4.4.3です。

 まず、Cのソースコード(test.c)。

  1. #include <stdio.h>  
  2.   
  3. main()  
  4. {  
  5.   int i, j, k;  
  6.   
  7.   i = 1;  
  8.   j = 2;  
  9.   k = i + j;  
  10.   printf("%d %d %d\n", i, j, k);  
  11. }  


 そして、アセンブラ(test.s)。
$ gcc -S test.c
でアセンブラのコードを出力できます。

  1.     .file    "test.c"  
  2.     .section    .rodata  
  3. .LC0:  
  4.     .string    "%d %d %d\n"  
  5.     .text  
  6. .globl main  
  7.     .type    main, @function  
  8. main:  
  9.     pushl    %ebp  
  10.     movl    %esp, %ebp  
  11.     andl    $-16, %esp  
  12.     subl    $32, %esp  
  13.     movl    $1, 28(%esp)  
  14.     movl    $2, 24(%esp)  
  15.     movl    24(%esp), %eax  
  16.     movl    28(%esp), %edx  
  17.     leal    (%edx,%eax), %eax  
  18.     movl    %eax, 20(%esp)  
  19.     movl    $.LC0, %eax  
  20.     movl    20(%esp), %edx  
  21.     movl    %edx, 12(%esp)  
  22.     movl    24(%esp), %edx  
  23.     movl    %edx, 8(%esp)  
  24.     movl    28(%esp), %edx  
  25.     movl    %edx, 4(%esp)  
  26.     movl    %eax, (%esp)  
  27.     call    printf  
  28.     leave  
  29.     ret  
  30.     .size    main, .-main  
  31.     .ident    "GCC: (Ubuntu 4.4.3-4ubuntu5) 4.4.3"  
  32.     .section    .note.GNU-stack,"",@progbits  

 いろいろ分かることがあります。
 まず、スタックのアドレスが番地の大きい方から小さいほうへと広がっているところです。これはx86マシンでは共通だと昔聞いたことがあります。
 それから、andl $-16, %esp があるので、16byteのaddress alignmentを使っているようです。FFFFFFF0でマスキングして16の倍数になる次の数をスタックポインタに代入しています。これだとベースポインタとスタックポインタの整合性があわないようにみえるんですけど、結局ベースポインタ使ってないし、リターンする時ベースポインタをスタックポインタに戻す処理も省略されてるので別にいいような気もします。
 意外だったのは、スタック内の変数にスタックポインタからの差分でアクセスしているところです。スタックポインタは実行時に移動するから、ベースポインタからの差分で変数にアクセスするのが普通かと思いましたが、そうでもないみたいです。
 あと、最後にprintfの可変長引数のところの仕組みがおもしろいです。第一引数の%dが3つあるんで、第一引数をpopしたあと、3回popすればいいんですねー。当然といえば当然ですが、実際コード上でみるとちょっとした感動がありました。printfがcallされるときのstackの状態は下のようになっています。



2011年11月6日日曜日

素数とは宇宙の創造主が人間に与えた暗号である


"On the trail" by Mr eNil

最近、素数に関するNHKのドキュメンタリーを見た。それそれは、もう、感動でした。宇宙の神秘、数学の美に魅せられました。元ネタは、『魔性の難問 ~リーマン予想・天才たちの闘い~』です。要約を書きます。

 まず、素数とは何か?それ自身と1以外に約数を持たない正の整数のことです。2,3,5,7,11,13....と無限に続きます。この素数列の並びはランダムに見えます。しかし、2人の有名な数学者が素数と自然界においてとても重要な数を結びつけました。レオンハルト・オイラーは、素数と円周率πの間に以下の関係を見出しました。


まったくランダムに見える素数に関する式を無限個掛けあわせると、なんと世界で最も美しい数πがでてくるのです。これによって、オイラーは素数と円や球体が何らかの関係を持っていることを発見しました。

 それから、カール・フリードリヒ・ガウスは、ある正数xまでに現れる素数の数は以下の式で近似できることを発見しました。いわゆる素数定理ってやつですね。


ln()は自然対数で、その底はeです。eは、カタツムリの渦巻き、台風、銀河なのどの自然界で多くみられる螺旋形状と関連のある数字です。

 オイラーとガウスの手によって、ランダムな素数が数のキングおよびクイーンと関連付けられました。そして、素数と自然界には何らかの関係があるのではと考えられるようになったのです。その考えはベルンハント・リーマンによって『何らかの関係がある』から以下のような数学的な問題へと変換されました。

ゼータ関数

の非自明な零点は一直線上に並ぶ。

ゼータ関数が零になるようなx(複素数)を複素平面上にプロットすると、なんとそれが一直線上に並ぶというのです。衝撃的ですね!

 上記のリーマン予想は、現在証明されておらず、N ≓ NP予想などと同様にミレニアム懸賞問題の一つです。今まで、ジョン・ナッシュやアラン・チューリングといった偉大な数学者、暗号科学者たちがその証明を試みましたが、失敗に終わっています。

 時は流れて、違ったアプローチでリーマン予想にチャレンジする数学者が現れました。ヒュー・モンゴメリーは、直線状にならぶ零点の間隔に興味をもちました。そして、たまたま出会った物理学者フリーマン・ダイソンに零点の間隔の式を見せた時に、ダイソンは言いました。「それはすごい!その式はウランなどの原子核のエネルギーレベルの間隔を表す式と同じような形をしている!」
素数と量子力学の世界、まったく異なる分野が一つになった瞬間でした。

 この発見を機に、多くの物理学者がゼータ関数の零点と同じ間隔をもった原子を探すようになりました。すると今度は、非可換幾何学というまったく異なる学問を研究しているアラン・コンヌが閃いたのです。「モンゴメリーの発見を発端として、物理学者たちは素数と関連をもつ空間をさがしている。そして、その空間とは非可換幾何学と完璧に一致する空間である。」当時、非可換幾何学は、量子力学を書き変え森羅万象の原理を説明する究極の法則『万物の理論』の基礎になると期待されていた学問でした。宇宙の創生と素数が繋がっていることを示す非常に興味深い話です!

 ある数学者はいいます。
「非可換幾何学を使って素数の謎がとかれるとき、森羅万象を説明する万物の理論--いわば創造主による宇宙の設計図--も明らかになるだろう。」と。

2011年11月4日金曜日

Google Developer Day Japan 2011


 『Webの世界はすさまじい速度で進化してきた。次世代のWebがどのようなものになるのか私は分からない。しかし確かなことがある。次世代の新しいWebはこの部屋にいる技術者たちによって作られだろう。そして未来のビジネスはあなた方がつくった新しい仕組みのうえで展開される。』

 ―先日、Google Developer Day 2011が横浜で開催されました。Googleの製品へ高い貢献をしているDeveloper、およびDevQuizで高得点を取り招待状をゲットしたエンジニア、約2000人が一同に会しました。

 Google Developer Dayは午前の部と午後の部に大きく分かれていて、午前はKeynote Speech、午後は複数のSessionが同時進行するという形で構成されていました。主に、
  • Android
  • Chrome
  • App Engine
  • HTML5
  • Google+
などの技術の最新動向が発表されました。また、技術者同士が会話をしたり、Googleのエンジニアとコミュニケーションを取ったりできるような工夫が施されており、とても楽しいイベントでした。私自身も、缶バッジ交換のおかげでゲーム業界のエンジニアの人とお話することができ非常にいい経験となりました。

 特に私の印象に残ったのは以下の3点です。
  1. ScalabilityとAgility
  2. Googleマインド
  3. エンジニアとしての社会貢献
 1. 『これからのWebのサービスにおいて重要なものは、どうスケールするか、そして如何に柔軟な開発スタイルを取り入れていくかだ。』特に、アジャイル開発の重要性に関しては、Googleの東日本大震災に対する取り組みの中でも語られました。
 アジャイル開発を行うためには、プロトタイピング力を持ったエンジニアの存在が絶対条件だと思います。しかし、浮かんだアイディアをすぐに実装できるエンジニアは日本には決定的に少ないように感じます。これはそもそも、日本のシステム業界(とりわけSIer業界?)が要件定義/設計/開発/テスト/保守のように縦割りになっていることが原因じゃないかと。。要件定義はできるけど、fizzbuzzも書けないエンジニア。開発はできるけど要件がまったく分からないエンジニア。アジャイル開発を取り入れるためには、まずこのあたりの体質を変えていく必要があるのかなと思いました。

 2. これは、単純にいいな~と(羨ましいなと)。。会社のスローガンって見栄えだけ綺麗で中身が伴っていないことがしばしばありますが、Googleが大切にしているという以下の三箇条は本物だなと感じました。
  • なにごともエンジニアありき
  • 百聞は一デモに如かず
  • 日本で「イケる!」と思ったら、世界のみんなも同感するかも
 3. 「Googleのクライシスレスポンス」というSessionで、東日本大震災に対するGoogleの取り組みが語られました。『すべてが自動化された完璧なシステムを届ける必要はない。途中に人の手が入っていてもかまわない。』『当初、被災地の人達が欲していたのは、スマートフォン上で起動するアプリでもクラウド上で動作するアプリでもなかった。エクセルやアクセスといったごく単純な技術だった。』
 技術者として最新技術を追うことや完璧を求めることも大事だけど、今自分が持っている技術がどう世の中に役に立つのかと考えて実践するというのは本質的により重要なことだなと改めて考えさせられました。自分の技術なんて大したことないやと卑屈にならずに、少しでも世の中が変わる、少しでも世の中に役に立つはずと信じてサービスを提供していきたいなと思いました。