アルパカ三銃士

〜アルパカに酔いしれる獣たちへ捧げる〜

関係者じゃないけど、沖縄複雑系研究会へ参加してきた

今日朝っぱらから、辺野古にある沖縄工業高等専門学校へ向かった。
非常に天気が良く遊びに行くのであれば最高なシチュエーションだったんだろうなと思った。 f:id:codehex:20170921000950j:plain

続きを読む

MXNet の基礎を Perl で学んでみた part 2

前回の「MXNet の基礎を Perl で学んでみた part 1」では NDArray api, Symbol api を組み合わせて計算を試した。今回は、前回使用した api も使ってデータセットをどう準備するか、ニューラルネットをどのように組み立ていくかのチュートリアルを行う。

以下のサイトを参考にしながら進めた。

medium.com

続きを読む

MXNet の基礎を Perl で学んでみた part 1

最近 MXNet の論文を読んだり、MXNet はこれから使われるのかどうかについて調査していた。
結構将来ありそうな感じがした。

そこで、何かしら基本になりそうなチュートリアルはないかと漁っていたら以下のページにたどり着いた。 becominghuman.ai

MXNet の基礎をそれぞれ重要だろうなと思った部分部分で分けてやっていこうと思う。 Perl の repl である Reply を用いた結果を記していく。

続きを読む

どのページでも熱盛を表示するブックマークレットを作った

こんな感じでどんなウェブページにも熱盛を表示できる!凄い!!

f:id:codehex:20170830192126p:plain

以下のコードをブックマークへ追加して使ってください!!

javascript:(function(){document.body.innerHTML+='<div id="atsumori"><img src=""></div>';var t=document.getElementById("atsumori");t.style.right=0,t.style.bottom=0,t.style.position="fixed";t.style.zIndex=9999})();

AI::MxNet の char_lstm.pl を触ってみた

前々から LSTM に興味があった(何かしらの文章を生成させてみたいと思ってた)ため、今回 AI::MxNet の example に含まれている char_lstm.pl を触ってみた。 github.com

LSTM については以下の記事が丁寧に解説している。 s0sem0y.hatenablog.com

このサンプルはシェイクスピア風の文章を生成するといったサンプル。学習用に使用されるデータは「The Tragedy of Coriolanus」である。サンプルのコードはパッと見た感じ難しく感じるが、ちゃんと読み進めていくと大したことはないため、ここで AI::MxNet に関連する大事な部分のみ解説してみる。

Cell に関してのドキュメントは metacpan公式のページを照らし合わせながら読むと良く分かる。
まずは 175 行目にあるこれ。

my $stack = mx->rnn->SequentialRNNCell();

これを使うことによって複数の cell をスタック形式で保持することができる。

$stack->reset;

とすることによって直近でグラフ描写?に使われた cell をリセットすることができるらしい。
スタックに貯めた複数の cell 全体を一つの cell として扱うことができ、これらを用いることでモデルの学習パフォーマンスや予測値が向上するとのこと。 SequentialRNNCell へ cell を追加するにはこのサンプル場合だと

my $cell = mx->rnn->$mode(num_hidden => $num_hidden, prefix => "lstm_${i}l0_");
if($bidirectional)
{
    $cell = mx->rnn->BidirectionalCell(         
        $cell,
        mx->rnn->$mode(
            num_hidden => $num_hidden,
            prefix => "lstm_${i}r0_"
        ),
        output_prefix => "bi_lstm_$i"
    );
}
$stack->add($cell); # cell の追加

が相当する。ちなみに mx->rnn->$mode はオプションで値を指定しない限り mx->rnn->LSTMCell と等価である。

ここからネットワークの定義を行っていく。
それがサンプルコード内の以下の部分になる。

my $data  = mx->sym->Variable('data');
my $label = mx->sym->Variable('softmax_label');
my $embed = mx->sym->Embedding(
        data => $data, input_dim => scalar(keys %vocabulary),
        output_dim => $num_embed, name => 'embed'
);
$stack->reset;
my ($outputs, $states) = $stack->unroll($seq_size, inputs => $embed, merge_outputs => 1);
my $pred  = mx->sym->Reshape($outputs, shape => [-1, $num_hidden*(1+($bidirectional ? 1 : 0))]);
$pred     = mx->sym->FullyConnected(data => $pred, num_hidden => $data_iter->vocab_size, name => 'pred');
$label    = mx->sym->Reshape($label, shape => [-1]);
my $net   = mx->sym->SoftmaxOutput(data => $pred, label => $label, name => 'softmax');

これらのコードについて以下の qiita の記事を読むとわかりやすい。 qiita.com

こうやって読んでいくと MxNet を用いると簡単にネットワーク層の設計ができるため、非常に良い。

最後にモデルの定義と学習を行うコード。 $model->fit で学習を行っている。 この定義時に使われている context はデバイスに関する情報を渡している。AI::MXNet::Context の metacpan を読むと簡単に書いているのですぐに分かる。

my $model = mx->mod->Module(
    symbol  => $net,
    context => $contexts
);
$model->fit(
    $data_iter,
    eval_metric         => mx->metric->Perplexity,
    kvstore             => $kv_store,
    optimizer           => $optimizer,
    optimizer_params    => {
                                learning_rate => $lr,
                                momentum      => $mom,
                                wd            => $wd,
                                clip_gradient => 5,
                                rescale_grad  => 1/$batch_size,
                                lr_scheduler  => AI::MXNet::FactorScheduler->new(step => 1000, factor => 0.99)
                        },
    initializer         => mx->init->Xavier(factor_type => "in", magnitude => 2.34),
    num_epoch           => $num_epoch,
    batch_end_callback  => mx->callback->Speedometer($batch_size, $disp_batches),
    ($chkp_epoch ? (epoch_end_callback  => [mx->rnn->do_rnn_checkpoint($stack, $chkp_prefix, $chkp_epoch), \&sample]) : ())
);

これらのそれぞれの意味は AI::MXNet::Module::Base の metacpan公式に書かれているのを読むとそれぞれのパラメータについて分かりやすい上に、どのようなメソッドが使えるのかも理解できる。

今回感じたこととして、AI::MxNet だけのドキュメントだけを読んで解決しようとしてもそれぞれのメソッドの意味が全く分からなくて辛い。そのため、公式の Python 用のドキュメントも一緒に合わせて読むことで理解を含めることができた。
ちなみにこのサンプルを実行して 1 時間半経過して、この記事を書いていたがそれでもまだ学習が終了しない…

ドキュメント一覧

Go 1.9 Release Party in Okinawa に参加した

とっても楽しかった!!

初めの 1 時間は deeeet さんの資料をみんなで読み進めながら、この機能はどう使うんだ?って話し合っていた。

印象に残っているのは Monotonic Clock の導入について。Go 1.8 の time.Now() はあくまで「現在の正しい時間」の取得に向いている Wall Clock のみだったが、 1.9 から時間計測にも向いた仕様に変更されたとのこと。つまり、閏秒や ntpd による時間の削除(変更)が行われた時もきちんと計測が可能になったとのこと。

もう一つは sync.Map について。これを使うよりは自前で実装した方がシンプルなのでは?といった疑問を持っていたが、この資料を読んで並行処理中の map の排他処理は一筋縄ではいかないようで、自前で実装するくらいなら色々便利な機能が含まれて高速な sync.Map を使った方が良い感じがした。

LT

今回の LT で Go で CLI ツールを作る時に error をどんな感じに返しているか、オプションの処理はどうしているのかといった話をした。

俺はこうして Go の CLI を作っている

最終的に os.Exit へ結果を持っていくような構成にしているため、どんな方法を用いて exitcode を error に合わせた値を返すようにしているのかといった Tips を紹介した。 github.com

こういった知見を久しぶりにちゃんとアウトプットできてよかったし、何よりパーティが楽しかったから本当に参加してよかった。

Golang 勉強会 in Okinawa | Doorkeeper

plenv を使った環境で AI::MXNet を簡単にインストールする

もっと簡単な方法があれば教えてほしいが、公式のインストールガイドを若干変更することで、簡単に依存関係を含めインストールできた。環境は OS X で以下の手順。

brew install swig
cpanm PDL Mouse Function::Parameters

export MXNET_HOME=${PWD}

# AI::MXNetCAPI のインストール
cd ${MXNET_HOME}/perl-package/AI-MXNetCAPI/
cpanm . # ここで Fail するが以下を続ける
install_name_tool -change lib/libmxnet.so \
    ${MXNET_HOME}/lib/libmxnet.so \
    blib/arch/auto/AI/MXNetCAPI/MXNetCAPI.bundle
make install

# AI::NNVMCAPI のインストール
cd ${MXNET_HOME}/perl-package/AI-NNVMCAPI/
cpanm . # ここで Fail するが以下を続ける
install_name_tool -change lib/libmxnet.so \
        ${MXNET_HOME}/lib/libmxnet.so \
        blib/arch/auto/AI/NNVMCAPI/NNVMCAPI.bundle
make install

# AI::MXNet のインストール
cd ${MXNET_HOME}/perl-package/AI-MXNet/
cpanm . # 依存関係のインストール、テストもやってくれるが時間がかかる

これで使える!!