Multi-armed bandit問題のライブラリを公開しました

Multi-armed bandit問題(バンディット問題)のライブラリを公開しました

https://github.com/jkomiyama/banditlib

バンディット問題とは?

id:lxyumaさんのわかりやすい解説

http://lxyuma.hatenablog.com/entry/2013/09/18/002613

QuitaのA/Bテストへの応用に関する記事

http://qiita.com/yuku_t/items/6844aac6008911401b19

IBIS2011(国内学会)での中村先生の解説

http://ibisml.org/archive/ibis2011/ibis2011-nakamura.pdf

岡野原さんの解説

http://hillbig.cocolog-nifty.com/do/2008/07/icml2008_0777.html

何ができるの?

確率的バンディット問題の主要なアルゴリズム(UCB, Thompson sampling , DMED, etc)を試すことができます。

元々自分の研究のためのプログラムを書き直したものなので、今のところかなり単純です。何かのシステムに役立つというよりは、バンディットアルゴリズムを手軽に試してみるのに便利、程度に考えていただくのが良いと思います。