Multi-armed bandit問題のライブラリを公開しました
Multi-armed bandit問題(バンディット問題)のライブラリを公開しました
https://github.com/jkomiyama/banditlib
バンディット問題とは?
id:lxyumaさんのわかりやすい解説
http://lxyuma.hatenablog.com/entry/2013/09/18/002613
QuitaのA/Bテストへの応用に関する記事
http://qiita.com/yuku_t/items/6844aac6008911401b19
IBIS2011(国内学会)での中村先生の解説
http://ibisml.org/archive/ibis2011/ibis2011-nakamura.pdf
岡野原さんの解説
http://hillbig.cocolog-nifty.com/do/2008/07/icml2008_0777.html
何ができるの?
確率的バンディット問題の主要なアルゴリズム(UCB, Thompson sampling , DMED, etc)を試すことができます。
元々自分の研究のためのプログラムを書き直したものなので、今のところかなり単純です。何かのシステムに役立つというよりは、バンディットアルゴリズムを手軽に試してみるのに便利、程度に考えていただくのが良いと思います。