Thanks to visit codestin.com
Credit goes to github.com

Skip to content

st81/ope-continuous-reward

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

(雑多なメモ)報酬が連続値の場合のオフ方策評価の精度検証内の結果を出力するためのリポジトリ。

Experiments

id desc
1 1.2.2-1.2.4 dm-ips-dr に近い形で OPE やってみる。IPS 推定量のばらつき確認
2 1 を連続値にしてみる
3 2 で beta = 1
4 2 で beta = 0.1
5 4 でpi_0 推定
6 4 でpi 推定
7 4 でpi_0, pi 推定
8 4 で only positive reward (未完成)

今後試したいこと。オンライン実験、信頼区間、only positive reard, ほぼ0 reward、SNIPS、DRなど。

Build Docker image

docker build -t ope-continuous-reward .

Run Docker container

docker run \
    -it \
    --rm \
    -v $(pwd):/work \
    --entrypoint python \
    ope-continuous-reward \
    exps/<xxx>.py

References

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published