t_wの輪郭

Feedlyでフォローするボタン
レコメンド強化学習活用と探索「欲しいものをもっと」算法

あれ

2021/3/3 0:46:00

強化学習においては学習が進むにつれて探索優先から活用優先に変わっていくのが定石とされている。しかし、レコメンドシステムにおいては活用優先から探索優先に変わっていくのがいいかもしれない。利用者の飽きを防止できる。

あれ

あれ

2021/3/3 1:04:00

推薦が無視されたときに、負の報酬を与えると探索的になる。