![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
[单选题]
()是通过与环境的交互和奖惩机制,反复重演,完成最优策略的自主学习。
A.深度学习
B.监督/半监督学习
C.无监督学习
D.强化学习
查看答案
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.深度学习
B.监督/半监督学习
C.无监督学习
D.强化学习
A.绿色发展指数 公众满意程度
B.环境发展指数 人民满意程度
C.绿色发展指数 人民满意程度
D.环境发展指数 公众满意程度
A.矛盾对立统一
B.坚持实事求是,从实际出发
C.发展是前进性和曲折性的统一
D.整体与部分辩证统一的关系
A.录用
B.调任
C.奖惩
D.提拔