![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
考虑以下场景:AiphaGo通过自我博弈进行学习。根据强化学习的简单定义,以下哪个选项属于行动(action)()?
A.落子的位置
B.最终的胜负
C.棋盘棋子的布局
D.当前领先的日数
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.落子的位置
B.最终的胜负
C.棋盘棋子的布局
D.当前领先的日数
A.价值对规律和事实的引导
B. 通过政府管制
C. 修正在还原过程中简化的抽象,引入心理和精神因素
D. 社会各阶层之间的博弈和妥协
A.是指相同的博弈者会不断重逢,并且会重复面对相似的“囚徒困境”的选择条件的一种博弈
B.在“重复性囚徒困境”下,理性博弈者将考虑,如果我拒绝合作,不断背叛,那么对手为了减少他的损失他也背叛
C.通过重复,博弈者可按对手以往选择而决定当前选择
D.如果博弈者关心未来收益,而且博弈没有确定的时间限度,被惩罚的威胁似乎是不能保证每一博弈阶段的稳定合作
A.策略博弈的本质在于团体协作
B.博弈的过程中参与者相互影响制约
C.博弈中每一步的结果都直接影响全局
D.博弈过程中要为他人设身处地地考虑
A.人工智能指的是真正能思考、有知觉、有自我意识的人类级别的智能机器
B.阿尔法围棋的核心系统属于基于神经网络的深度学习,过大量数据分析学习棋谱,再通过增强学习的方法自我博弈,寻找比基础棋谱更多的打击点来击败对手
C.人工智能、机器学习与深度学习是相对独立的,它们之间没有必然的联系
D.神经网络是目前人工智能领域的研究热点之一,是一种模拟动物神经网络行为特征,进行并行信息处理的算法模型
A.战略在特定的环境下可以成为行动过程中的手段和策略
B.战略在竞争博弈中可以作为威胁和战胜竞争对手的工具
C.战略反映了企业战略决策者的价值观念
D.战略观念通过个人的期望和行为而形成共享
A.人是构成场景的重要要素,在考虑菜单场景时,要充分考虑顾客的人数、性别、年龄、身份等因素
B.除了考虑顾客用餐的功能目的,还要考虑其情绪目标
C.满足顾客用餐的显性目的比隐性目标更重要
D.让顾客能吃饱是属于隐性目标