#21天打卡游戏人的日常思考# 博/*和谐*/弈/*和谐*/论方法的引入,为在不确定性问题的处理上提供了理想的技术工具,譬如基于反事实遗憾最小化(Counter Factual Regret Minimization)方法实现的德州AI,通过寻找博弈中的纳什均衡点,在1对1,以及最近在多人德/*和谐*/州/*和谐*/扑/*和谐*/克游戏上击败了人类职业玩家。

同时,博/*和谐*/弈/*和谐*/论和多智能体(Multi-agent)相结合,在如同机器人足球,线上多人游戏的场景中,探索不同智能体间合作和对抗的策略,也给 AI 的研究方向带来了许多创新的想法,而且对于解决现实世界中的问题都是非常必要的,因为真实环境中AI面对的绝大多数问题,都是信息不完全而且存在多方合作或对抗的情况。
全部评论

相关推荐

思念SiN:你这里没有通过的主要原因应该是计算平均分数的时候,在你贴的代码的第23行: ```c b[i]=(sum-max-min)/(m-2); ``` 等式的右边实际上是两个`int`类型的变量在做除法,C语言里面得到的结果会是这个除法的整数部分,余数部分被舍弃了,也不会自动变成浮点数去做除法。所以虽然你使用了`b[i]`这个浮点数去接收结果,但是等式右边除法是先得到了一个整数,然后再被转换为浮点数再赋值给了`b[i]`。你可以按下面这样,在做除法之前,先进行类型转换,就能得到期望的结果: ```c b[i]=(float)(sum-max-min)/(float)(m-2); ```
点赞 评论 收藏
分享
评论
4
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务