pct国内申请,说明书已公开。
技术特征:
技术总结
一种AI对象的行为模型建立方法以及装置,能够根据环境的实时改变做出相应的决策,提高游戏的灵活性。提供如下技术方案:获取AI对象所处的第一环境的第一实时状态信息(S201);提取第一实时状态信息的特征信息(S202);根据特征信息和学习网络的权重值得到AI对象的动作策略(S203);将动作策略反馈给AI对象,以使得AI对象执行动作策略(S204);获取AI对象所处的第二环境的第二实时状态信息,第二环境为AI对象执行动作策略之后生成(S205);根据第二实时状态信息得到动作策略的回报值(S206);若回报值符合预设条件,则确定学习网络的权重值为学习网络的目标权重值(S208);根据目标权重值建立AI对象的行为模型(S209)。
技术研发人员:姜润知;李源纯;黄柳优;李德元;王鹏;魏学峰
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2017.10.17
技术公布日:2019.06.04
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。