一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于图形硬件驱动的游戏图形性能测试方法与流程

2022-06-01 16:01:30 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种基于图形硬件驱动的游戏图形性能测试方法。


背景技术:

2.目前,在游戏研发过程中,需要游戏引擎程序人员使用硬件厂商提供的性能测试工具不停的人工评估游戏运行时性能,在性能测试分析过程中,需要人工运行不同厂商的gpu性能测试套件获取硬件单元资源消耗情况,该过程存在以下问题:人工分析游戏运行时图形性能工作量大且流程繁杂,通常需要花费2个小时以上时间评估游戏性能,不同的gpu厂商硬件提供的软件操作模式各不相同,学习成本、易用程度和工具稳定性各不相同,极大地降低了图形性能测试分析效率;因此,发明出一种基于图形硬件驱动的游戏图形性能测试方法变得尤为重要。


技术实现要素:

3.本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种基于图形硬件驱动的游戏图形性能测试方法。
4.为了实现上述目的,本发明采用了如下技术方案:
5.一种基于图形硬件驱动的游戏图形性能测试方法,该测试方法具体步骤如下:
6.(1)检测各设备类型并记录:对gpu设备连接状态进行实时检测,同时对连接的gpu设备的节点信息进行分类分析,并记录该设备类型;
7.(2)构建硬件性能计数器并调试:构建硬件性能计数器,同时计算机自行构建深度学习模型对该硬件性能计数器进行训练学习,并对硬件性能计数器存在的漏洞进行修复调整;
8.(3)收集待检测设备的性能数据:根据设置的游戏固定场景获取图形性能测试指标,硬件性能计数器对不同类型的各组设备进行数据提取,并将提取出的性能数据传输至硬件性能计数器中;
9.(4)对各检测设备进行评估检测:计算机接收硬件性能计数器传输的各组性能数据,同时自行对各组设备的性能数据进行评估,并依据评估结果生成各组设备gpu性能的优化指标和建议,同时生成检测日志记录优化指标和建议,并将其反馈给工作人员。
10.作为本发明的进一步方案,步骤(1)中所述分类分析具体步骤如下:
11.步骤一:检测gpu设备是否连接,若显示“设备已连接”,则对该设备驱动数据进行收集,若显示“设备未连接”,则对连接端口的连接状态进行实时检测,并等待设备连接;
12.步骤二:依据收集到的驱动数据将gpu设备按照高通设备、powervr设备、arm mali设备以及苹果ios设备进行分类;
13.步骤三:构建检测记录表,并将同一类型设备归为一族,再将该族中设备按照名称首字母a~z进行排序,同时将各族设备依次录入检测记录表中,并标记各设备录入时间。
14.作为本发明的进一步方案,步骤(2)中所述训练学习具体步骤如下:
15.第一步:深度学习模型收集n组观测数据,从n组观测数据中选择一个观测数据作为验证数据,使用剩下的观测数据拟合为一个测试模型,使用最先被排除的那个观测值通过均方根误差来验证这个模型的精度,如此重复n次;
16.第二步:列出所有可能的数据结果以建立数据样本,对于每一组数据,选取任意一个子集作为测试集,将测试集更换为另一子集,再取剩余子集作为训练集,再次统计均方根误差,直至对每组数据都进行一次预测,并选取最优预测结果设置为初始化参数值;
17.第三步:按照原本信息核对规则收集训练数据集,并依据最优参数对训练数据集进行标准化处理,最后将训练样本输送到深度学习模型中,自行设置模型具体参数,并采用长期迭代法训练该模型,最后将硬件性能计数器的数据输入到训练好的模型中。
18.作为本发明的进一步方案,步骤(3)中所述数据提取具体步骤如下:
19.q1:若为高通设备,则通过设置设备图形调试属性打开gpu性能测试开关,并针对测试的游戏程序赋予其联网权限,再通过套接字接收渲染阶段耗时;
20.q2:若测试程序是vulkan渲染的程序,则对adreno的性能调试层进行设置,通过设备节点定时采样收集各组数据,并通过对这些数据进行计算获取gpu性能数据;
21.q3:若为powervr设备,则通过imgtec提供的静态库获取gpu性能数据;
22.q4:若为arm mali设备,通过设置设备调试属性打开性能调试开关,同时通过设备节点输送指令获取性能数据文件描述符,再通过该文件描述符输送指令获取gpu性能数据;
23.q5:若为苹果设备,则通过开发版的app内部通过驱动获取性能数据,或通过instruments的rpc协议获取性能数据。
24.作为本发明的进一步方案,步骤(3)中所述图形性能测试指标具体包括当前显示场景对应的每秒渲染帧数、当前显示场景实际的gpu占用率、当前显示场景内存控制器总线占用率、当前显示场景实际占用的每秒gpu纹理以及着色器读取和写入字节数、当前显示场景实际的gpu算术逻辑单元占用率、当前显示场景实际的gpu基础特殊数学函数单元占用率、当前显示场景实际的gpu数据类型转换单元占用率、每帧渲染的渲染过程时间戳和耗时、苹果设备上metal着色器方法执行耗时、当前显示场景流处理器占用率以及支持vrs特性的设备上获取vrs图块比例。
25.相比于现有技术,本发明的有益效果在于:
26.1、该基于图形硬件驱动的游戏图形性能测试方法相较于以往的测试方法,本发明收集连接的gpu设备的节点信息,对各gpu设备类型进行分析,同时自行构建硬件性能计数器,并通过深度学习模型对该硬件性能计数器进行调试优化,优化完成的硬件性能计数器依据连接gpu设备类型以及设置的游戏固定场景获取图形性能测试指标,并通过不同的性能获取方法收集各组gpu设备的性能数据,并将收集到的性能数据反馈至计算机进行自动化评估,并依据评估结果生成各组设备gpu性能的优化指标和建议,通过计算机自行分析游戏运行时图形性能,能够减少工作人员的工作量,简化工作流程,节省工作人员时间,同时能够对不同类型设备进行性能分析,极大的提高了图形性能测试分析效率。
附图说明
27.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实
施例一起用于解释本发明,并不构成对本发明的限制。
28.图1为本发明提出的一种基于图形硬件驱动的游戏图形性能测试方法的流程框图;
29.图2为本发明提出的一种基于图形硬件驱动的游戏图形性能测试方法的评估流程图。
具体实施方式
30.参照图1-2,一种基于图形硬件驱动的游戏图形性能测试方法,该测试方法具体步骤如下:
31.检测各设备类型并记录:对gpu设备连接状态进行实时检测,同时对连接的gpu设备的节点信息进行分类分析,并记录该设备类型。
32.具体的,计算机检测gpu设备是否连接,若显示“设备已连接”,则对该设备驱动数据进行收集,若显示“设备未连接”,则对连接端口的连接状态进行实时检测,并等待设备连接,同时依据收集到的驱动数据将gpu设备按照高通设备、powervr设备、arm mali设备以及苹果ios设备进行分类,再自行构建检测记录表,并将同一类型设备归为一族,再将该族中设备按照名称首字母a~z进行排序,同时将各族设备依次录入检测记录表中,并标记各设备录入时间。
33.构建硬件性能计数器并调试:构建硬件性能计数器,同时计算机自行构建深度学习模型对该硬件性能计数器进行训练学习,并对硬件性能计数器存在的漏洞进行修复调整。
34.具体的,首先深度学习模型收集n组观测数据,从n组观测数据中选择一个观测数据作为验证数据,使用剩下的观测数据拟合为一个测试模型,使用最先被排除的那个观测值通过均方根误差来验证这个模型的精度,如此重复n次,重复完成后,再列出所有可能的数据结果以建立数据样本,对于每一组数据,选取任意一个子集作为测试集,将测试集更换为另一子集,再取剩余子集作为训练集,再次统计均方根误差,直至对每组数据都进行一次预测,并选取最优预测结果设置为初始化参数值,同时按照原本信息核对规则收集训练数据集,并依据最优参数对训练数据集进行标准化处理,最后将训练样本输送到深度学习模型中,自行设置模型具体参数,并采用长期迭代法训练该模型,最后将硬件性能计数器的数据输入到训练好的模型中。
35.收集待检测设备的性能数据:根据设置的游戏固定场景获取图形性能测试指标,硬件性能计数器对不同类型的各组设备进行数据提取,并将提取出的性能数据传输至硬件性能计数器中。
36.具体的,如图2所示,若为高通设备,则通过设置设备图形调试属性打开gpu性能测试开关,并针对测试的游戏程序赋予其联网权限,再通过套接字接收渲染阶段耗时,若测试程序是vulkan渲染的程序,则对adreno的性能调试层进行设置,通过设备节点定时采样收集各组数据,并通过对这些数据进行计算获取gpu性能数据,若为powervr设备,则通过imgtec提供的libpvrscopedeveloper.a静态库获取gpu性能数据,若为arm mali设备,通过设置设备调试属性打开性能调试开关,同时通过设备节点输送指令获取性能数据文件描述符,再通过该文件描述符输送指令获取gpu性能数据,若为苹果设备,则通过开发版的app内
部通过驱动获取性能数据,或通过instruments的rpc协议获取性能数据,通过计算机自行分析游戏运行时图形性能,能够减少工作人员的工作量,简化工作流程,节省工作人员时间,同时能够对不同类型设备进行性能分析,极大的提高了图形性能测试分析效率。
37.需要进一步说明的是,对于具体的gpu硬件性能数据交互协议,可通过拦截设备驱动文件节点的输入输出请求获得;对于苹果设备,同样是通过拦截iokit相关方法获取硬件交互协议;由于苹果设备支持instruments,我们还可以通过拦截套接字操作得到性能数据交互协议。
38.需要进一步说明的是,图形性能测试指标具体包括当前显示场景对应的每秒渲染帧数、当前显示场景实际的gpu占用率、当前显示场景内存控制器总线占用率、当前显示场景实际占用的每秒gpu纹理以及着色器读取和写入字节数、当前显示场景实际的gpu算术逻辑单元占用率、当前显示场景实际的gpu基础特殊数学函数单元占用率、当前显示场景实际的gpu数据类型转换单元占用率、每帧渲染的渲染过程时间戳和耗时、苹果设备上metal着色器方法执行耗时、当前显示场景流处理器占用率以及支持vrs特性的设备上获取vrs图块比例。
39.对各检测设备进行评估检测:计算机接收硬件性能计数器传输的各组性能数据,同时自行对各组设备的性能数据进行评估,并依据评估结果生成各组设备gpu性能的优化指标和建议,同时生成检测日志记录优化指标和建议,并将其反馈给工作人员。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献