一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种网卡的性能优化测试方法、系统、装置及存储介质与流程

2022-12-13 22:10:13 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,更具体的说是涉及一种网卡的性能优化测试方法、系统、装置及存储介质。


背景技术:

2.nf5488a5是新一代ai服务器,支持8颗第三代nvlink全互联的nvidia a100gpu,同时搭载2颗最新支持pcie4.0的amd cpu,可为用户提供极致的ai性能和超高速带宽,为智能客服、金融分析、智慧城市、智能语言处理等各类ai场景提供强大的算力支撑。nf5488a5采用numa绑定策略,可实现cpu与最近gpu的指定通信,大幅提升cpu与gpu之间的数据传输效率,实现了更低的数据传输延迟和更高的带宽,满足了各种ai负载高效数据通信需求。
3.目前基于nf5488a5项目,100g以上pxie网卡在跑iperf测试时,双口同时跑iperf,会出现性能不达标问题。因此,需要针对nf5488a5机型进行网卡的调整优化。
4.现有技术中,网卡调优方法一般是针对网卡本身和bios的调优,通过修改参数来调整网卡的性能。但是,由于amd cpu与intelcpu性能差异较大,nf5488a5机型pcie网卡并非直连cpu,是连接switch的,网卡处理网络请求的中断需绑定到相同cpu中断上才可以发挥网卡的全部性能,单凭调节网卡本身参数及bios无法完全发挥网卡的全部性能。


技术实现要素:

5.针对以上问题,本发明的目的在于提供一种网卡的性能优化测试方法、系统、装置及存储介质,通过关闭linux下的irq balance服务,将网卡所在的cpu numa上的核心绑定到该网卡的处理中断上,以此来降低网卡性能的消耗,提升网卡性能。
6.本发明为实现上述目的,通过以下技术方案实现:一种网卡的性能优化测试方法,包括:
7.s1:准备两台测试服务器,配置两台服务器的静态ip,使其可以正常ping通;
8.s2:关闭测试服务器网卡的irq balance服务;
9.s3:调节网卡参数;
10.s4:查询网卡所在服务器的cpu核心数;
11.s5:查询网卡的中断号;
12.s6:将网卡的中断号与cpu核心进行绑定;
13.s7:将两台测试服务器都进行中断绑定;
14.s8:执行网络性能测试,并根据测试结果调整中断绑定数量。
15.进一步,所述步骤s1包括:
16.准备两台测试服务器,一台为测试机,一台为待测机;
17.将两台服务器互连,并查询待测机网卡的网口号;
18.配置待测机网卡的静态ip,并使两台服务器可以互相ping通。
19.进一步,所述步骤s2包括:
20.通过命令systemctl stop firewalld关闭防火墙;
21.通过命令systemctl stop irqbalance.service停止操作系统自带的irq balance服务。
22.进一步,所述步骤s3包括:
23.调节网卡参数,设置网络中可传输包的最大尺寸,并设置网口的中断号。
24.进一步,所述步骤s4包括:
25.查询网卡所在的numa及该numa上的cpu核心的编号。
26.进一步,所述步骤s6包括:
27.根据中断号和cpu核心的编号,将所有中断与cpu核心进行一一绑定;
28.如果网卡为双口网卡,将两个网口均进行绑定,两个网口绑定在不同的muna的cpu核心上。
29.进一步,所述s8包括:
30.两台测试服务器使用taskset

c命令加绑定的核数,来进行iperf测试;
31.若测试结果符合标准,则测试通过;若测试结果不符合标准,则按照预设机制增加中断的绑定数量,并继续测试,直至测试结果符合标准。
32.相应的,本发明还公开了一种网卡的性能优化测试系统,包括:
33.配置模块,用于准备两台测试服务器,配置两台服务器的静态ip,使其可以正常ping通;
34.服务关闭模块,用于关闭测试服务器网卡的irq balance服务;
35.调节模块,用于调节网卡参数;
36.第一查询模块,用于查询网卡所在服务器的cpu核心数;
37.第二查询模块,用于查询网卡的中断号;
38.绑核模块,用于将网卡的中断号与cpu核心进行绑定;
39.中断绑定模块,用于将两台测试服务器都进行中断绑定;
40.测试模块,用于执行网络性能测试,并根据测试结果调整中断绑定数量。
41.相应的,本发明公开了一种网卡的性能优化测试装置,包括:
42.存储器,用于存储网卡的性能优化测试程序;
43.处理器,用于执行所述网卡的性能优化测试程序时实现如上文任一项所述网卡的性能优化测试方法的步骤。
44.相应的,本发明公开了一种可读存储介质,所述可读存储介质上存储有网卡的性能优化测试程序,所述网卡的性能优化测试程序被处理器执行时实现如上文任一项所述网卡的性能优化测试方法的步骤。
45.对比现有技术,本发明有益效果在于:本发明公开了一种网卡的性能优化测试方法、系统、装置及存储介质,通过关闭linux下的irq balance服务,将网卡所在的cpu numa上的核心绑定到该网卡的处理中断上,通过判断性能测试结果,来增加或减少中断数量,使网卡性能达到最大值,以此来降低网卡性能的消耗,提升网卡性能。
46.由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
47.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
48.图1是本发明具体实施方式的方法流程图。
49.图2是本发明具体实施方式的系统结构图。
50.图中,1、配置模块;2、服务关闭模块;3、调节模块;4、第一查询模块;5、第二查询模块;6、绑核模块;7、中断绑定模块;8、测试模块。
具体实施方式
51.本发明的核心是提供一种网卡的性能优化测试方法,现有技术中,网卡调优方法一般是针对网卡本身和bios的调优,通过修改参数来调整网卡的性能。但是,由于amd cpu与intelcpu性能差异较大,nf5488a5机型pcie网卡并非直连cpu,是连接switch的,网卡处理网络请求的中断需绑定到相同cpu中断上才可以发挥网卡的全部性能,单凭调节网卡本身参数及bios无法完全发挥网卡的全部性能。
52.而本发明提供的网卡的性能优化测试方法,首先,准备测试机器,配置两台机器静态ip,使其可能正常ping通。然后,关闭网卡本身自动调节的服务,并调节网卡参数。此时,查询网卡所在的cpu numa并查询网卡的中断号。接着,将查询的网卡所在的numa的cpu core绑定到查询的网卡中断上,并将两台机器都进行中断绑定。最后,执行网络性能测试,通过判断测试结果,来增加或减少绑定中断的数量,使网卡的性能达到最大值。由此可见,本发明通过关闭linux下的irq balance服务,将网卡所在的cpu numa上的核心绑定到该网卡的处理中断上,以此来降低网卡性能的消耗,提升网卡性能。
53.为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.实施例一:
55.如图1所示,本实施例提供了一种网卡的性能优化测试方法,包括如下步骤:
56.s1:准备两台测试服务器,配置两台服务器的静态ip,使其可以正常ping通。
57.具体的,准备两台测试服务器,一台为测试机,一台为待测机;将两台服务器互连,并查询待测机网卡的网口号;配置待测机网卡的静态ip,并使两台服务器可以互相ping通。
58.s2:关闭测试服务器网卡的irq balance服务。
59.具体的,通过命令systemctl stop firewalld关闭防火墙;通过命令systemctl stop irqbalance.service停止操作系统自带的irq balance服务。
60.s3:调节网卡参数。
61.具体的,调节网卡参数,设置网络中可传输包的最大尺寸,并设置网口的中断号。
62.作为示例的,如果当前网卡网口为eth0和eth1,且该网卡位于numa0,且numa0的core为0-7,numa1的core为8-15。
63.则通过以下命令调节网卡参数,设置mtu为9000:
64.ethtool-k《interface_name》lro on
65.ethtool-k《interface_name》hw-tc-offload on
66.ethtool-k《interface_name》tx-nocache-copy on
67.ethtool-g《interface_name》rx 8192tx 8192
68.ip link set mtu 9000dev《interface_name》
69.通过一下命令设置网口的中断号:
70.ethtool-l《interface_name》combined 8。
71.s4:查询网卡所在服务器的cpu核心数。
72.具体的,查询网卡所在的numa及该numa上的cpu核心的编号。
73.作为示例的,通过命令
74.cat/sys/class/net/eth0/device/numa_node
75.lscpu
76.查看网卡所在numa的core是多少。
77.s5:查询网卡的中断号。
78.作为示例的,通过命令cat/proc/interrupt|grep eth0查看网口eth0的中断号,在之前步骤中已经设置为8,该命令会打印八个中断,如162-169。
79.s6:将网卡的中断号与cpu核心进行绑定。
80.具体的,根据中断号和cpu核心的编号,将所有中断与cpu核心进行一一绑定;如果网卡为双口网卡,将两个网口均进行绑定,两个网口绑定在不同的muna的cpu核心上。
81.作为示例的,通过以下命令进行绑核:
82.echo 0》/proc/irq/162/smp_affinity_list设置中断162调用cpu core 0
83.echo 1》/proc/irq/163/smp_affinity_list设置中断163调用cpu core 1
84.…
85.echo 7》/proc/irq/169/smp_affinity_list设置中断169调用cpu core 7
86.通过上述命令把8个中断全部进行绑定,如果是双口网卡,将两个口都进行绑定,两个口不要绑定在相同的numa core上,第二个口可以借相邻的numa core来绑定。比如该网卡位于numa0,numa0已经绑定到第一个网口上了,那第二个网口就可以绑定numa1中的core。
87.s7:将两台测试服务器都进行中断绑定。
88.s8:执行网络性能测试,并根据测试结果调整中断绑定数量。
89.作为示例的,测试端和服务端使用taskset

c加绑定的核数,来进行iperf测试,具体命令如下:
90.taskset

c 0-7iperf

s/taskset

c 0-7iperf

c 1.1.1.1

i 2

w 512k

t 43200

p 8.
91.若测试结果符合标准,则测试通过;若测试结果不符合标准,则按照预设机制增加中断的绑定数量,并继续测试,直至测试结果符合标准。
92.本实施例提供了一种网卡的性能优化测试方法,通过关闭linux下的irq balance服务,将网卡所在的cpu numa上的核心绑定到该网卡的处理中断上,通过判断性能测试结
果,来增加或减少中断数量,使网卡性能达到最大值,以此来降低网卡性能的消耗,提升网卡性能。
93.实施例二:
94.基于实施例一,如图2所示,本发明还公开了一种网卡的性能优化测试系统,包括:配置模块1、服务关闭模块2、调节模块3、第一查询模块4、第二查询模块5、绑核模块6、中断绑定模块7和测试模块8。
95.配置模块1,用于准备两台测试服务器,配置两台服务器的静态ip,使其可以正常ping通。配置模块1具体用于:准备两台测试服务器,一台为测试机,一台为待测机;将两台服务器互连,并查询待测机网卡的网口号;配置待测机网卡的静态ip,并使两台服务器可以互相ping通。
96.服务关闭模块2,用于关闭测试服务器网卡的irq balance服务。服务关闭模块2具体用于:通过命令systemctl stop firewalld关闭防火墙;通过命令systemctl stop irqbalance.service停止操作系统自带的irq balance服务。
97.调节模块3,用于调节网卡参数。调节模块3具体用于:调节网卡参数,设置网络中可传输包的最大尺寸,并设置网口的中断号。
98.第一查询模块4,用于查询网卡所在服务器的cpu核心数。第一查询模块4具体用于:查询网卡所在的numa及该numa上的cpu核心的编号。
99.第二查询模块5,用于查询网卡的中断号。第二查询模块5具体用于:通过命令cat/proc/interrupt|grep eth0查看网口eth0的中断号。
100.绑核模块6,用于将网卡的中断号与cpu核心进行绑定。绑核模块6具体用于:根据中断号和cpu核心的编号,将所有中断与cpu核心进行一一绑定;如果网卡为双口网卡,将两个网口均进行绑定,两个网口绑定在不同的muna的cpu核心上。
101.中断绑定模块7,用于将两台测试服务器都进行中断绑定。
102.测试模块8,用于执行网络性能测试,并根据测试结果调整中断绑定数量。测试模块8具体用于:两台测试服务器使用taskset

c命令加绑定的核数,来进行iperf测试;若测试结果符合标准,则测试通过;若测试结果不符合标准,则按照预设机制增加中断的绑定数量,并继续测试,直至测试结果符合标准。
103.本实施例提供了一种网卡的性能优化测试系统,通过关闭linux下的irq balance服务,将网卡所在的cpu numa上的核心绑定到该网卡的处理中断上,通过判断性能测试结果,来增加或减少中断数量,使网卡性能达到最大值,以此来降低网卡性能的消耗,提升网卡性能。
104.实施例三:
105.本实施例公开了一种网卡的性能优化测试装置,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的网卡的性能优化测试程序时实现以下步骤:
106.1、准备两台测试服务器,配置两台服务器的静态ip,使其可以正常ping通。
107.2、关闭测试服务器网卡的irq balance服务。
108.3、调节网卡参数。
109.4、查询网卡所在服务器的cpu核心数。
110.5、查询网卡的中断号。
111.6、将网卡的中断号与cpu核心进行绑定。
112.7、将两台测试服务器都进行中断绑定。
113.8、执行网络性能测试,并根据测试结果调整中断绑定数量。
114.进一步的,本实施例中的网卡的性能优化测试装置,还可以包括:
115.输入接口,用于获取外界导入的网卡的性能优化测试程序,并将获取到的网卡的性能优化测试程序保存至所述存储器中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器中,以便处理器利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口具体可以包括但不限于usb接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。
116.输出接口,用于将处理器产生的各种数据输出至与其相连的终端设备,以便于与输出接口相连的其他终端设备能够获取到处理器产生的各种数据。本实施例中,所述输出接口具体可以包括但不限于usb接口、串行接口等。
117.通讯单元,用于在网卡的性能优化测试装置和外部服务器之间建立远程通讯连接,以便于网卡的性能优化测试装置能够将镜像文件挂载到外部服务器中。本实施例中,通讯单元具体可以包括但不限于基于无线通讯技术或有线通讯技术的远程通讯单元。
118.键盘,用于获取用户通过实时敲击键帽而输入的各种参数数据或指令。
119.显示器,用于运行服务器供电线路短路定位过程的相关信息进行实时显示。
120.鼠标,可以用于协助用户输入数据并简化用户的操作。
121.实施例四:
122.本实施例还公开了一种可读存储介质,这里所说的可读存储介质包括随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动硬盘、cd-rom或技术领域内所公知的任意其他形式的存储介质。可读存储介质中存储有网卡的性能优化测试程序,所述网卡的性能优化测试程序被处理器执行时实现以下步骤:
123.1、准备两台测试服务器,配置两台服务器的静态ip,使其可以正常ping通。
124.2、关闭测试服务器网卡的irq balance服务。
125.3、调节网卡参数。
126.4、查询网卡所在服务器的cpu核心数。
127.5、查询网卡的中断号。
128.6、将网卡的中断号与cpu核心进行绑定。
129.7、将两台测试服务器都进行中断绑定。
130.8、执行网络性能测试,并根据测试结果调整中断绑定数量。
131.综上所述,本发明通过关闭linux下的irq balance服务,将网卡所在的cpu numa上的核心绑定到该网卡的处理中断上,以此来降低网卡性能的消耗,提升网卡性能。
132.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
133.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和
软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
134.在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
135.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
136.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
137.同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
138.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
139.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
140.以上对本发明所提供的网卡的性能优化测试方法、系统、装置及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献