阿里云VPS高负载CentOS CPU占用高的排查与解决

今天打开宝塔面板系统监控,看到资源使用率上跳下跳,就感觉服务器可能哪里不正常,在「平均负载」调整到30天,看到有的时段负载率接近100%了。一定是服务器中哪个程序干扰了服务器的资源使用。

问题排查

目前使用的是阿里云的VPS,系统搭载CentOS 7.9 x86_64(Py3.7.9)。在网上查到查到在CentOS系统中top命令常用的性能分析工具,它可以实时显示系统相关进程的运行状态比如CPU、内存的使用率 。

top命令显示的进程状态几个重要的列含义如下:

%CPU 上次更新到现在的CPU时间占用百分比

%MEM 进程使用的物理内存百分比

TIME+ 进程使用的CPU时间总计,单位1/100秒

RES 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA

COMMAND 命令名/命令行

从TOP命令显示的系统实时状态中,可以看到AliYunDun占用的CPU比较高,显示值是8.6,其它进程的%CPU值都不高。因此导致VPS CPU占用过高问题的真凶很可能是在AliYunDun这个进程上。

卸载云安全中心(安骑士)

通过搜索查到AliYunDun是阿里云云安全中心(安骑士)的进程,如果太占系统资源不再需要使用安骑士防护阿里云VPS时,可以按以下方法卸载。

1、登录云安全中心管理控制台

2、在左侧找到选择“设置”菜单,并在右侧选择“安装/卸载插件”页面。

3、选择“卸载客户端”,云安全中心是阿里云官方提供的云服务器安全防护软件,关闭后,将卸装客户端所有防护程序,产生影响如下:

  • 服务器将关闭漏洞、基线检测防护能力
  • 服务器将失去病毒查杀及入侵防御的能力
  • 服务器上开启的防篡改,防勒索将停止保护
  • 服务器上安全日志将停止采集及投递
  • 容器场景下运行时的安全防护及容器防火墙功能将停止保护

然后勾选相关改进建议,比如资源占用用。在「资产分组」中既要卸载的服务器然后勾选,并按确定。

效果

在卸载云安全中心后,再使用TOP命令查看系统状态,COMMAND里已经没有AliYunDun了。CPU使用率变成正常状态,从下面截图中可以看到15分钟系统负载降低一半,VPS负载状态下降的非常的明显。

转载需保留链接来源:VCBeta.CN » 阿里云VPS高负载CentOS CPU占用高的排查与解决

赞 (0)