一次虚拟机性能问题导致的应用故障
zhezhongyun 2025-09-29 15:59 5 浏览
最近我负责维护的一套语音平台出了问题。故障现象据客户反馈是转入IVR以后没有正常响应,客户无奈挂机了。
老实说,刚开始接到用户反馈的时候,我是不太相信的。我们的系统平时运行运行很稳定,客户的并发数不大,系统的硬件配置也挺高,遇到这样的问题还是“头一遭”!我甚至都怀疑又是上游系统的管理员推卸责任,“诬赖”我们系统(这事真不能怪我有想法,真是上游系统的管理员多次找我“麻烦”,系统一有异常就说我们的系统有问题,可实际上往往都是他自己平台的原因)。
谨慎起见,我还是远程登录,查了一下系统内置的通话记录(CDR)。出问题的时间段,有相同号码多次呼入系统,但是通话时间极短(10s以下),计费时长为0,挂机原因是“ORIGINATOR_CANCEL”,不像是正常通话;而在系统恢复时间点之后,该客户还有1次相对“够长”时间的语音呼入,应该是能电话沟通了,挂机原因也是正常的“NORMAL_CLEARING”。由此看来,我们的语音系统当时真地出现故障了!
我用less命令看了下故障当日的FS历史日志,确实在客户反馈的时段确实出现了多次“Socket Error”错误!用grep命令过滤“Socket Error”这个关键词,发现最近一段时间都有间歇性报这个错误。
仔细再检查了一下FS日志,我发现故障时段的“Socket Error”报错往往伴随着“socket(127.0.0.1:9000 async full)”和“Trying host: 127.0.0.1:9000”的错误。显然这是“Socket Error”的真实原因——FS连接本机的9000端口失败了!
9000这个端口的服务正是IVR Service提供的,要找到这次故障的具体原因还需要继续排查。
查看当天IVR服务的错误日志(Error log),我发现当时应用报了“JdbcConnectionException:Failed to obtain JDBC Connection”异常——应用程序连接数据库(mysql)错误。IVR应用连接不上mysql数据库,做不了CRUD操作,报出连接失败的错误,导致应用本身和上游的FS出错——这很正常。
继续检查mysql的错误日志。在当天故障时间段,相关的mysql日志有“InnoDB: page_cleaner”相关的一些异常信息。
查询deepseek“mysql的InnoDB page_cleaner会导致数据库连接失败吗”?deepseek回答:“是的,InnoDB的page_cleaner线程间接导致数据库连接失败是一个在生产环境中并不少见的问题,但它通常不是根本原因,而是更深层次问题的一个症状……因为刷脏本质是一个I/O操作……”。
至此,我确认需要检查一下服务器的IO使用情况,但是这台服务器上并没有安装iostat程序,而且服务器还不能上网。于是我找了一台能够上网的服务器,使用apt download命令下载了iostat程序的安装包,然后再用scp命令复制到这台服务器,最后用dpkg -i命令手动安装iostat程序包。
我用iostat -x /dev/vda3命令检查了一下服务器根目录所在的vda3的磁盘性能,发现不仅仅是磁盘使用率经常达到100%,平均等待队列也频频超过1,vda3的磁盘表现确实“拖后腿”了!
虚拟机服务器基础性能方面的问题就不在我的责任范围之内了,所以我把这个结论反馈给了负责这个项目的项目经理,由他再去和相关人员沟通讨论下一步的处理办法吧。这一次的故障排查就到这里了。
最后解释一下我为什么判断mysql故障是导致此次IVR连接异常的原因。1是根据调用关系。各子系统之间的关系示意如下:
FS和IVR都是中间层,都有“承上启下”的调用关系,而MySql是最终调用层,如果它表现异常,调用它的上层子系统都会受到影响。
2是根据日志中的报错时段。在FS和IVR日志中,类似“Socket Error”或者“JdbcConnectionException”的错误一直在持续,并不限于上述问题时间段(至少说明系统一直在“带病”工作),但是MySql出现“InnoDB page_cleaner”的报错时点则和此次问题的故障时间基本一致,进一步证实了MySql问题是导致本次故障的根本原因。
相关推荐
- VSCode中值得推荐的常用的23个高效前端插件(工具篇)(一)
-
VSCode是我们前端开发的一个强大的IDE,所以选择趁手好用的插件是提高开发效率,然后剩下的时间用来摸鱼是很有必要滴。工具篇(23)Chinese(Simplified)vscode我们都知道是...
- 高级前端进阶,用gulp提升你的开发效率
-
前言:这两天动手配置了一下gulp,发现gulp配置简单,构建速度快,在某些使用场景下还是个不错的选择,本文从零开始构建,到最后打包发布到生成环境。通过本文可以快速上手gulp,文末附送github源...
- Chrome 110 3大新特性!CSS支持画中画!
-
大家好,很高兴又见面了,我是"前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发!今天带着大家一起看看最新发布的Chrome1...
- 用html中If语句——判断ie浏览器的版本
-
if语句的代码的语法非常简单,,就是一个if判断语句来判断浏览器的类型和版本,应用类似<!--[iflteIE6]>和<![endif]-->语法结构包孕起来...
- 谷歌浏览器怎么开启无痕浏览_谷歌浏览器怎么开启无痕浏览模式
-
很多用户在使用谷歌浏览器时,不希望留下任何上痕迹,开启无痕浏览器是最好的选择。这个模式下可以更好的保护个人隐私记录,给你带来更加安全的冲浪体验,接下来就给大家详细介绍下谷歌浏览器的无痕浏览模式,希望对...
- Linux命令那么多,其实只需要记住这些就足够了!
-
你好,这里是网络技术联盟站,我是瑞哥。Linux命令行是一个强大且灵活的工具,可以极大地提高用户的工作效率和系统管理能力。我们都知道,Linux命令非常多,但是在实际的工作中,日常使用到的命令并不多,...
- Linux如何查看文件_linux如何查看文件大小
-
Linux如何查看目录下的所有文件?用ls(list)查看当前目录下的所有文件和子目录。Ls查看目录下的文件,怎么区分是目录还是文件呢?第一种方式,我们可以通过颜色来区分目录和文件。默认情况下,目录显...
- Linux系统man命令使用详解_linux man命令详解
-
man命令是在Linux和Unix系统上用于查看系统手册页(manualpages)的工具。手册页提供了关于系统命令、函数和文件的详细文档。命令语法:man[选项][命令或主题]参数:[选项]...
- linux ps命令详解_linux中ps
-
linux中ps只显示进程的静态快照,及瞬间的进程状态,它拥有众多的风格,可分为3组:UNIX风格,BSD风格,GNU风格,本文介绍UNIX风格的ps指令。参数ps[-aefFly][-ppid...
- 如何在 Linux 上查找系统硬件信息?hwinfo命令很强大!
-
hwinfo是一个功能强大的硬件信息查询工具,专为Linux系统设计。它能够提供系统中几乎所有硬件组件的详细信息,包括但不限于CPU、内存、硬盘、网络设备、USB设备、显卡、声卡等。与其他常...
- Linux Shell 入门教程(二):常用命令大全与使用技巧
-
在上一节《理解Linux与Shell》中,我们了解了Linux是什么、Shell是什么以及常见的Shell类型。这一篇,我们将正式动手操作,掌握使用频率最高、最实用的Linux命令...
- SpringBoot应用部署神器:可视化服务管理脚本让运维更轻松
-
在SpringBoot应用的生产环境部署中,传统的手动启停服务方式不仅效率低下,还容易出错。今天分享一个功能强大的可视化服务管理脚本,让SpringBoot应用的部署和运维变得简单高效。痛点分析:传统...
- 一次虚拟机性能问题导致的应用故障
-
最近我负责维护的一套语音平台出了问题。故障现象据客户反馈是转入IVR以后没有正常响应,客户无奈挂机了。老实说,刚开始接到用户反馈的时候,我是不太相信的。我们的系统平时运行运行很稳定,客户的并发数不大,...
- linux中的常用命令_linux常用命令及含义
-
linux中的常用命令linux中的命令统称shell命令shell是一个命令行解释器,将用户命令解析为操作系统所能理解的指令,实现用户与操作系统的交互shell终端:我们平时输入命令,执行程序的那个...
- linux学习笔记——常用命令-文件处理命令
-
ls目录处理命令:ls全名:list命令路径:/bin/ls执行权限:所有用户ls–ala--alll–long-i查看i节点ls–i查看i节点命令名称:mkdir命令英文原意:m...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 教程 (33)
- HTML 简介 (35)
- HTML 实例/测验 (32)
- HTML 测验 (32)
- JavaScript 和 HTML DOM 参考手册 (32)
- HTML 拓展阅读 (30)
- HTML文本框样式 (31)
- HTML滚动条样式 (34)
- HTML5 浏览器支持 (33)
- HTML5 新元素 (33)
- HTML5 WebSocket (30)
- HTML5 代码规范 (32)
- HTML5 标签 (717)
- HTML5 标签 (已废弃) (75)
- HTML5电子书 (32)
- HTML5开发工具 (34)
- HTML5小游戏源码 (34)
- HTML5模板下载 (30)
- HTTP 状态消息 (33)
- HTTP 方法:GET 对比 POST (33)
- 键盘快捷键 (35)
- 标签 (226)
- HTML button formtarget 属性 (30)
- opacity 属性 (32)
- transition 属性 (33)