线上使用阿里Druid连接池首次连接MySQL异常问题

来源:互联网 发布:js给select标签负值 编辑:程序博客网 时间:2024/05/01 03:41

问题描述

最近一段时间线上系统表现出一个这样的现象:每天第一次登录系统不成功,如果再次点击登录即可登录成功。这种现象不是偶尔发生,后来发现每天来第一次登录都会有此问题。

分析现象

开始以为是登录接口存在问题,于是从登录接口开始排查,经过对登录接口排查,发现登录不成功时接口返回数据库空。经过反复测试,发现问题不是每天第一次登录才会出现,而是如果系统20分钟左右没有人使用,再次登录就会重现该问题。

后来又陆续发现不只登录接口会出现返回数据为空的情况,其它接口也同样会出现该问题,并且也是等待20分钟左右必定会出现该问题。

经过对问题产生的现象进行总结,发现只要系统在一段时间内没有操作,再进行对系统首次访问就会出现该问题。

尝试解决

首先,笔者在互联网进行搜索,看看是否有遇到过此问题的。没想到,还真有人遇到类似的问题,网上一篇博客讲的问题跟我的类似:

http://www.cnblogs.com/zhukunrong/p/4525955.html

但上面这篇博文却没有找到该问题的根本原因。

在互联网上无法找到该问题的确切原因只能自己进行排查,于是开始对代码进行排查,尝试解决。经过对代码的跟踪,发现出现问题时数据库连接对象无法正常获取,于是猜测是否数据库连接池中无可用连接导致的。笔者使用的连接池为阿里的Druid,已经相对比较成熟了,对连接池的配置和MySQL的系统设置超时时间等都进行检查未发现有任何异常,并尝试修改一些配置,但丝毫不起作用。

最后没有什么好的办法,只能在代码中打印一些日志,跟踪代码到底执行到哪一步出现问题。笔者将Druid的源码下载,并在源码中打印日志,最终发现,Druid对数据库连接池中的连接会进行可用性检查,检查方式是调用MySQL的驱动中的ping()方法。经过测试,发现如果出现问题,调用ping()方法就会超时,不出现问题则正常。于是开始在网上搜索关于Druid调用ping()方法超时的问题,在GitHub中有人对Druid进行反馈,存在连接ping命令验证连接存在阻塞问题:

https://github.com/alibaba/druid/issues/919

里面反馈是Druid的一个bug问题,而且Druid源码作者已在最新版本中解决该bug。于是笔者将项目中Druid的版本升级到最新版本,再次测试,问题还是没有解决。

最终解决

最后,只能将Druid换成其它的数据库连接池,但笔者换成dbcp也是不行,与Druid存在同样的问题,而换成c3p0问题不再出现。

0 0