You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
-
各位老师好,有个rocketmq的问题请教一下:
问题现象:在生产环境中,会偶发(一两个月发生一次)rocketmq消息发送超时问题,客户端日志报sendDefaultImpl call timeout,此问题一直持续,此时,pull消息也会发生超时,直到重启客户端应用才能恢复正常。
就是应用到这个broker上的这个tcp连接上,客户端发送的请求,服务端broker始终没有返回,导致客户端超时。
RocketMQ版本:4.5.1
问题分析线索:
(1)问题发生时发送超时的消息都是发往某一个特定的broker
(2)从网络抓包看,发生问题的时候,从发生问题的时间点开始,只有从客户端往这个特定的broker发送的数据包,broker没有数据包返回,直到客户端应用重启才恢复正常。
(3)从broker的监控看,发生问题的时间段里面,cpu的使用率会提高,但幅度不大,本来cpu idle稳定在98%,但是发生问题的时候,cpu idle跳到92%左右,客户端重启后cpu idle回到98%左右并保持稳定。
(4) broker的log里没有明显的报错信息
请问各位有没有碰到过类似的问题?有什么分析的思路,请不吝赐教。
Beta Was this translation helpful? Give feedback.
All reactions