最近发现一个特别蛋疼的问题,在Hetzner独服上装的Proxmox经常会失联,只能到后台硬重启,但是重启了没几天又失联了。。一共搞了3次,第一次我自己重启恢复了没2天又挂了,发了个工单他们技术貌似也是给我重启了一下,然后没过几天又挂了。。
这问题有两个症状:
1.带宽不能跑高,比如长期跑满1GBps会经常出现短暂的断网(一开始我还以为是线路不好丢包)
2.就是上面说的了,莫名其妙失联,只能硬重启。
第一次挂的时候我就觉得有点莫名其妙,侥幸心理觉得可能是偶尔挂了一下,但是现在发现总是挂,这不是个办法啊,只能自己先判断一下是哪里出问题了。
凭HZ后台的那个服务器状态初步推断应该就是网断了,不是机器死机了之类的,硬件问题可能性不大。然后就一个劲的翻系统日志和内核日志,看的老子眼睛都快看花了,终于发现了一点有用的东西:
关键字:enp0s31f6:Detected Hardware Unit Hang
然后Google搜了一下,找了半天终于在Proxmox的论坛上发现这个帖子:
https://forum.proxmox.com/threads/proxmox-node-freezes.44618/
看来有这问题的还不止我一个,这个帖子里面至少有5个都和我一样碰到过这种问题,而且多数都是在Hetzner的机器上。。
至于解决办法,这个帖子很详细了。。(我是观察了2天确定用帖子里面的方法解决了才发的这篇文章)
如果你要临时解决:
apt -y install ethtool
执行:
/sbin/ethtool -K 主网卡名 tx off rx off
彻底解决(需要重启机器),编辑网卡配置文件:
nano /etc/network/interfaces
在一个有自启动(auto)的网卡下面加上:
post-up /sbin/ethtool -K 主网卡名 tx off rx off
比如我是vmbr0桥接的主网卡,主网卡我没有设置自启动,但vmbr0设置了,那就配置在vmbr0下面也是可以的:
重启之后验证是否生效:
/sbin/ethtool -k enp0s31f6
确定rx-checksumming和tx-checksumming都是off:
搞定收工~
LALA
我什么都不卖了,告辞!
最新评论
5211314
能不能教我 一点不会