<div dir="ltr">Hey Guys,<div><br></div><div style>I&#39;ve spent days and countless hours trying to figure out what is going on here and I&#39;m totally out of ideas, I&#39;ve tried posting on the openvz forum but for some reason the post is not approved, so now I&#39;m reaching out to you all.</div>
<div style><br></div><div style>I&#39;ve even emailed OpenVZ for paid commercial support, I&#39;m happy to pay for support for this issue as we have been using OpenVZ for many years problem free on many servers.</div><div style>
<br></div><div style>Here is the issue:</div><div style><br></div><div style>One of oru CentOS 5.9 x86_64 servers, last weekend I upgraded the kernel from 2.6.18-194.8.1.el5.028stab070.4 to the latest</div><div style>2.6.18-308.8.2.el5.028stab101.1. (we use ksplice so I don&#39;t have to reboot the HN too often)</div>
<div style><br></div><div style><div>Installed VZ packages:</div><div><br></div><div><div>vzctl-core-4.1.2-1</div><div>ovzkernel-2.6.18-308.8.2.el5.028stab101.1</div><div>vzctl-4.1.2-1</div><div>ovzkernel-2.6.18-194.8.1.el5.028stab070.4</div>
<div>ovzkernel-devel-2.6.18-308.8.2.el5.028stab101.1</div><div>vzquota-3.1-1</div><div>ovzkernel-2.6.18-308.el5.028stab099.3</div><div>ovzkernel-2.6.18-238.9.1.el5.028stab089.1</div></div></div><div style><br></div><div style>
Upon booting the new 2.6.18-308.8.2.el5.028stab101.1 kernel, I started seeing strange kernel errors when starting the containers:</div><div style><br></div><div style><br></div><div style>&quot;Jan 26 20:46:06 vz02 kernel: CT: 103: started</div>
<div>Jan 26 20:46:08 vz02 kernel: CPT ERR: ffff81031e46a000,103 :NLMERR: -22</div><div>Jan 26 20:46:08 vz02 last message repeated 8 times</div><div>Jan 26 20:46:12 vz02 kernel: CT: 104: started</div><div>Jan 26 20:46:14 vz02 kernel: CPT ERR: ffff81031e46a000,104 :open_listening_socket: sock_create_kern: -97</div>
<div>Jan 26 20:46:14 vz02 kernel: CPT ERR: ffff81031e46a000,104 :rst_sockets: open_listening_socket: -97</div><div>Jan 26 20:46:14 vz02 kernel: CPT ERR: ffff81031e46a000,104 :rst_sockets: -97</div><div>Jan 26 20:46:14 vz02 kernel: CT: 104: stopped</div>
<div>Jan 26 20:46:15 vz02 kernel: CT: 104: started</div><div>Jan 26 20:46:17 vz02 kernel: CT: 105: started</div><div>Jan 26 20:46:19 vz02 kernel: CPT ERR: ffff81032156a000,105 :NLMERR: -22</div><div>Jan 26 20:46:19 vz02 last message repeated 8 times</div>
<div>Jan 26 20:46:19 vz02 kernel: CPT ERR: ffff81032156a000,105 :open_listening_socket: sock_create_kern: -97</div><div>Jan 26 20:46:19 vz02 kernel: CPT ERR: ffff81032156a000,105 :rst_sockets: open_listening_socket: -97</div>
<div>Jan 26 20:46:19 vz02 kernel: CPT ERR: ffff81032156a000,105 :rst_sockets: -97</div><div>&quot;<br></div><div><br></div><div>--snip-- this goes on and on...<br></div><div style><br>The containers did start up, but networking was not working. I could not ping them, they could not ping out.</div>
<div style>Their interfaces were up, most of them use venet.</div><div style><br></div><div style>So I did a vzctl restart on each container, they threw out the same error messages, but networking started working again.</div>
<div style><br></div><div style>What makes even less sense is, we have other identical servers, same hardware, same version of CentOS, same VZ kernel - no issues. What am I missing here?</div><div style><br></div><div style>
Here is a copy of our vz.conf, nothing fancy:</div><div style><br></div><div style>&quot;</div><div style><div>VIRTUOZZO=yes</div><div>LOCKDIR=/vz/lock</div><div>DUMPDIR=/vz/dump</div><div>VE0CPUUNITS=1000</div><div><br></div>
<div>## Logging parameters</div><div>LOGGING=yes</div><div>LOGFILE=/var/log/vzctl.log</div><div>LOG_LEVEL=0</div><div>VERBOSE=0</div><div><br></div><div>## Disk quota parameters</div><div>DISK_QUOTA=yes</div><div>VZFASTBOOT=no</div>
<div><br></div><div># Disable module loading. If set, vz initscript do not load any modules.</div><div>#MODULES_DISABLED=yes</div><div><br></div><div># The name of the device whose IP address will be used as source IP for CT.</div>
<div># By default automatically assigned.</div><div>#VE_ROUTE_SRC_DEV=&quot;eth0&quot;</div><div><br></div><div># Controls which interfaces to send ARP requests and modify APR tables on.</div><div>NEIGHBOUR_DEVS=all</div>
<div>ERROR_ON_ARPFAIL=&quot;no&quot;</div><div><br></div><div><br></div><div>## Template parameters</div><div>TEMPLATE=/vz/template</div><div><br></div><div>## Defaults for containers</div><div>VE_ROOT=/vz/root/$VEID</div>
<div>VE_PRIVATE=/vz/private/$VEID</div><div>CONFIGFILE=&quot;vps.basic&quot;</div><div>DEF_OSTEMPLATE=&quot;fedora-core-4&quot;</div><div><br></div><div>## Load vzwdog module</div><div>VZWDOG=&quot;no&quot;</div><div><br>
</div><div>## IPv4 iptables kernel modules</div><div>#IPTABLES=&quot;ipt_REJECT ipt_tos ipt_limit ipt_multiport iptable_filter iptable_mangle ipt_TCPMSS ipt_tcpmss ipt_ttl ipt_length ipt_state iptable_nat &quot;</div><div>
<br></div><div>IPTABLES=&quot;iptable_filter iptable_mangle ipt_limit ipt_multiport ipt_tos ipt_TOS ipt_REJECT ipt_TCPMSS ipt_tcpmss ipt_ttl ipt_LOG ipt_length ip_conntrack ip_conntrack_ftp ip_conntrack_irc ipt_conntrack ipt_state ipt_helper iptable_nat ip_nat_ftp ip_nat_irc ipt_REDIRECT ipt_MASQUERADE&quot;</div>
<div><br></div><div>## Enable IPv6</div><div>IPV6=&quot;no&quot;</div><div><br></div><div>## IPv6 ip6tables kernel modules</div><div>IP6TABLES=&quot;ip6_tables ip6table_filter ip6table_mangle ip6t_REJECT&quot;</div></div>
<div style>&quot;</div><div style><br></div><div style>Here is a example container config.</div><div style><br></div><div style>&quot;</div><div style><div>ONBOOT=&quot;yes&quot;</div><div><br></div><div>NUMPROC=&quot;5102:5102&quot;</div>
<div>AVNUMPROC=&quot;2551:2551&quot;</div><div>NUMTCPSOCK=&quot;5102:5102&quot;</div><div>NUMOTHERSOCK=&quot;5102:5102&quot;</div><div>VMGUARPAGES=&quot;262144:9223372036854775807&quot;</div><div><br></div><div># Secondary parameters</div>
<div>KMEMSIZE=&quot;209012940:229914234&quot;</div><div>TCPSNDBUF=&quot;48773188:69670980&quot;</div><div>TCPRCVBUF=&quot;48773188:69670980&quot;</div><div>OTHERSOCKBUF=&quot;24386594:45284386&quot;</div><div>DGRAMRCVBUF=&quot;24386594:24386594&quot;</div>
<div>OOMGUARPAGES=&quot;151485:9223372036854775807&quot;</div><div>PRIVVMPAGES=&quot;256000:262140&quot;</div><div><br></div><div># Auxiliary parameters</div><div>LOCKEDPAGES=&quot;10205:10205&quot;</div><div>SHMPAGES=&quot;90891:90891&quot;</div>
<div>PHYSPAGES=&quot;0:9223372036854775807&quot;</div><div>NUMFILE=&quot;81632:81632&quot;</div><div>NUMFLOCK=&quot;1000:1100&quot;</div><div>NUMPTY=&quot;510:510&quot;</div><div>NUMSIGINFO=&quot;1024:1024&quot;</div><div>
DCACHESIZE=&quot;45650516:47020032&quot;</div><div><br></div><div>NUMIPTENT=&quot;3072:3072&quot;</div><div># Disk Resource Limits</div><div>DISKINODES=&quot;4560000:4800000&quot;</div><div>DISKSPACE=&quot;39845888:41943040&quot;</div>
<div><br></div><div># Quota Resource Limits</div><div>QUOTATIME=&quot;0&quot;</div><div>QUOTAUGIDLIMIT=&quot;3000&quot;</div><div><br></div><div># CPU Resource Limits</div><div>CPUUNITS=&quot;1000&quot;</div><div>#RATE=&quot;eth0:1:6000&quot;</div>
<div><br></div><div># IPTables config</div><div>IPTABLES=&quot;ipt_REJECT ipt_tos ipt_limit ipt_multiport iptable_filter iptable_mangle ipt_TCPMSS ipt_tcpmss ipt_ttl ipt_length ip_conntrack ip_conntrack_ftp ipt_LOG ipt_conntrack ipt_helper ipt_state iptable_nat ip_nat_ftp ipt_TOS ipt_REDIRECT&quot;</div>
<div><br></div><div># Default Devices</div><div>#DEVICES=&quot;c:10:229:rw c:10:200:rw &quot;</div><div><br></div><div>IP_ADDRESS=&quot;1.2.3.4&quot;</div><div>HOSTNAME=&quot;<a href="http://nscache01.xxx.com">nscache01.xxx.com</a>&quot;</div>
<div>VE_ROOT=&quot;/vz/root/$VEID&quot;</div><div>VE_PRIVATE=&quot;/vz/private/$VEID&quot;</div><div>OSTEMPLATE=&quot;centos-5-x86_64&quot;</div><div>ORIGIN_SAMPLE=&quot;512mb&quot;</div><div>NAMESERVER=&quot;1.2.3.4&quot;</div>
<div>NAME=&quot;nscache01-xxx&quot;</div><div>&quot;</div></div><div style><br></div><div style>Any ideas? Configuration issue? Kernel bug?</div><div style><br></div><div style>I also noticed a container that used to run OpenVPN no longer works, so even though networking is now &quot;working&quot; something is still going on...</div>
<div style><br></div><div style>The one thing I did do before upgrading the kernel is I had to remove ploop as there were some dependency issues.</div><div style>We don&#39;t use any ploop based containers so I don&#39;t believe this should affect us? We did the same on another server and had no issue...</div>
<div style><br></div><div style>If anyone wants to respond directly to me that provides paid support, OpenVZ developers or anyone else I&#39;m of course happy to pay, I don&#39;t expect someone to spend hours troubleshooting something for free.</div>
<div style><br></div><div style>Or, of course if any other list readers have any ideas please let me know! :)</div><div style><br>Thanks in advance for your help.</div><div style><br></div><div style>-PJF</div></div>