<div dir="ltr">OK! I have applied this patch. The error message is this:<div><br><div><div>Warn  (cr-restore.c:1047): Set CLONE_PARENT | CLONE_NEWPID but it might cause restore problem,because not all kernels support such clone flags combinations!</div><div>RTNETLINK answers: File exists</div><div>RTNETLINK answers: File exists</div><div>RTNETLINK answers: File exists</div><div>RTNETLINK answers: File exists</div><div>RTNETLINK answers: File exists</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c4ff peer 0 (name /run/systemd/notify dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c501 peer 0 (name /run/systemd/private dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c50b peer 0 (name /run/systemd/shutdownd dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c50d peer 0 (name /run/systemd/journal/dev-log dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c511 peer 0 (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c513 peer 0 (name /run/systemd/journal/socket dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2b88d peer 0x28bc5 (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c289 peer 0x2abaf (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c28c peer 0x2b4cf (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c28d peer 0x2b33d (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c28a peer 0x2c8fa (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>     1: Error (sk-unix.c:1245): sk unix: Can&#39;t unlink stale socket 0x2c28b peer 0x2b902 (name /run/systemd/journal/stdout dir -)</div><div>: No such file or directory</div><div>    68: Error (sk-packet.c:419): Can&#39;t bind packet socket: Invalid argument</div><div>Error (cr-restore.c:1235): 28680 killed by signal 19</div><div>Error (cr-restore.c:1235): 28680 killed by signal 19</div><div>Error (cr-restore.c:1959): Restoring FAILED.</div></div><div><br></div><div>BTW my network config is:</div><div><div>br0       Link encap:Ethernet  HWaddr 40:f2:e9:d2:81:38  </div><div>          inet addr:xxx  Bcast:xxx  Mask:255.255.255.0</div><div>          inet6 addr: xxx Scope:Global</div><div>          inet6 addr: xxx Scope:Link</div><div>          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1</div><div>          RX packets:1472399 errors:0 dropped:0 overruns:0 frame:0</div><div>          TX packets:30432 errors:0 dropped:0 overruns:0 carrier:0</div><div>          collisions:0 txqueuelen:0 </div><div>          RX bytes:115725262 (110.3 MiB)  TX bytes:4463645 (4.2 MiB)</div><div><br></div><div>eth0      Link encap:Ethernet  HWaddr 40:f2:e9:d2:81:38  </div><div>          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1</div><div>          RX packets:1642533 errors:0 dropped:1196 overruns:0 frame:0</div><div>          TX packets:100308 errors:0 dropped:0 overruns:0 carrier:0</div><div>          collisions:0 txqueuelen:1000 </div><div>          RX bytes:352311619 (335.9 MiB)  TX bytes:9232447 (8.8 MiB)</div><div>          Memory:90580000-9059ffff </div><div><br></div><div>lo        Link encap:Local Loopback  </div><div>          inet addr:127.0.0.1  Mask:255.0.0.0</div><div>          inet6 addr: ::1/128 Scope:Host</div><div>          UP LOOPBACK RUNNING  MTU:65536  Metric:1</div><div>          RX packets:0 errors:0 dropped:0 overruns:0 frame:0</div><div>          TX packets:0 errors:0 dropped:0 overruns:0 carrier:0</div><div>          collisions:0 txqueuelen:0 </div><div>          RX bytes:0 (0.0 B)  TX bytes:0 (0.0 B)</div></div><div><br></div><div><br></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-10-15 2:54 GMT+08:00 Tycho Andersen <span dir="ltr">&lt;<a href="mailto:tycho.andersen@canonical.com" target="_blank">tycho.andersen@canonical.com</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Jason, Pavel,<br>
<div><div class="h5"><br>
On Wed, Oct 14, 2015 at 03:03:37PM +0300, Pavel Emelyanov wrote:<br>
&gt; Adding Tycho (an LXC guy) to the discussion.<br>
&gt;<br>
&gt; On 10/14/2015 06:56 AM, Jason Lee wrote:<br>
&gt; &gt; Hi all!<br>
&gt; &gt; Recently I use lxc-checkpoint to c/r linux container.When dumping criu,It&#39;s no<br>
&gt; &gt; problem.but I use lxc-checkpoint -r to restore one lxc. It&#39;s failed!<br>
&gt; &gt; BTW My host os is debian 8 .Here is my enviorment:<br>
&gt; &gt;<br>
&gt; &gt; lxc.rootfs = /usr/local/var/lib/lxc/d1/rootfs<br>
&gt; &gt; lxc.include = /usr/local/share/lxc/config/debian.common.conf<br>
&gt; &gt; lxc.utsname = d1<br>
&gt; &gt; lxc.arch = amd64<br>
&gt; &gt; lxc.tty = 0<br>
&gt; &gt; lxc.pts = 1<br>
&gt; &gt; lxc.console = none<br>
&gt; &gt;<br>
&gt; &gt; #lxc.cap.drop = sys_module mac_admin mac_override sys_time<br>
&gt; &gt; lxc.cgroup.devices.deny = c 5:1 rwm<br>
&gt; &gt; lxc.aa_allow_incomplete = 1<br>
&gt; &gt; lxc.network.type = veth<br>
&gt; &gt; lxc.network.flags = up<br>
&gt; &gt; # that&#39;s the interface defined above in host&#39;s interfaces file<br>
&gt; &gt; lxc.network.link = br0<br>
&gt; &gt; # name of network device inside the container,<br>
&gt; &gt; # defaults to eth0, you could choose a name freely<br>
&gt; &gt; # <a href="http://lxc.network.name" rel="noreferrer" target="_blank">lxc.network.name</a> &lt;<a href="http://lxc.network.name" rel="noreferrer" target="_blank">http://lxc.network.name</a>&gt; = lxcnet0<br>
&gt; &gt; lxc.network.hwaddr = 00:16:3e:d2:29:be<br>
&gt; &gt;<br>
&gt; &gt; mount point:<br>
&gt; &gt; root@dslab:/home# mount<br>
&gt; &gt; sysfs on /sys type sysfs (rw,nosuid,nodev,noexec,relatime)<br>
&gt; &gt; proc on /proc type proc (rw,nosuid,nodev,noexec,relatime)<br>
&gt; &gt; udev on /dev type devtmpfs (rw,relatime,size=10240k,nr_inodes=1002688,mode=755)<br>
&gt; &gt; devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000)<br>
&gt; &gt; tmpfs on /run type tmpfs (rw,nosuid,relatime,size=1607656k,mode=755)<br>
&gt; &gt; /dev/sda6 on / type ext4 (rw,relatime,errors=remount-ro,data=ordered)<br>
&gt; &gt; securityfs on /sys/kernel/security type securityfs (rw,nosuid,nodev,noexec,relatime)<br>
&gt; &gt; tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev)<br>
&gt; &gt; tmpfs on /run/lock type tmpfs (rw,nosuid,nodev,noexec,relatime,size=5120k)<br>
&gt; &gt; tmpfs on /sys/fs/cgroup type tmpfs (ro,nosuid,nodev,noexec,mode=755)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/systemd type cgroup (rw,nosuid,nodev,noexec,relatime,xattr,release_agent=/lib/systemd/systemd-cgroups-agent,name=systemd)<br>
&gt; &gt; pstore on /sys/fs/pstore type pstore (rw,nosuid,nodev,noexec,relatime)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/cpuset type cgroup (rw,nosuid,nodev,noexec,relatime,cpuset,clone_children)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/cpu,cpuacct type cgroup (rw,nosuid,nodev,noexec,relatime,cpu,cpuacct)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/memory type cgroup (rw,nosuid,nodev,noexec,relatime,memory)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/devices type cgroup (rw,nosuid,nodev,noexec,relatime,devices)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/freezer type cgroup (rw,nosuid,nodev,noexec,relatime,freezer)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/net_cls,net_prio type cgroup (rw,nosuid,nodev,noexec,relatime,net_cls,net_prio)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/blkio type cgroup (rw,nosuid,nodev,noexec,relatime,blkio)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/perf_event type cgroup (rw,nosuid,nodev,noexec,relatime,perf_event)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/hugetlb type cgroup (rw,nosuid,nodev,noexec,relatime,hugetlb)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/debug type cgroup (rw,nosuid,nodev,noexec,relatime,debug)<br>
&gt; &gt; cgroup on /sys/fs/cgroup/palloc type cgroup (rw,nosuid,nodev,noexec,relatime,palloc)<br>
&gt; &gt; systemd-1 on /proc/sys/fs/binfmt_misc type autofs (rw,relatime,fd=23,pgrp=1,timeout=300,minproto=5,maxproto=5,direct)<br>
&gt; &gt; debugfs on /sys/kernel/debug type debugfs (rw,relatime)<br>
&gt; &gt; mqueue on /dev/mqueue type mqueue (rw,relatime)<br>
&gt; &gt; hugetlbfs on /dev/hugepages type hugetlbfs (rw,relatime)<br>
&gt; &gt; /dev/sda4 on /boot type ext4 (rw,relatime,data=ordered)<br>
&gt; &gt; rpc_pipefs on /run/rpc_pipefs type rpc_pipefs (rw,relatime)<br>
&gt; &gt;<br>
&gt; &gt; root@dslab:/home# lxc-checkpoint -r -n d1 -D /home/checkpoint_dir/d2/<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/palloc/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/debug/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/hugetlb/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/perf_event/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/blkio/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/net_cls,net_prio/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/freezer/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/devices/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/memory/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/cpu,cpuacct/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: cgfs.c: cgroup_rmdir: 207 Device or resource busy - cgroup_rmdir: failed to delete /sys/fs/cgroup/cpuset/lxc/d1-2<br>
&gt; &gt; lxc-checkpoint: lxccontainer.c: do_lxcapi_restore: 3772 restore process died<br>
&gt; &gt; Restoring d1 failed.<br>
<br>
</div></div>I&#39;ve seen these from the restore code before and they&#39;re benign<br>
(basically, the restore failed and not all the tasks were wait()ed on<br>
before we try to delete the cgroup). That said, it&#39;s ugly and I&#39;ll try<br>
to post a fix soon.<br>
<span class=""><br>
&gt; &gt; Warn  (cr-restore.c:1041): Set CLONE_PARENT | CLONE_NEWPID but it might cause restore problem,because not all kernels support such clone flags combinations!<br>
&gt; &gt; RTNETLINK answers: File exists<br>
&gt; &gt; RTNETLINK answers: File exists<br>
&gt; &gt; RTNETLINK answers: File exists<br>
&gt; &gt; RTNETLINK answers: File exists<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x36a8 peer 0 (name /run/systemd/notify dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x36aa peer 0 (name /run/systemd/private dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x36b4 peer 0 (name /run/systemd/shutdownd dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x36b6 peer 0 (name /run/systemd/journal/dev-log dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x36ba peer 0 (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x36bc peer 0 (name /run/systemd/journal/socket dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x5bad peer 0x70ea (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x6da7 peer 0x3788 (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x6da6 peer 0x5f21 (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x6da8 peer 0x784b (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x6da9 peer 0x6b10 (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;      1: Warn  (sk-unix.c:1229): sk unix: Can&#39;t unlink stale socket 0x6daa peer 0x6159 (name /run/systemd/journal/stdout dir -)<br>
&gt; &gt;     68: Error (sk-packet.c:419): Can&#39;t bind packet socket: Invalid argument<br>
&gt; &gt; Error (cr-restore.c:1236): 3159 killed by signal 19<br>
&gt; &gt; Error (cr-restore.c:1236): 3159 killed by signal 19<br>
&gt; &gt; Error (cr-restore.c:1933): Restoring FAILED.<br>
<br>
</span>Here the real problem. bind() is failing, probably because the unlink<br>
above failed. Unfortunately, we don&#39;t log the reason for the bind()<br>
failing, can you try with the attached patch?<br>
<br>
Pavel, perhaps we should apply this so it does report the error?<br>
<span class="HOEnZb"><font color="#888888"><br>
Tycho<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
&gt; &gt; --- Checkpoint/Restore ---<br>
&gt; &gt; checkpoint restore: enabled<br>
&gt; &gt; CONFIG_FHANDLE: enabled<br>
&gt; &gt; CONFIG_EVENTFD: enabled<br>
&gt; &gt; CONFIG_EPOLL: enabled<br>
&gt; &gt; CONFIG_UNIX_DIAG: enabled<br>
&gt; &gt; CONFIG_INET_DIAG: enabled<br>
&gt; &gt; CONFIG_PACKET_DIAG: enabled<br>
&gt; &gt; CONFIG_NETLINK_DIAG: enabled<br>
&gt; &gt; File capabilities: enabled<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; How can I solve this problem? It&#39;s the same as the ubuntu.<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; CRIU mailing list<br>
&gt; &gt; <a href="mailto:CRIU@openvz.org">CRIU@openvz.org</a><br>
&gt; &gt; <a href="https://lists.openvz.org/mailman/listinfo/criu" rel="noreferrer" target="_blank">https://lists.openvz.org/mailman/listinfo/criu</a><br>
&gt; &gt;<br>
&gt;<br>
</div></div></blockquote></div><br></div>