<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body>
<div dir="auto">
<div><br>
<div class="gmail_extra"><br>
<div class="gmail_quote">19 июля 2017 г. 9:14 PM пользователь Andrey Vagin &lt;avagin@virtuozzo.com&gt; написал:<br type="attribution">
<blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><font size="2"><span style="font-size:10pt">
<div>On Wed, Jul 19, 2017 at 08:04:22PM &#43;0300, Andrey Ryabinin wrote:<br>
&gt; <br>
&gt; <br>
&gt; On 07/19/2017 04:14 AM, Andrei Vagin wrote:<br>
&gt; &gt; From: Andrei Vagin &lt;avagin@virtuozzo.com&gt;<br>
&gt; &gt; <br>
&gt; &gt; task_work_run() has to be called before exit_task_namespaces(),<br>
&gt; &gt; because fuse_abort_conn() is called from __fput(). If it will not<br>
&gt; &gt; be executed, we can hang in request_wait_answer(). We have seen this<br>
&gt; &gt; situation when a process was the last member of a mount namespace<br>
&gt; &gt; and the mount namespace has a vstorage fuse mount.<br>
&gt; &gt; <br>
&gt; <br>
&gt; Can we pleas have a changelog that doesn't look like an output of random text generator?<br>
<br>
Thanks!<br>
<br>
&gt; The fact that &quot;fuse_abort_conn() is called from __fput()&quot; doesn't really explain why<br>
&gt; task_work_run() needs to be called before exit_task_namespaces.<br>
&gt; <br>
<br>
Here is another version of my random text generator. It has to be more<br>
detailed.<br>
<br>
This patch solves a problem for a following case. We have a container (a<br>
group of processes in pid and mount namespaces) with a fuse mount. An<br>
init process exits and the kernel kills all process in its pid<br>
namespace. There is a fuse daemon, which handle the fuse mount.<br>
Currently the kernel kills this process and closes all its file<br>
descriptors, but __fput() for them is postponed and they will be<br>
called from a task_work.&nbsp; Then the kernel starts destroying the mount<br>
namespace and the fuse mount, it sees that a control descriptor for<br>
this mount is alive and sends a request to a fuse daemon:<br>
<br>
$ cat /proc/4353/task/4355/stack <br>
[&lt;ffffffffa04c3451&gt;] request_wait_answer&#43;0x91/0x270 [fuse]<br>
[&lt;ffffffffa04c36b7&gt;] __fuse_request_send&#43;0x87/0xe0 [fuse]<br>
[&lt;ffffffffa04c6c47&gt;] fuse_request_check_and_send&#43;0x27/0x30 [fuse]<br>
[&lt;ffffffffa04c6c60&gt;] fuse_request_send&#43;0x10/0x20 [fuse]<br>
[&lt;ffffffffa04d2f35&gt;] fuse_put_super&#43;0x55/0xc0 [fuse]<br>
[&lt;ffffffff81218b32&gt;] generic_shutdown_super&#43;0x72/0xf0<br>
[&lt;ffffffff81218f12&gt;] kill_anon_super&#43;0x12/0x20<br>
[&lt;ffffffffa04d2577&gt;] fuse_kill_sb_anon&#43;0x47/0x50 [fuse]<br>
[&lt;ffffffff812194a9&gt;] deactivate_locked_super&#43;0x49/0x80<br>
[&lt;ffffffff81219526&gt;] deactivate_super&#43;0x46/0x60<br>
[&lt;ffffffff81237145&gt;] mntput_no_expire&#43;0xc5/0x120<br>
[&lt;ffffffff812371c4&gt;] mntput&#43;0x24/0x40<br>
[&lt;ffffffff812372f8&gt;] namespace_unlock&#43;0x118/0x130<br>
[&lt;ffffffff81239f2b&gt;] put_mnt_ns&#43;0x4b/0x60<br>
[&lt;ffffffff810b786b&gt;] free_nsproxy&#43;0x1b/0x90<br>
[&lt;ffffffff810b7a0a&gt;] switch_task_namespaces&#43;0x5a/0x70<br>
[&lt;ffffffff810b7ae0&gt;] exit_task_namespaces&#43;0x10/0x20<br>
[&lt;ffffffff8108c883&gt;] do_exit&#43;0x2f3/0xb20<br>
[&lt;ffffffff8108d12f&gt;] do_group_exit&#43;0x3f/0xa0<br>
[&lt;ffffffff8109e760&gt;] get_signal_to_deliver&#43;0x1d0/0x6d0<br>
[&lt;ffffffff8102a357&gt;] do_signal&#43;0x57/0x6b0<br>
[&lt;ffffffff8102aa0f&gt;] do_notify_resume&#43;0x5f/0xb0<br>
[&lt;ffffffff8169273d&gt;] int_signal&#43;0x12/0x17<br>
[&lt;ffffffffffffffff&gt;] 0xffffffffffffffff<br>
<br>
But we know that a fuse daemon is already dead and the control<br>
descriptor isn't closed completely, because __fput() was postponed.<br>
<br>
This patch calls task_work_run() before destroying namespaces to<br>
complete closing all process files.<br>
</div>
</span></font></div>
</blockquote>
</div>
</div>
</div>
<div dir="auto"><br>
</div>
<div dir="auto">Now I have a question. Because rised questions look reasonable.</div>
<div dir="auto">This sounds like a generic issue.</div>
<div dir="auto">I.e. it's either solved in upstream likewise or otherwise. Or not solved at all.</div>
<div dir="auto">I.e. what's the status of this issue in linux-next?</div>
<div dir="auto"><br>
</div>
<div dir="auto">
<div class="gmail_extra">
<div class="gmail_quote">
<blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><font size="2"><span style="font-size:10pt">
<div><br>
&gt; <br>
&gt; <br>
&gt; &gt; <a href="https://jira.sw.ru/browse/PSBM-68266">https://jira.sw.ru/browse/PSBM-68266</a><br>
&gt; &gt; Signed-off-by: Andrei Vagin &lt;avagin@virtuozzo.com&gt;<br>
&gt; &gt; ---<br>
&gt; &gt;&nbsp; include/linux/task_work.h | 9 &#43;&#43;&#43;&#43;&#43;&#43;&#43;--<br>
&gt; &gt;&nbsp; kernel/exit.c&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; | 9 &#43;&#43;&#43;&#43;&#43;&#43;&#43;&#43;&#43;<br>
&gt; &gt;&nbsp; kernel/task_work.c&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; | 4 &#43;&#43;--<br>
&gt; &gt;&nbsp; 3 files changed, 18 insertions(&#43;), 4 deletions(-)<br>
&gt; &gt; <br>
&gt; &gt; diff --git a/include/linux/task_work.h b/include/linux/task_work.h<br>
&gt; &gt; index ca5a1cf..b3af76d 100644<br>
&gt; &gt; --- a/include/linux/task_work.h<br>
&gt; &gt; &#43;&#43;&#43; b/include/linux/task_work.h<br>
&gt; &gt; @@ -14,11 &#43;14,16 @@ init_task_work(struct callback_head *twork, task_work_func_t func)<br>
&gt; &gt;&nbsp; <br>
&gt; &gt;&nbsp; int task_work_add(struct task_struct *task, struct callback_head *twork, bool);<br>
&gt; &gt;&nbsp; struct callback_head *task_work_cancel(struct task_struct *, task_work_func_t);<br>
&gt; &gt; -void task_work_run(void);<br>
&gt; &gt; &#43;void __task_work_run(bool exiting);<br>
&gt; &gt; &#43;<br>
&gt; &gt; &#43;static inline void task_work_run(void)<br>
&gt; &gt; &#43;{<!-- --><br>
&gt; &gt; &#43;&nbsp;&nbsp; return __task_work_run(false);<br>
&gt; &gt; &#43;}<br>
&gt; &gt;&nbsp; <br>
&gt; &gt;&nbsp; static inline void exit_task_work(struct task_struct *task)<br>
&gt; &gt;&nbsp; {<!-- --><br>
&gt; &gt; -&nbsp;&nbsp; task_work_run();<br>
&gt; &gt; &#43;&nbsp;&nbsp; __task_work_run(true);<br>
&gt; &gt;&nbsp; }<br>
&gt; &gt;&nbsp; <br>
&gt; &gt;&nbsp; #endif&nbsp;&nbsp;&nbsp;&nbsp; /* _LINUX_TASK_WORK_H */<br>
&gt; &gt; diff --git a/kernel/exit.c b/kernel/exit.c<br>
&gt; &gt; index 3c83db2..ea54a73 100644<br>
&gt; &gt; --- a/kernel/exit.c<br>
&gt; &gt; &#43;&#43;&#43; b/kernel/exit.c<br>
&gt; &gt; @@ -827,6 &#43;827,15 @@ void do_exit(long code)<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; exit_fs(tsk);<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if (group_dead)<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; disassociate_ctty(1);<br>
&gt; &gt; &#43;<br>
&gt; &gt; &#43;&nbsp;&nbsp; /*<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp; * task_work_run() has to be called before exit_task_namespaces(),<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp; * because fuse_abort_conn() is called from __fput(). If it will not<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp; * be executed, we can hang in request_wait_answer(). We have seen this<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp; * situation when a process was the last member of a mount namespace<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp; * and the mount namespace has a vstorage fuse mount.<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp; */<br>
&gt; &gt; &#43;&nbsp;&nbsp; task_work_run();<br>
&gt; <br>
&gt; Given that this is purely fuse's problem, maybe request_wait_answer() could just call task_work_run()?<br>
&gt; <br>
&gt; Or maybe we can just call exit_task_work(tsk) before exit_task_namespaces(tsk). This seems fine to me,<br>
&gt; but perhaps I'm missing something.<br>
&gt; <br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; exit_task_namespaces(tsk);<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; exit_task_work(tsk);<br>
&gt; &gt;&nbsp; <br>
&gt; &gt; diff --git a/kernel/task_work.c b/kernel/task_work.c<br>
&gt; &gt; index 65bd3c9..f0000c4 100644<br>
&gt; &gt; --- a/kernel/task_work.c<br>
&gt; &gt; &#43;&#43;&#43; b/kernel/task_work.c<br>
&gt; &gt; @@ -46,7 &#43;46,7 @@ task_work_cancel(struct task_struct *task, task_work_func_t func)<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; return work;<br>
&gt; &gt;&nbsp; }<br>
&gt; &gt;&nbsp; <br>
&gt; &gt; -void task_work_run(void)<br>
&gt; &gt; &#43;void __task_work_run(bool exiting)<br>
&gt; &gt;&nbsp; {<!-- --><br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; struct task_struct *task = current;<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; struct callback_head *work, *head, *next;<br>
&gt; &gt; @@ -58,7 &#43;58,7 @@ void task_work_run(void)<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; */<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; do {<!-- --><br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; work = ACCESS_ONCE(task-&gt;task_works);<br>
&gt; &gt; -&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; head = !work &amp;&amp; (task-&gt;flags &amp; PF_EXITING) ?<br>
&gt; &gt; &#43;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; head = !work &amp;&amp; exiting ?<br>
&gt; <br>
&gt; Why we need this change? AFAIU this will allow to add more task_works in exit_task_namespaces()<br>
&gt; before final exit_task_work(). What's the point of this?<br>
&gt; <br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &amp;work_exited : NULL;<br>
&gt; &gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; } while (cmpxchg(&amp;task-&gt;task_works, work, head) != work);<br>
&gt; &gt;&nbsp; <br>
&gt; &gt; <br>
_______________________________________________<br>
Devel mailing list<br>
Devel@openvz.org<br>
<a href="https://lists.openvz.org/mailman/listinfo/devel">https://lists.openvz.org/mailman/listinfo/devel</a><br>
</div>
</span></font></div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</body>
</html>