问题:Linux虚拟内存管理中的active_mm作用?
问题的提出:阅读Linux虚拟内存管理源码时,看到复制一个mm ,里面赋值了tsk->mm 和tsk->active_mm ,于是回忆这两者的作用。
static int copy_mm(unsigned long clone_flags, struct task_struct * tsk)
{
struct mm_struct * mm, *oldmm;
int retval;
tsk->min_flt = tsk->maj_flt = 0;
tsk->cmin_flt = tsk->cmaj_flt = 0;
tsk->nswap = tsk->cnswap = 0;
tsk->mm = NULL;
tsk->active_mm = NULL;
oldmm = current->mm;
if (!oldmm)
return 0;
if (clone_flags & CLONE_VM) {
atomic_inc(&oldmm->mm_users);
mm = oldmm;
goto good_mm;
}
retval = -ENOMEM;
mm = allocate_mm();
if (!mm)
goto fail_nomem;
memcpy(mm, oldmm, sizeof(*mm));
if (!mm_init(mm))
goto fail_nomem;
if (init_new_context(tsk,mm))
goto free_pt;
down_write(&oldmm->mmap_sem);
retval = dup_mmap(mm);
up_write(&oldmm->mmap_sem);
if (retval)
goto free_pt;
copy_segments(tsk, mm);
good_mm:
tsk->mm = mm;
tsk->active_mm = mm;
return 0;
free_pt:
mmput(mm);
fail_nomem:
return retval;
}
此前的笔记:
进程地址空间由mm_struct 结构描述,所以一个进程只有一个mm_struct结构,且该结构在进程用户空间中由多个线程共享。内核线程(kernel thread)不需要mm_struct,故task_struct->mm 字段总为NULL 。 那些未访问用户空间的进程所做的TLB 刷新操作是无效的,Linux采用“延迟TLB ”的技术避免这种刷新操作。Linux通过借用前个任务的mm_struct ,并放入task_struct->active_mm 中,避免了调用switch_mm() 刷新TLB 。
- 进入
延迟TLB 时,在SMP 上系统会调用enter_lazy_tlb() 确保mm_struct 不会被SMP处理器 共享,在UP机器 上这是一个空操作 。 - 进程退出时,系统会在该进程等待父进程回收时调用
start_lazy_tlb() 。
mm_struct 有两个引用计数,mm_users and mm_count 。
mm_users :描述存取这个mm_struct 用户空间的进程数,存取的内容有页表、文件的映像等。例如线程会增加这个计数,以确保mm_struct不会被过早释放。当这个计数值减为0时,exit_mmap() 会删除所有的映像并释放页表,然后减少mm_count 值。mm_count :对mm_struct 匿名用户的计数。匿名用户不关心用户空间的内容,只是借用mm_struct。例如使用延迟TLB转换的核心线程(kernel thread)。当这个计数减为0时,就可以安全释放掉mm_struct。
新的问题。 Q1:匿名用户是什么? Q2:mm_users and mm_count的作用?
Q1:匿名用户是什么?
查阅后看到Linus对 Is there a brief description someplace on how "mm" vs. "active_mm" in the task_struct are supposed to be used? 该问题的回答: https://www.kernel.org/doc/Documentation/vm/active_mm.txt
邮件中提出两个此前没有看过的概念:“real address spaces” and “anonymous address spaces” an anonymous address space doesn’t care about the user-level page tables at all, so when we do a context switch into an anonymous address space we just leave the previous address space active. 这里对anonymous address spaces 进行了描述,可以理解。反过来应该就是real address spaces 。邮件中也提到kernel thread 基本上被认为是 anonymous address spaces 。到这里也就明白了匿名用户。Q1 解决。
也对原问题(Linux虚拟内存管理中mm_struct为什么有active_mm?)有了更深的理解: kernel threads 不关心real address spaces ,即 kernel threads 可以使用任何进程的memory address spaces 。在切换上下文到 kernel threads 时需要记录下 real address spaces。mm_struct->active_mm 就用以记录 real address spaces,即memory address spaces of users。kernel threads 通过active_mm 确定当前执行流的 user memory address spaces 是什么。
Q2:mm_users and mm_count的作用?
Q2中mm_users and mm_count的作用 ,结合《Linux虚拟内存管理》和linus的邮件回复。mm_struct有两个计数是为了满足多核的处理。在一个CPU上运行的进程执行流包括用户部分和内核部分,换个说法也许更好,real address spaces and anonymous address spaces。进程执行流中real address spaces会被切换到其他CPU上,所以需要两个计数。
- a “mm_users” counter that is how many “real address space users” there are.
- a “mm_count” counter that is the number of “lazy” users (ie anonymous users) plus one if there are any real users.
这里可以用INIT_MM的初始化引证:
#define INIT_MM(name) \
{ \
mm_rb: RB_ROOT, \
pgd: swapper_pg_dir, \
mm_users: ATOMIC_INIT(2), \
mm_count: ATOMIC_INIT(1), \
mmap_sem: __RWSEM_INITIALIZER(name.mmap_sem), \
page_table_lock: SPIN_LOCK_UNLOCKED, \
mmlist: LIST_HEAD_INIT(name.mmlist), \
}
可以看到INIT_MM 的mm_count 初始化为1。
参考文献: [1] Linus Torvalds. https://www.kernel.org/doc/Documentation/vm/active_mm.txt. 1999-07-30 [2] 白洛. 深入理解Linux虚拟内存管理. 2006-1 [3] Mel Gorman. Understanding the Linux Virtual Memory Manager. 2004-5-9
|