Linux线程切换源码分析_vlambda技术博客

vlambda
2021-03-30

Linux线程切换源码分析

Linux线程是CPU执行与调度最基本的单位，一个线程在一个特定的时间内只能在一个CPU Core上调度执行，内核利用时间片轮转的形式不断的切换线程，从而形成一个从宏观上看是并行执行的假象。本文着重介绍Linux线程的切换，包括线程切换的内容、线程切换的时机及线程切换的逻辑。

一、线程切换的内容

线程（包括其隶属的进程）的数据结构很多，比如，打开的文件，注册的信号处理，子线程等，但涉及到切换的内容却不是很多，主要有三个：用户内存上文、内核内存上下文、CPU上下文。如图所示：

用户内存上文

线程的用户内存上下文是线程运行在用户空间内所依赖的虚拟地址空间，页表映射等资源。在线程切换的时候，只需把TTBR0_EL1寄存器的值设置为全局页表（PGD）的地址即可，别看内容很少，涉及到的性能开销却是相当大的。主要原因是，每个进程都有自己单独的一个全局页表（PGD），页面指向的每一级的子页表都在一个物理内存页中，每一页都有可能被内核交换到磁盘中，一旦页面不在内存中，就会触发缺页异常，从而要执行一系列的调页操作，所以开销巨大。而且，线程的调度经常会让TLB内容失效，一旦TLB内容失效，必须重新走一次虚拟地址到物理地址的转换过程。

Linux线程切换源码分析

内核内存上文

线程的内核内存上下文按理来说应该是和用户空间一样的，但是内核的设计者出于性能的考虑，把内核内存上下文设为全局唯一的，也就是说内核只有一个PGD ，在内核启动的时候就设置好了，每次线程切换的时候只把TTBR1_EL1的高16位设成自身的ASID值即可。而且内核的页表一般不会交换出去，所以内核线程的切换性能开销是比较小的，这也是Linux性能卓越的原因之一。

CPU上下文

一个线程的调度执行依赖于自己的CPU上下文，包括堆栈指针，PC指针，及一些通用寄存器。一个线程最后切换的是CPU上下文，一旦CPU上下文都切换了，线程也就完全的切换了。

Linux线程切换源码分析

CPU上下文结构与体系有关，上图显示的是ARMv8的，每种体系定义各有不同，在arch相应的目录下可以找到相关的文件。

二、线程切换的时机

CPU执行的过程中遇到的事件错综复杂，涉及到线程切换的时机大致上分三种情况：在用户空间中发生中断时、程序进行系统调用时、以及在内核空间中发生中断时。只有定义了抢占式内核（CONFIG_PREEMPT），内核中断才会发生线程切换。

Linux线程切换源码分析

在用户空间中发生中断事件

线程运行在用户空间中发生中断时，原因有很多，外部设备中断，计时器中断等，这些中断都叫异步中断，CPU切换到EL1状态执行el0_irq中断例程。中断处理的逻辑我们另文再述，先看看中断发生时是怎么进行线程切换的。

Linux线程切换源码分析

767-782行，el0_irq中断例程，中断发生时执行的代码。名称中有个el0不要以为是运行在EL0级别中，它表示的是在EL0中发生中断，现在运行在EL1中。

862-873行，中断程序执行完成后，返回用户空间，在869行判断当下线程有没有设置_TIF_WORK_MASK标志，如果设置了，说明当前线程需要切换。

871行，跳到work_pending处，然后在857行调用schedule函数，执行线程切换。

程序执行系统调用

程序执行系统调用CPU会切换到内核态执行相关程序，在系统调用完成后与el0中断一样，会根据_TIF_WORK_MASK条件判断当前线程是否需要切换，如果需要则调用schedule函数，不需要直接返回到用户空间。

Linux线程切换源码分析

891-916行，el0_svc系统调用例程，系统调用时执行的代码。这里同样是运行在EL1中。

825-838行，系统调用执行完成后返回用户空间，在835行判断当下线程有没有设置_TIF_WORK_MASK标志，如果设置了，说明当前线程需要切换。

836行，跳到work_pending处，然后在857行调用schedule函数，执行线程切换。

在内核空间中发生中断事件

与用户空间中发生中断事件一样，原因有很多，但执行的中断例程不同，并且不需要发生级别的迁移。

Linux线程切换源码分析

542-572行，el1_irq中断例程，在内核空间中发生中断时执行的代码。

552-565行，如果定义了抢占式内核（CONFIG_PREEMPT），并且线程设置了TIF_NEED_RESCHED标志，跳转到el1_preempt处执行线程切换。

577行，执行线程切换

三、线程切换的逻辑

线程切换的逻辑我想作一个简单的比喻，假设你是CPU，你运行的线程就是你穿在身上的衣服，当要切换线程时就好比你走进更衣室，把衣服脱掉放在更衣室内，然后穿越到另一个更衣室，穿起留在那个更衣室的衣服，之后推开门走出去，这时你已经运行在另一个线程里了。

Linux线程切换源码分析

线程切换的时候，首先把内存上下文先切换了，然后才切换CPU上下文。因为一旦CPU上下文切换了，就表示已经运行在另一个线程的逻辑中了。

切换内存上下文

内存上下文虽然涉及到性能变化比较大，但是切换却相当简单

Linux线程切换源码分析

166-191行，获取ASID，ASID是用于TLB中，以区分线程VA到PA的转换表是否有效。

199行，切换内存上下文。

Linux线程切换源码分析

cpu_do_switch_mm是用汇编写的函数，用于设置ttbr1_el1和ttbr0_el1寄存器。

141-147行，由于内核的ttbr1_el1全局唯一，所以在运行的过程中是不会改变的，这里只是简单的把它取出来，加上ASID然后设回去即可。

149行，设置ttbr0_el1寄存器，值从mm->pgd获得。

切换CPU上下文

CPU上下文一旦切换，整个线程就切换完毕了。

793-802行，把上一线程的CPU上下文保存在thread_struct. cpu_context结构中。

803行，获取下一线程的CPU上下文地址。

804-811行，把下一线程的CPU上下文的内容加载到CPU相应的寄存器中。

自cpu_switch_to函数返回后，线程切换就彻底完成了，这时CPU就像是换了一套衣服一样出现在另一个线程面前，另一线程甚至都不知道CPU曾经切换出去过。

以上就是线程切换相关的内容，关于线程以什么方式切换，调度算法如何，我们另文分析。(armv8,kernel4.4)

相关文章

源码园

专注源码分析，分享研发经验

16篇原创内容

Official Account