kvm
kvm同时支持半虚拟化核全虚拟化,其中半虚拟化的驱动程序安装在客户机操作系统中,允许虚 拟机使用优化的I/O接口而不使用模拟的设备,从而为网络和块设备提供高性能的I/O。KVM也支持Intel的VT-d技术,通过将宿主机的PCI总线上的设备透传(passthrough)给客户机,让客户机可以直接使用原生的驱动程序高效地使用原生的驱动程序高效地使用这些设备。这种使用是几乎不需要Hypervisor的介入的。 kvm必须需要cpu硬件虚拟化支持,io虚拟化没有硬件支持可以使用virtio
VT-x
Intel的cpu硬件辅助虚拟化技术,MM和Guest OS分别运行在不同模式(ROOT模式和非ROOT模式),普通指令cpu直接运行,特殊指令需要切换到vmm,让vmm处理特殊指令。 从根环境到非根环境叫VMEntry;从非根环境到根环境叫VMExit。
EPT
Intel的内存硬件辅助虚拟化技术
VT-d
Intel的I/O硬件辅助虚拟化技术(IO透传,SR-IOV也是IO透传),单个设备只能分配给一个客户机,SR-IOV能解决这个问题。
I/O虚拟化
DPDK支持半虚拟化的前端virtio和后端vhost,并且对前后端都有性能加速的设计。而对于I/O透传,DPDK可以直接在客户机里使用,就像在宿主机里,直接接管物理设备,进行操作。
SR-IOV
PF(Physical Function,物理功能):这是支持SR-IOV扩展功能的PCIe功能,主要用于配置和管理SR-IOV,拥有所有的PCIe设备资源。PF在系统中不能被动态地创建和销毁(PCI Hotplug除外)。 VF(Virtual Function,虚拟功能):“精简”的PCIe功能,包括数据迁移必需的资源,以及经过谨慎精简的配置资源集,可以通过PF创建和销毁。
virtio(半虚拟化)
前端virtio+后端vhost(vhost-user用户态共享内存,虚拟队列完成报文传输和控制)
上下文
可以是用户态切换到内核态,也可以是进程切换,上下文是进程运行时需要的寄存器最小集合。
port i/o和MMIO
port i/o:通过I/O端口访问设备寄存器 MMIO:通过内存访问的形式访问设备寄存器或设备ram(通常不可cache缓存)
RSS RPS RFS
RSS:多队列网卡,receive side scalling RPS:把一个rx队列的软中断分发到多cpu核上(hash负载均衡),receive packet steering RFS:指派到应用线程正在运行的cpu上,增加cache命中,receive flow steering
PCI passthrough
物理网卡直接给虚拟机使用,需要独占,性能最高。
docker
docker daemon:核心后台进程,所有docker命令都需要它来处理,通过套接字连接。
namespace
操作系统可用的api:clone,setns,unshare
cgroups
本质上是通过内核上的钩子来限制资源,程序运行需要获取资源时触发钩子对应的回调函数来限制和跟踪资源。
docker网络
桥接模式
命令
k8s
|