解析
说明
app_lba_start equ 表示用户程序在硬盘上的具体扇区号
phy_base 表示用户程序被加载到内存的位置
本加载程序使用LBA直写模式
流程
第一步:计算用户程序加载位置
第二步:读取用户程序头部前512个字节
第三步:根据头部信息,判断整个应用程序大小,是否需要再次读取硬盘,若需要则继续读取
第四步:用户程序加载完毕,修改重定位表 原因:程序被加载后的逻辑地址改变,需要将重定位表中的段的地址加上程序加载地址再写回
第五步:计算用户程序入口地址写回用户程序头部重定位表
第六步:计算当前位置填入用户程序头部段(以便用户程序运行完毕后跳转回来)
第七步:根据第五步计算的用户程序入口跳转至用户程序执行
第八步:用户程序执行完毕,跳转回来,并进入死循环
代码
app_lba_start equ 100 ;常数申明
section loader align=16 vstart=0x7c00
;设置堆栈指针,起始地址0x07e0,长度256字节
mov ax,0x07e0
mov ss,ax
mov sp,0x100
;用户程序加载段地址计算
mov ax,[cs:phy_base]
mov dx,[cs:phy_base+0x02]
mov bx,0x10
div bx ;商在ax中,余在dx中
;ds、es指向userapp加载段地址
mov ds,ax
mov es,ax
;读取userapp头部512字节
xor di,di ;传递userapp逻辑扇区号
mov si,app_lba_start ;传递userapp逻辑扇区号
mov bx,0x0 ;传递userapp加载偏移地址
call read_hard_disk_0
;填入
;计算userapp大小
mov ax,[ds:0x04]
mov dx,[ds:0x06]
mov bx,512
div bx
cmp dx,0x0 ;如果未除尽,说明读取扇区等于ax+1,减去已读取的还有ax个,ax也就不用减了
jnz @1
dec ax
@1:
cmp ax,0x0 ;表示userapp长度<=512字节,已经读取过一个扇区,就不用读取了
jz @3
;读取剩余扇区
mov cx,ax
@2:
inc si ;逻辑扇区号递增
add bx,0x200 ;userapp加载偏移地址递增
call read_hard_disk_0
loop @2
@3:
;段重定位表处理
mov bx,0x10 ;段重定位表起始地址
mov cx,[ds:0x0e] ;段重定位表项数
@4:
mov ax,[ds:bx]
mov dx,[ds:bx+0x02]
call calc_section_base
mov [ds:bx],ax
add bx,0x04
loop @4
;计算userapp的main代码段地址
mov ax,[ds:0x0a]
mov dx,[ds:0x0a+2]
call calc_section_base
mov [ds:0x0a],ax
;填入调用地址
mov ax,@5
mov [ds:0x0],ax
mov ax,cs
mov [ds:0x2],ax
jmp far [0x08]
@5:
jmp $
read_hard_disk_0:
push ax
push bx
push cx
push dx
;di:si为扇区号,ds:bx为写入地址
mov dx,0x1f2 ;0x1f2:设置读取扇区数
mov al,0x01
out dx,al ;格式固定,dx指定端口,al传输或接收数据
inc dx ;0x1f3:设置 lba 0~7位
mov ax,si
out dx,al
inc dx ;0x1f4:设置 lba 8~15位
mov al,ah
out dx,al
inc dx ;0x1f5:设置 lba 16~23位
mov ax,di
out dx,al
inc dx ;0x1f6:设置 lba 24~27位,28~31位为选择设置
and ah,0x0F ;清除ah高4位,低4位存储 LBA 信息
mov al,0xe0 ;al高4位设置选择信息,0xe0表示 主硬盘 LBA模式
or al,ah ;将ah低4位 lba信息 传送到al
out dx,al ;此时al 0~3 存储 lba信息,4~7 存储选择信息
inc dx ;0x1f7:控制命令端口
mov al,0x20 ;0x20表示读取硬盘命令
out dx,al
;等待硬盘准备完毕
waits:
in al,dx ;0x1f7端口每时每刻返回自身状态信息
and al,0x88 ;清除7、3位之外的信息
;第7位为0表示硬盘不忙,为1表示硬盘忙
;第3位为0表示硬盘没有准备好,为1表示硬盘准备好进行传输
cmp al,0x08
jnz waits ;若未准备好,则持续等待
;准备读取,ds:bx为写入地址
mov cx,256 ;读取字数
mov dx,0x1f0 ;dx:数据传输端口
read:
in ax,dx
mov [bx],ax
add bx,0x02
loop read
pop dx
pop cx
pop bx
pop dx
ret
calc_section_base: ;接收dx:ax userapp分段地址
;返回段地址,填入ax
push dx ;不将ax压栈是因为ax用于返回计算结果
add ax,[cs:phy_base] ;将低16位加到ax中
adc dx,[cs:phy_base+0x02] ;adc加法会中进位标志位中取来自上一次加法的进位加到结果中,这样就完成了两个32位数的相加
;高16位在dx中,低16位在ax中
;x86一共20位地址,高4位在dx低4位中,低16位在ax中
;因为我们要计算的是段地址,ax段中低4位应该为0
;于是仅需要将dx低4位,ax高12位组合传输到ax
;shr位右移指令,ror为循环右移指令
ror dx,0x04 ;左移12位,低12位被置0
shr ax,0x04 ;右移4位,高4位被置0
and dx,0xf000
or ax,dx
pop dx
ret
phy_base: ;userapp加载的内存地址
dd 0x10000
times 510-($-$$) db 0
db 0x55,0xaa
|