Introduction
上一个lab的主要内容为__data pointer__(指向数据的指针)可能在Linux系统中造成的__segmentation fault__。本次lab将考虑__function pointer__(指向函数/代码的指针)可能造成的错误:segfault或其他exceptions。
函数指针 Function Pointers
一个函数指针可以像函数一样被调用,包括传递参数和获得返回结果。函数指针的一些用途是用于编写泛型generic函数,有时是一种面向对象的样式,也用于实现回调。
- 在函数中,有物理内存地址可以赋值给指针,而一个函数的函数名就是一个指针,指向函数的代码;
- 一个函数的地址就是该函数的进入点,也是调用函数的地址;
- 函数的调用可以通过函数名,也可以通过指向函数的指针;
- 函数指针还允许将函数作为变元传递给其他函数;
- 没有括号和变量列表的函数名也可以表示函数的地址(数组中,不带下标的数组名表示数组的首地址)
定义形式
类型 (*指针变量名) (参数列表);
如, int (*p)(int i, int j);
→ p是一个指针,它指向一个函数,该函数有两个整型参数,返回类型为int;p首先和*结合,表明p是一个指针,再与( )结合,表明它指向的是一个函数。
调用函数指针
(*p) (argument)
p (argument)
例子
#include <stdio.h>
#define GET_MAX 0
#define GET_MIN 1
int get_max(int i,int j)
{
return i>j?i:j;
}
int get_min(int i,int j)
{
return i>j?j:i;
}
int compare(int i,int j,int flag)
{
int ret;
int (*p)(int,int);
if(flag == GET_MAX)
p = get_max;
else
p = get_min;
ret = p(i,j);
return ret;
}
int main()
{
int i = 5,j = 10,ret;
ret = compare(i,j,GET_MAX);
printf("The MAX is %d\n",ret);
ret = compare(i,j,GET_MIN);
printf("The MIN is %d\n",ret);
return 0 ;
}
#include <stdio.h>
#include <string.h>
void check(char *a,char *b,int (*cmp)(const char *,const char *));
main()
{
char s1[80],s2[80];
int (*p)(const char *,const char *);
p=strcmp;
printf("Enter two strings.\n");
gets(s1);
gets(s2);
check(s1,s2,p);
}
void check(char *a,char *b,int (*cmp)(const char *,const char *))
{
printf("Testing for equality.\n");
if((*cmp)(a,b)==0)
printf("Equal\n");
else
printf("Not Equal\n");
}
int *f(int i, int j);
int (*p)(int i, int j);
前者是返回值是指针的函数;后者是一个指向函数的指针。
注意
- 本实验用到的技巧也将会在JIT编译器(如,浏览器中的JavaScript编译器)中出现,因为它们也是将数据转换为代码,然后再调用。
- 请注意,试图执行代码的攻击可能会使用本实验室的变体。这个实验也说明了一个常见的错误,可能是不确定的。
Exercise 1:qsort中的函数指针
-
为什么
q
s
o
r
t
(
)
qsort()
qsort() 使用函数指针?
-
q
s
o
r
t
(
)
qsort()
qsort() 是对任何类型的数组数据的通用排序例程(generic sorting routine ),因此,不同的数据类型需要不同的比较方法,这是由用户提供的比较函数
c
o
m
p
a
r
e
(
)
compare()
compare() 提供的。简单说就是对数组进行排序。 -
声明: void qsort(void *base, size_t nitems, size_t size, int (*compar)(const void *, const void*)) -
参数:
- base – 指向要排序的数组的第一个元素的指针。
- nitems – 由 base 指向的数组中元素的个数。
- size – 数组中每个元素的大小,以字节为单位。
- compar – 用来比较两个元素的函数。如果 compar 返回值< 0,那么第一个参数p1 所指向元素会被排在第二个p2所指向元素的前面;如果 compar 返回值= 0,那么 p1 所指向元素与 p2 所指向元素的顺序不确定;如果 compar 返回值> 0,那么 p1 所指向元素会被排在 p2 所指向元素的后面。
- 返回值 – 无
-
代码 #include <stdlib.h>
#include <string.h>
#include <strings.h>
#include <stdio.h>
char *num[] = {
"000000001",
"1",
"1000",
" 100 ",
"1 ",
};
int string_comp(const void *p1, const void *p2)
{
return strcmp(*((char **) p1), *((char **) p2));
}
int int_comp(const void *p1, const void *p2)
{
int i1, i2;
i1 = atoi(*((char **) p1));
i2 = atoi(*((char **) p2));
if (i1 < i2) return -1;
else if (i1 == i2) return 0;
else return 1;
}
void print_array(char *a[], int n)
{
int i;
for (i=0; i < n; i++)
printf("\"%s\" ", a[i]);
}
int main()
{
printf("Original array\n"); print_array(num, 5); printf("\n");
qsort(num, 5, sizeof(char *), int_comp);
printf("sorted array as int\n"); print_array(num, 5); printf("\n");
qsort(&num, 5, sizeof(char *), string_comp);
printf("sorted array as string\n"); print_array(num, 5); printf("\n");
return(0);
}
- 一般形式:strcmp(字符串1,字符串2)
说明:当s1<s2时,返回为负数 注意不是-1 当s1==s2时,返回值= 0 当s1>s2时,返回正数 注意不是1 即:两个字符串自左向右逐个字符相比(按ASCII值大小相比较),直到出现不同的字符或遇’\0’为止。如: “A”<“B” “a”>“A” “computer”>“compare” 特别注意:strcmp(const char *s1,const char * s2)这里面只能比较字符串,不能比较数字等其他形式的参数。
Exercise 2:
-
代码: #include <stdio.h>
#include <string.h>
#include <strings.h>
#include <errno.h>
#include <sys/mman.h>
#define L (32)
int addnum(int a)
{
return a+255;
}
int main(int argc, char *argv[], char *envp[])
{
int a, (*f)(int), *code_buf;
char *p, data[]={0x0f, 0x0b};
f = addnum;
a = f(10);
printf("1: f(10)=%d f=%p\n\n", a, f);
code_buf = (int *) mmap(0, 4096, PROT_EXEC|PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
printf("code_buf %p\n", code_buf);
memcpy(code_buf, addnum, L);
f = (int (*)(int)) code_buf;
a = f(10);
printf("2: f(10)=%d f=%p\n\n", a, f);
p = index((char *) code_buf, 0xff);
printf("before *p=%hhx\n", *p);
*p = 100;
printf("after *p=%hhx\n", *p);
a = f(10);
printf("3: f(10)=%d\n\n", a);
*((char *) code_buf) = 0xc3;
a = f(10);
printf("4: f(10)=%d\n\n", a);
memcpy(code_buf, data, 2);
printf("before last call\n");
a = f(10);
return 0;
}
-
mmap() 函数:
-
用途:
- 将一个普通文件映射到内存中,通常在需要对文件进行频繁读写时使用,这样用内存读写取代I/O读写,以获得较高的性能;
- 将特殊文件进行匿名内存映射,可以为关联进程提供共享内存空间;
- 为无关联的进程提供共享内存空间,一般也是将一个普通文件映射到内存中。
-
头文件:#include <sys/mman.h> -
原型:void *mmap(void *start,size_t length,int prot,int flags,int fd,off_t offsize); -
参数说明:
- start:指向欲映射的内存起始地址,通常设为 NULL,代表让系统自动选定地址,映射成功后返回该地址。
- length:代表将文件中多大的部分映射到内存。
- prot:映射区域的保护方式。可以为以下几种方式的组合:
- PROT_EXEC 映射区域可被执行
PROT_READ 映射区域可被读取 PROT_WRITE 映射区域可被写入 PROT_NONE 映射区域不能存取 - flags:影响映射区域的各种特性。在调用mmap()时必须要指定MAP_SHARED 或MAP_PRIVATE。
- MAP_FIXED:如果参数start所指的地址无法成功建立映射时,则放弃映射,不对地址做修正。通常不鼓励用此旗标。
- MAP_SHARED:对映射区域的写入数据会复制回文件内,而且允许其他映射该文件的进程共享。
- MAP_PRIVATE:对映射区域的写入操作会产生一个映射文件的复制,即私人的“写入时复制”(copy on write)对此区域作的任何修改都不会写回原来的文件内容。
- MAP_ANONYMOUS:建立匿名映射。此时会忽略参数fd,不涉及文件,而且映射区域无法和其他进程共享。
- MAP_DENYWRITE:只允许对映射区域的写入操作,其他对文件直接写入的操作将会被拒绝。
- MAP_LOCKED:将映射区域锁定住,这表示该区域不会被置换(swap)。
- fd:要映射到内存中的文件描述符。如果使用匿名内存映射时,即flags中设置了MAP_ANONYMOUS,fd设为-1。
- offset:文件映射的偏移量,通常设置为0,代表从文件最前方开始对应,offset必须是分页大小的整数倍。
-
返回值:若映射成功则__返回映射区的内存起始地址__,否则返回MAP_FAILED(-1),错误原因存于errno 中。 -
错误代码:
-
memcpy() 函数:
-
用途:内存复制。 -
原型:void *memcpy(void *dest, const void *src, size_t n); -
功能:从src的开始位置拷贝n个字节的数据到dest。如果dest存在数据,将会被覆盖。 -
返回值:dest的指针。 -
头文件:string.h -
index() 函数:
- 用途:找地址。
- 原型:
char * index(const char *s, int c); - 功能:用来找出参数s 字符串中第一个出现的参数c 地址,然后将该字符出现的地址返回。字符串结束字符(NULL)也视为字符串一部分。
- 返回值:如果找到指定的字符则返回该字符所在地址,否则返回0。
- 头文件:#include <string.h>
Exercise 3
-
代码: #include <stdio.h>
#include <string.h>
#include <strings.h>
#include <errno.h>
#include <sys/mman.h>
int encrypt(int a)
{
return a ^ 255;
}
int main(int argc, char *argv[], char *envp[])
{
int (*f)(int);
int secret, x, y;
f = encrypt;
printf("1: enter test data\n");
scanf("%d", &x);
y = f(x);
printf("1: test original encrypt(): f(%x)=%x\n", x, y);
printf("enter new key\n");
scanf("%d", &secret);
secret = 255;
printf("2: value to encrypt\n");
scanf("%d", &x);
y = f(x);
printf("2: f(): f(%x)=%x\n", x, y);
printf("erased secret %d\n", secret);
*((int *)f) = 0;
return 0;
}
-
要求:
- 加密方法只是让数据XOR亦或整常数密码(key,secret)。原始密码已知,为255。
- 目标:从源代码中移除密码的依赖性,尽管有人知道源代码也无法知道密码(只考虑整数)。
- 只修改LINE1和LINE2之间的代码。
- 限制:
- 不能使用新函数或者新包。
- 需要在运行时,动态地创建f()所指向的新代码。(f是随输入变化的)
- 新函数实现了与encrypt()相同的功能,除了常量来自输入(读入为secret)。
- 加密是密码的异或,采用(a ^ c)形式,其中c是常数而不是c变量。
- 此外,尽管f()是在运行时动态创建的,但在使用时不应该修改。在LINE3测试,即出现segfault。
- hint:看看mprotect,它补充了mmap
Reference
- 函数指针
- mmap
- 【深入浅出Linux】关于mmap的解析
- memcpy
- 待续
|