字符串函数与内存操作函数
前言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串 中或者 字符数组 中。也就是我们常见的char* 与 char[ ],char*可以定义常量字符串,使其不能被修改;而 char[ ],用来定义字符数组,可以被修改。还有C语言是可以直接对内存进行操作的(比如:位运算),因此C语言中也有内存操作函数 。
字符串函数
strlen
- 求字符串长度的一个库函数 -
size_t strlen ( const char * str ) ; - 字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。 -
注意与sizeof 区分开来,sizeof算'\0'占用的空间 - 参数指向的字符串必须要以 ‘\0’ 结束。
- 注意函数的返回值为size_t,是无符号的( 易错 )
strlen模拟实现
1. 临时变量法
size_t my_strlen(char* s)
{
size_t count = 0;
while (*s != '\0')
{
count++;
s++;
}
return count;
}
2. 递归法
size_t my_strlen(char* s)
{
if (*s != '\0')
{
return 1 + my_strlen(s + 1);
}
return 0;
}
3. 指针 - 指针法
size_t my_strlen(char* s)
{
char* tmp = s;
while (*tmp != '\0')
{
tmp++;
}
return tmp - s;
}
注意:
下面的代码容易出错,因为strlen放返回值是size_t(无符号整形) 类型的,在相减进行比较的时候就不可能出现 < 0 的数字
#include <stdio.h>
int main()
{
const char*str1 = "abcdef";
const char*str2 = "bbb";
if(strlen(str2)-strlen(str1)>0)
{
printf("str2>str1\n");
}
else
{
printf("srt1>str2\n");
}
return 0;
}
strcpy
- 将源头的字符串拷贝到目标字符串中。 -
char* strcpy(char* destination, const char* source ) ; - 源字符串必须以 ‘\0’ 结束。
- 拷贝时也会拷贝’\0’
- 目标字符串的空间要足够大,以确保能够存放源字符串。
- 目标字符串必须是可变的
strcpy模拟实现
#include <stdio.h>
#include <assert.h>
#include <string.h>
const char* my_strcpy(char* dest,const char* src)
{
const char* tmp = dest;
assert(src&& dest);
while (*dest++ = *src++)
{
;
}
return tmp;
}
int main()
{
char* arr1 = "abcd";
char arr2[20] = { 0 };
printf("%s\n", my_strcpy(arr2, arr1));
return 0;
}
strcat
- 将源字符串追加到目标字符串后面 -
char * strcat ( char * destination, const char * source ); - 源字符串必须以 ‘\0’ 结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
strcat模拟实现
#include <stdio.h>
#include <assert.h>
#include <string.h>
char* my_strcat(char* dest, const char* src)
{
char* tmp = dest;
assert(dest && src);
while (*dest)
{
dest++;
}
while (*dest++ = *src++)
{
;
}
return tmp;
}
int main()
{
char arr1[30] = "I Love ";
char* arr2 = "YOU";
printf("%s\n", my_strcat(arr1, arr2));
return 0;
}
strcmp
- 字符串比较函数(字符串比较是对应位置的字符进行ASCII码比较)
int strcmp ( const char * str1, const char * str2 ); - 标准规定:
- 第一个字符串大于第二个字符串,则返回大于0的数字
- 第一个字符串等于第二个字符串,则返回0
- 第一个字符串小于第二个字符串,则返回小于0的数字
strcmp模拟实现
#include <stdio.h>
#include <assert.h>
#include <string.h>
int my_strcmp(const char* arr1, const char* arr2)
{
while (*arr1 == *arr2)
{
if (*arr2 == '\0')
{
return 0;
}
arr1++;
arr2++;
}
return *arr1 - *arr2;
}
int main()
{
char* arr1 = "hello bit";
char* arr2 = "hello world";
int ret = my_strcmp(arr1, arr2);
if (ret>0)
{
printf(">\n");
}
else if (ret<0)
{
printf("<\n");
}
else
{
printf("=\n");
}
return 0;
}
strstr
- 判断源字符串是否是目标字符串的子串 -
char * strstr ( const char *str1, const char * str2); - 返回值:子串在目标字符串中的起始位置
图片分析
strstr模拟实现
一:
#include <stdio.h>
#include <assert.h>
#include <string.h>
const char* my_strstr(const char* str, const char* substr)
{
assert(str && substr);
if (*substr == '\0')
{
return str;
}
while (*str)
{
const char* s1 = str;
const char* s2 = substr;
while (*s1 && *s2 &&*s1 == *s2)
{
*s1++;
*s2++;
}
if (*s2 == '\0')
{
return str;
}
str++;
}
return NULL;
}
int main()
{
char* arr1 = "ABABABC";
char* arr2 = "ABABC";
const char* ret = my_strstr(arr1,arr2);
if (ret != NULL)
{
printf("%s\n", ret);
}
return 0;
}
二:
char* my_strstr(char* str, char* substr)
{
unsigned int i, j, ls2;
ls2 = strlen(substr);
for (i = 0; i <= strlen(str) - ls2; i++)
{
for (j = 0; j < ls2; j++)
{
if (str[j + i] != substr[j])
break;
}
if (j == ls2)
{
return str + i;
}
}
return NULL;
}
strtok
- 按照给定的字符分隔符集合(
sep )来分隔字符串 - char * strtok ( char * str, const char * sep ); - 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
- strtok找到一个分隔符会将其置为’\0’,然后返回’\0’对应的字符串的地址。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok分割完一个字符串,会记录下该分隔符后面的字符地址;
第一次分割 :参数:分割字符串的首元素地址 ,分隔符字符串的首元素地址 ;第二次分割:参数:NULL ,分隔符字符串的首元素地址 - 如果字符串中不存在标记了,则返回NULL
example
#include <stdio.h>
#include <string.h>
int main()
{
const char* sep = "@.";
char arr[] = "3358925609@qq.com";
char* str = NULL;
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
strerror
- 返回错误码在编译器对应的错误信息 -
char * strerror ( int errnum ); - 常与错误码(errno连用) -
头文件:errno.h
example
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main ()
{
FILE * pFile;
pFile = fopen ("unexist.ent","r");
if (pFile == NULL)
printf ("Error opening file unexist.ent: %s\n",strerror(errno));
return 0;
}
小总结
- 这些函数都是只针对字符串使用的
- 这些字符串函数的返回值都是为了方便函数的链式访问
其他常用函数
strncpy,strncat,strncmp - 可以限制操作元素的个数 strchr - 在一个字符串中查找一个字符
字符分类函数
函数 | 如果他的参数符合下列条件就返回真 |
---|
isxdigit | 十六进制数字,包括所有十进制数字,小写字母a ~ f,大写字母A ~ F | isdigit | 十进制数字 0~9 | isupper | 大写字母A~Z | islower | 小写字母a~z | isalpha | 字母a ~ z或A ~ Z | isalnum | 字母或者数字,a ~ z,A ~ Z,0 ~ 9 |
字符转换
tolower | 大写字母转小写字母 |
---|
toupper | 小写字母转大写字母 |
内存操作函数
memcpy
void * memcpy ( void * destination, const void * source, size_t num ); - 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 注意:memcpy虽然在VS底下dest与src可以存在重叠;但是C标准中,并未规定memcpy一定具备这种功能 - 而这种功能本应由 memmove 进行的操作
memcpy模拟实现
#include <stdio.h>
#include <assert.h>
void* my_memcpy(void* dest, const void* src, size_t num)
{
void* ret = dest;
assert(dest && src);
while (num--)
{
*(char*)dest = *(char*)src;
++(char*)dest;
++(char*)src;
}
return ret;
}
int main()
{
int arr3[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
int arr4[5] = { 0 };
my_memcpy(arr4, arr3 + 5, 20);
for (int i = 0; i < 5; i++)
{
printf("%d ", arr4[i]);
}
return 0;
}
memmove
void * memmove ( void * destination, const void * source, size_t num ); - 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
- 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
画图解释两种情况
memmove模拟实现
#include <stdio.h>
#include <assert.h>
void* my_memmove(void* dest, const void* src, size_t num)
{
void* ret = dest;
assert(dest && src);
if (dest < src)
{
while (num--)
{
*(char*)dest = *(char*)src;
++(char*)dest;
++(char*)src;
}
}
else
{
while (num--)
{
*((char*)dest + num) = *((char*)src + num);
}
}
return ret;
}
int main()
{
int arr3[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
my_memmove(arr3 + 2, arr3, 20);
for (int i = 0; i < 10; i++)
{
printf("%d ", arr3[i]);
}
return 0;
}
memset
- 内存设置函数 -
void *memset( void *dest, int c, size_t count ); - 按count字节个数将目标字符串初始化为指定
符号c
example
int main()
{
char arr[10] = "";
memset(arr,'#',10);
int arr[10] = { 0 };
memset(arr,1,10);
}
总结
以上模拟实现+简单介绍的函数就是我们编程中经常使用到的函数,我们需要弄明白其作用+原理,也要能够模拟实现出来。讲解视频:字符串函数与内存操作函数视频讲解
大家后面在函数方面有什么不懂的也可以私信博客哟,我们一起进步,也可以看看博主的另一篇博文:查找函数小工具MSDN的使用
|