重点介绍处理字符和字符串的库函数的使用和注意事项
前言
C
语言中对字符和字符串的处理很是频繁,但是
C
语言本身是没有字符串类型的,字符串通常放在
常量字符串
中或者
字符数组
中。
字符串常量
适用于那些对它不做修改的字符串函数
.
字符分类函数
一.strlen——求字符串函数
size_t?
strlen??
(
const
char * str?
);
strlen的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "abc";
//char arr[] = { 'a', 'b', 'c' };
int len =strlen(arr);
printf("%d\n", len);
return 0;
}
strlen的模拟实现
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <assert.h>
int my_strlen(const char* str)
{
int count = 0;//计数器
assert(str != NULL);
while (*str != '\0')
{
count++;
str++;
}
return count;
}
int main()
{
char arr[] = "abc";
//char arr[] = { 'a', 'b', 'c' };
int len =my_strlen(arr);
printf("%d\n", len);
return 0;
}
- 模拟实现一共有三种版本:计数器,递归,指针-指针,这里我就不一一的举例说明了
strlen的坑点
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
if (strlen("abc") - strlen("abcdef") > 0)
{
printf(">\n");
}
else
{
printf("<=\n");
}
return 0;
}
- ?上面代码的结果是>,是不是感觉很奇怪,
-
?在这段代码中3-6=-3,但是因为是无符号数,所以-3的补码会被当成一个很大的数,来解析
-
strlen函数的返回值为
size_t
,是无符号的(
易错
)
-
补充一点:我上面的my_strlen和库里面的strlen不一样(返回值),所以用我模拟的my_strlen将会是<=
二.strcpy——字符串拷贝?
char*
strcpy
(
char *
destination
,
const
char *
source);
?strcpy的使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr[10] = "#####" ;
strcpy(arr, "hello");
printf("%s\n", arr);
return 0;
}
三.strcat——字符串追加
char *
strcat
(
char *
destination
,
const
char *
source
);
?strcat的使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr[20] = "abcd";
strcat(arr, "efgh");//?
printf("%s\n", arr);
return 0;
}
- ?strcat的使用和上面那个差不多,源字符串必须以 '\0' 结束,目标空间必须有足够的大,能容纳下源字符串的内容。
?strcat的模拟实现
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
#include <assert.h>
char* my_strcat(char* dest, const char*src)
{
char* ret = dest;
assert(dest && src);//断言
//1. 找目标字符串中的\0
while (*dest)
{
dest++;
}
//2. 追加源字符串,包含\0
while(*dest++ = *src++)
{
;
}
return ret;//返回的目标空间的起始地址
}
int main()
{
char arr1[20] = "hello ";//world
char arr2[] = "world";
printf("%s\n", my_strcat(arr1, arr2));
return 0;
}
strcat的坑点
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr[20] = "abcd";
strcat(arr, arr);
printf("%s\n", arr);
return 0;
}
- ?strcat这个库函数是不能自己追加自己的,因为如果自己追加自己,会找不到\0,导致无法结束,
四.strcmp——字符串的比较
int
strcmp
(
const
char *
str1
,
const
char *
str2
);
strcmp的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char* p = "abcdef";
char* q = "abb";
int ret = strcmp(p, q);
if (ret > 0)
{
printf("p > q\n");
}
else if (ret < 0)
{
printf("p < q\n");
}
else
{
printf("p == q\n");
}
return 0;
}
strcpy的模拟实现
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <assert.h>
int my_strcmp(const char* s1, const char* s2)
{
assert(s1 && s2);
while (*s1 == *s2)
{
if (*s1 == '\0')
{
return 0;//相等
}
s1++;
s2++;
}
return *s1 - *s2;
}
int main()
{
char* p = "abcdef";
char* q = "abb";
int ret = strcmp(p, q);
if (ret > 0)
{
printf("p > q\n");
}
else if (ret < 0)
{
printf("p < q\n");
}
else
{
printf("p == q\n");
}
return 0;
}
长度不受限制的字符串函数 | 长度受限制的字符串函数 | strcpy | strncpy | strcat | strncat | strcmp | strncmp |
?五.strncpy——字符串拷贝(字符数)
char *
strncpy
(
char *
destination
,
const
char *
source
,
size_t
num
);
strncpy的使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "abcdefghi";
char arr2[] = "qwer";
strncpy(arr1, arr2, 2);
printf("%s\n", arr1);//qwcdef
strncpy(arr1, arr2, 6);
printf("%s\n", arr1);//qwcdef
return 0;
}
?
-
拷贝
num
个字符从源字符串到目标空间。
-
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个?
六. strncat——字符串追加(字符数)
char *
strncat
(
char *
destination
,
const
char *
source
,
size_t
num
);
strncat的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "hello ";
char arr2[] = "world";
strncat(arr1, arr2, 5);
printf("%s\n", arr1);
return 0;
}
?strncat的特殊使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "abcdef";
strncat(arr1, arr1, 7);
printf("%s\n", arr1);
return 0;
}
- 从上面的测试中可以发现:strncat追加字符串时是从\0开始的,它追加自己给自己追加时,不会把\0也追加过去
?七.strncmp——字符串比较(字符数)
int
strncmp
(
const
char *
str1
,
const
char *
str2
,
size_t
num
);
?strncmp的使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char* p = "abcdqf";
char* q = "abcdef";
//int ret = strcmp(p, q,4);
int ret = strncmp(p, q, 5);
if (ret > 0)
{
printf(">");
}
else if (ret < 0)
{
printf("<");
}
else
{
printf("=");
}
return 0;
}
补充:那两组库函数有许多共同点,比如返回值是无符号
八.strstr——字符串查找
char *
strstr
(
const
char *
str1
,
const
char *
str2
);
?strstr的使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[] = "abbbcdef";
char arr2[] = "abc";
//char arr2[] = "bbc";
//在arr1中查找是否包含arr2数组
char* ret = strstr(arr1, arr2);
if (ret == NULL)
{
printf("没找到\n");
}
else
{
printf("找到了:%s\n", ret);
}
return 0;
}
- ?对于返回值的描述:返回指向 str2 中指定的整个字符序列的第一次出现在 str1 中的指针,如果 str1 中不存在该序列,则为空指针。
strstr的模拟实现
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
#include <assert.h>
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* s1 = NULL;
const char* s2 = NULL;
const char* cp = str1;
if (*str2 == '\0')
{
return (char*)str1;
}
while (*cp)
{
s1 = cp;//回到下一位,在进行比较
s2 = str2;//回位,比较
//abbbcdef abbbcdef abbbcdef
//bbc bbc bbc
while (*s1 && *s2 && (*s1 == *s2))
{
s1++;
s2++;
}
if (*s2 == '\0')
{
//返回指向 str2 中指定的整个字符序列的第一次出现在 str1 中的指针
return (char*)cp;
}
cp++;
}
return NULL;
}
int main()
{
char arr1[] = "abbbcdef";
//char arr2[] = "abc";
char arr2[] = "bbc";
//在arr1中查找是否包含arr2数组
char* ret = strstr(arr1, arr2);
if (ret == NULL)
{
printf("没找到\n");
}
else
{
printf("找到了:%s\n", ret);
}
return 0;
}
?
- 上面是我做的一个gif小动画,第一次做花了好久了,
- 在模拟实现strstr时需要,考虑出现重复的情况,顺便一提:KMP - 字符串查找算法!,效率比我写的这个还更高
- 程序运行的结果是:找到了:bbcdef
九.strtok——字符串分割函数
char * strtok ( char * str, const char * sep );
strtok的介绍
-
sep
参数是个字符串,定义了用作分隔符的字符集合
-
第一个参数指定一个字符串,它包含了
0
个或者多个由
sep
字符串中一个或者多个分隔符分割的标记。?
-
strtok
函数找到
str
中的下一个标记,并将其用\0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用
strtok
函数切分的字符串一般都是临时拷贝的内容并且可修改。)
-
strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
-
strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记
-
如果字符串中不存在更多的标记,则返回
NULL
指针。
strtok的返回值的描述
如果找到标记,则指向标记开头的指针。 否则为空指针。 当正在扫描的字符串中到达字符串结尾(即空字符)时,始终返回空指针。
strtok的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main()
{
char arr[] = "zpw@bitedu.tech hehe";
char* p = "@. ";//分隔符的集合
char tmp[30] = { 0 };
strcpy(tmp, arr);//临时拷贝
//zpw\0bitedu\0tech\0
char* ret = NULL;
for (ret = strtok(tmp, p); ret != NULL; ret=strtok(NULL, p))
{
printf("%s\n", ret);
}
return 0;
}
十.strerror
char *
strerror
(
int
errnum
);
strerror的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <errno.h>
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
fclose(pf);
pf = NULL;
return 0;
}
- ?使用库函数的时候,调用库函数失败的是,都会设置错误码
这里可以查看一下几个错误码?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
printf("%s\n", strerror(0));
printf("%s\n", strerror(1));
printf("%s\n", strerror(2));
printf("%s\n", strerror(3));
printf("%s\n", strerror(4));
printf("%s\n", strerror(5));
return 0;
}
strerror的补充?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <errno.h>
#include <string.h>
int main()
{
//打开文件失败的时候,会返回NULL
FILE* pf = fopen("test.txt", "r");//读文件
//0 "no error"
if (pf == NULL)
{
//printf("%s\n", strerror(errno));
perror("fopen");
return 1;
}
fclose(pf);//关闭文件
pf = NULL;
return 0;
}
- ?这段代码中用了perror这个库函数,它也是打印错误码的,
- perror打印出来的错误码更清晰,明了,
字符转化函数
一.islower——判读小写字符
int ?islower?( int c)
?islower的使用
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <ctype.h>
int main()
{
char ch = 'a';
char tb = 'A';
int ret = islower(ch);
printf("%d\n", ret);
printf("%c\n", ch);
ret = islower(tb);
printf("%d\n", ret);
printf("%c\n", tb);
return 0;
}
- ?islower的返回值描述:如果是大写字符返回非0的值,如果不是大写字符,返回0
二.isupper
int isupper ( int c ); ?
isupper的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <ctype.h>
int main()
{
char arr[20] = { 0 };
scanf("%s", arr);
int i = 0;
while (arr[i] != '\0')
{
if (isupper(arr[i]))
{
arr[i] = tolower(arr[i]);
}
printf("%c ", arr[i]);
i++;
}
return 0;
}
- ?这里我顺便把tolower也使用了一下,tolower这个库函数是将大写字符转换成小写字符
- isupper的返回值描述:如果是大写字符返回非0的值,如果不是大写字符,返回0
其他的我就不介绍了,了解即可
内存函数
一.memcpy——内存拷贝
void *
memcpy
(
void *
destination
,
const
void *
source
,
size_t
num
);
memcpy的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };
//01 00 00 00 02 00 00 00 ...
int arr2[20] = { 0 };
memcpy(arr2, arr1, sizeof(arr1));
return 0;
}
- ?函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 这个函数在遇到 '\0' 的时候并不会停下来。
注:如果source和destination有任何的重叠,复制的结果都是未定义的。?
memcpy的模拟实现
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <assert.h>
void* my_memcpy(void* dest, const void* src, size_t num)
{
void* ret = dest;//记录起始地址
assert(dest && src);
while (num--)//4 3 2 1
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
int main()
{
int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };
//01 00 00 00 02 00 00 00 ...
int arr2[20] = { 0 };
my_memcpy(arr2, arr1, sizeof(arr1));
return 0;
}
- void*能接受任意指针,但是它并不能直接接引用,所以这里把它强制类型转换成char*使其一个字节一个字节的访问,
?memcpy的坑点
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };
memcpy(arr1+2, arr1, 20);
return 0;
}
- memcpy自己拷贝自己的时候,?源头和目的地有重叠的部分,是拷贝不成功的
- 如果source和destination有任何的重叠,复制的结果都是未定义的。
注:如果你自己在vs2019中测试的时候发现,memcpy能拷贝有重叠的情况,别慌
只是在vs2019中成功了,并不保证所以的编译器都能成功,
C语言标准规定:当memcpy自己拷贝自己的时候,有重叠的部分,是拷贝不成功的
?二.memmove——内存复制
void *
memmove
(
void *
destination
,
const
void *
source
,
size_t
num
);
memmove的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };
// 1 2 1 2 3 4 5 8 9 10
memmove(arr1+2, arr1, 20);
return 0;
}
?memmove的模拟实现
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
void* my_memmove(void* dest, const void* src, size_t num)
{
void* ret = dest;
//assert(dest && src);
if (dest < src)
{
//前->后
while (num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else
{
//后->前
while (num--)//19
{
*((char*)dest + num) = *((char*)src + num);
}
}
return ret;
}
int main()
{
int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };
// 1 2 1 2 3 4 5 8 9 10
my_memmove(arr1+2, arr1, 20);
return 0;
}
第一种情况? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第二种情况? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第三种情况
?上面代码的理论原理:
三.memcmp——内存比较
int memcmp ( const void * ptr1, const void * ptr2, size_t num );
memcmp的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
//memcmp - 内存比较
int main()
{
float arr1[] = { 1.0, 2.0,3.0,4.0 };
float arr2[] = { 1.0, 3.0 };
int ret = memcmp(arr1, arr2, 4);
printf("%d\n", ret);
ret = memcmp(arr1, arr2, 6);
printf("%d\n", ret);
ret = memcmp(arr1, arr2, 8);
printf("%d\n", ret);
return 0;
}
- ?memcmp与strcmp的使用方法很像,原理也很像,返回值也很像
- memcmp与strcmp的不同:strcmp只能比较字符串,而memcmp能比较任意类型,
- memcmp主要比较的是两个的内存
四.memset——内存设置
void * memset ( void * ptr, int value, size_t num );
memset的使用?
#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <string.h>
int main()
{
//40
int arr[10] = { 0 };//20
memset(arr, 1, 20);//以字节为单位设置内存的
//01 00 00 00
//01 01 01 01
return 0;
}
- ?memset是一个字节一个字节的设置成使用者想要内容
这里我推荐一个查看库函数的网站:cplusplus.com - The C++ Resources Network
---------------------------------------------------------------------------------------------------------------------------------
本章完?
|