C语言中,对字符和字符串的处理十分频繁,但因为C语言本身是没有字符串类型的,字符串通常放在
常量字符串或者
字符数组中,
字符串常量适用于那些对它不做修改的字符串函数。
这篇文章,我们简单介绍处理字符和字符串的库函数的使用以及注意事项和模拟实现相关库函数。
求字符串长度
strlen
size_t strlen ( const char* str )
函数功能:
函数返回值:
说明:
- 字符串以 ‘\0’ 作为结束标志, strlen() 计算的是字符串的实际长度,返回的是在字符串结束标志 ‘\0’ 前面出现的字符个数(不包括 ‘\0’ )。
- str 指向的字符串必须要以 ‘\0’ 结束。
- 如果只定义字符串却没有给字符串赋初值,这个结果是不定的,函数会从首地址一直找下去,直到遇到 ‘\0’ 停止。
- 函数的返回值为 size_t ,是无符号的。
- 与 sizeof 的区别: strlen() 是函数, sizeof 不是函数,是一个操作符, sizeof 的返回值是变量声明后所占的内存数,不是实际长度。
函数实现:
-
有三种方式模拟实现 strlen() -
方式1:计数器
int my_strlen(const char* str)
{
assert(str != NULL);
int count = 0;
while (*str++)
{
count++;
}
return count;
}
int my_strlen(const char* str)
{
assert(str != NULL);
if (*str == '\0')
{
return 0;
}
else
{
return (1 + my_strlen(str + 1));
}
}
int my_strlen(char* str)
{
char* p = str;
while (*p != '\0')
{
p++;
}
return (p - str);
}
长度不受限制的字符串函数
strcpy
char* strcpy ( char* dest, const char* sour )
函数功能:
- 将 sour 字符串拷贝至 dest 所指的地址。
函数返回值:
说明:
- sour 字符串必须以 ‘\0’ 结束。
- 会将 sour 字符串的 ‘\0’ 拷贝到目标空间。
- dest 所指的内存空间必须可变,且足够大,以确保能存放 sour 字符串。
- 如果 dest 所指的内存空间不够大,可能会造成缓冲溢出的错误情况,可用 strncpy() 来取代。
函数实现:
char* my_strcpy(char* dest, const char* sour)
{
assert(dest != NULL);
assert(sour != NULL);
char* ret = dest;
while ((*dest++ = *sour++))
{
;
}
return ret;
}
strcat
char* strcat ( char* dest, const char* sour )
函数功能:
函数返回值:
说明:
- sour 字符串必须 ‘\0’ 结束,目标空间必须可修改。
- strcat() 会将 sour 字符串复制到 dest 所指的字符串尾部。
- dest 最后的结束字符 ‘\0’ 会被覆盖掉,并在拼接后的字符串尾部再增加一个 ‘\0’ 。
- dest 与 sour 所指的内存区域不能重叠, dest 必须有足够的空间来放置要复制的字符串。
- strcat() 无法做到字符串自己给自己追加。
函数实现:
char* my_strcat(char* dest, const char* sour)
{
assert(dest != NULL);
assert(sour != NULL);
char* ret = dest;
while (*dest)
{
dest++;
}
while ((*dest++ = *sour++))
{
;
}
return ret;
}
strcmp
int strcmp( const char* str1, const char* str2 )
函数功能:
函数返回值:
- str1字符串大于 str2 字符串,则返回大于 0 的数字;
- str1字符串等于 str2 字符串,则返回 0 ;
- str1字符串小于 str2 字符串,则返回小于 0 的数字。
说明:
- 通过 ASII 码值以及字符串长度比较两个字符串大小。
- strcmp() 是可以区分大小写的,如果希望不区分大小写进行字符串比较,可以使用 stricmp() 。
- strcmp() 从比较两个字符串的第一个字符开始,如果它们彼此相等,则继续比较下一个字符,直到字符不同或到达一个终止空字符 ‘\0’ 为止。
函数实现:
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 != NULL);
assert(str2 != NULL);
while (*str1 == *str2)
{
if (*str1 == '\0')
{
return 0;
}
str1++;
str2++;
}
return (*str1 - *str2);
}
长度受限制的字符串函数
strncpy
char* strncpy ( char* dest, const char* sour, size_t num )
函数功能:
- 将 sour 字符串的前 num 个字符拷贝至 dest 所指的地址。
函数返回值:
说明:
- 如果 sour 字符串的长度小于 num ,则拷贝完 sour 字符串后,将用 0 填充 dest ,直到 num 个。
- strncpy() 拷贝完不会向 dest 追加 ‘\0’ 。
- sour 和 dest 所指的内存区域不能重叠, dest 必须有足够的空间来放置 num 个字符。
函数实现:
char* my_strncpy(char* dest, const char* sour, size_t num)
{
assert(dest != NULL);
assert(sour != NULL);
char* ret = dest;
size_t len = strlen(sour);
size_t i = 0;
for (i = 0; i < num; i++)
{
if (i <= len)
{
*dest++ = *sour++;
}
else
{
*dest++ = '\0';
}
}
return ret;
}
strncat
char* strncat ( char* dest, const char* sour, size_t num )
函数功能:
- 将 sour 字符串的前 num 个字符追加到 dest 字符串结尾。
函数返回值:
说明:
- strncat() 会从 sour 字符串的开头拷贝 num 个字符到 dest 字符串尾部, dest 必须有足够的空间来放置要拷贝的字符串。
- 如果 num 大于 sour 字符串的长度,那么仅将 sour 字符串全部追加到 dest 字符串的尾部。
- strncat() 会将 dest 字符串最后的 ‘\0’ 覆盖掉,字符追加完成后,再追加 ‘\0’ 。
函数实现:
char* my_strncat(char* dest, const char* sour, size_t num)
{
assert(dest != NULL);
assert(sour != NULL);
char* ret = dest;
while (*dest)
{
dest++;
}
size_t i = 0;
for (i = 0; i < num; i++)
{
*dest++ = *sour++;
}
*dest = '\0';
return ret;
}
strncmp
int strncmp( const char* str1, const char* str2, size_t num )
函数功能:
函数返回值:
函数实现:
int my_strncmp(const char* str1, const char* str2, size_t num)
{
assert(str1 != NULL);
assert(str2 != NULL);
size_t i = 0;
for (i = 0; i < num; i++)
{
if (*str1 == *str2)
{
str1++;
str2++;
}
else
{
return (*str1 - *str2);
}
}
return 0;
}
字符串查找
strstr
char* strstr( const char* str1, const char* str2 )
函数功能:
- 查找 str2 字符串在 str1 字符串中首次出现的位置。
函数返回值:
- 返回 str1 字符串中第一次出现 str2 字符串的地址;
- 如果没有查找到 str2 字符串,则返回 NULL 。
函数实现:
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 != NULL);
assert(str2 != NULL);
char* s1 = (char*)str1;
char* s2 = (char*)str2;
char* ret = NULL;
if (*str2 == '\0')
{
return NULL;
}
while (*s1)
{
ret = s1;
s2 = (char*)str2;
while (*ret != '\0' && *s2 != '\0' && (*ret == *s2))
{
ret++;
s2++;
}
if(*s2 == '\0')
{
return s1;
}
s1++;
}
return NULL;
}
strtok
char* strtok( char* str, const char* sep )
函数功能:
函数返回值:
- 返回下一个分割后的字符串指针,如果已无从分割则返回 NULL 。
说明:
- sep 是个字符串,定义了用作分隔符的字符集合。
- str 指定一个字符串,包含了 0 个或者多个由 sep 字符串中一个或者多个字符分割的标记。
- strtok() 在 str 字符串中发现 sep 字符串的分割字符时会将该字符改为 ‘\0’ ,返回一个指向这个字符的指针。
- strtok() 会改变被操作的字符串,所以在使用 strtok() 切分的字符串一般都是临时拷贝的内容并且可修改。
- strtok() 在首次调用时必须赋予 str 字符串,函数将找到 str 中的第一个标记, strtok() 将保存第一个标记在字符串中的位置 。
- strtok() 往后的调用则设置成 NULL ,将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 。
错误信息报告
strerror
char* strerror( int errnum );
函数功能:
说明:
- #include <errno.h>——必须包含头文件。
字符操作
字符分类函数
函数 | 如果符合参数条件就返回真 |
---|
iscntrl | 任何控制字符 | isspace | 空白字符:空格’ ‘,换页’\f’,换行’\n’,回车’\r’,制表符’\t’或者垂直制表符’\v’ | isdigit | 十进制数字 0 ~ 9 | isxdigit | 十六进制数字,包括所有十进制数字,小写字母 a ~ f ,大写字母 A ~ F | islower | 小写字母 a~z | isupper | 大写字母 A~Z | isalpha | 字母 a~ z 或 A~Z | isalnum | 字母或数字, a ~ z , A ~ Z , 0 ~ 9 | ispunct | 标点符号,任何不属于数字或者字母的图形符号(可打印) | isgraph | 任何图形符号 | isprint | 任何可打印字符,包括图形字符和空白字符 |
字符转换
函数 | 功能 |
---|
int tolower(int c) | 转化字符为小写字母 | int toupper(int c) | 转化字符为大写字母 |
|