编程时我们经常需要对字符串进行操作,其中有一项操作就是去除字符串的头(尾)指定的字符,比如空格。通常我们会使用封装好的库函数或者类函数的Trim方法来实现,如果自己动手写一个TrimHead和TrimTail函数该如何实现呢? ? 本文针对字符串头(尾)部指定的字符的去除,分别给出两个实现方法。并分别比较一下改进后的性能如何?
一、从头部开始去除指定字符
首先从头遍历,直到遇见第一个非指定字符,此后将后续字符按顺序逐一前移。
void TrimHead(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
char* psz = pszSrc;
while (*psz && *psz == chTrim)
psz++;
int i = 0;
while(*psz)
{
*(pszSrc+i) = *psz;
i++;
psz++;
}
*(pszSrc+i) = 0;
}
上述函数中,在找到第一个非指定字符后,通过while函数逐一前移字符,如果后续字符串很长的话,性能是不是会比较低?我们改进一下,使用memmove函数替换while操作,下面是实现方法,代码更加简洁易读。
void TrimHeadEx(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
int iStrLen = strlen(pszSrc);
char* psz = pszSrc;
while (*psz && *psz == chTrim)
psz++;
if(psz != pszSrc)
{
iStrLen = iStrLen - (psz - pszSrc);
memmove(pszSrc, psz, (iStrLen+1));
}
}
方法二的代码要比方法一的简洁,那么它的速度会比方法一的快么?文末会给出答案。
?
二、去除尾部指定的字符
void TrimTail(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
char* psz = pszSrc;
char* pszLast = NULL;
while(*psz)
{
if(*psz == chTrim)
{
if(NULL == pszLast)
pszLast = psz;
}
else
pszLast = NULL;
psz++;
}
if(pszLast != NULL)
*pszLast = 0;
}
上述方法中,我们需要遍历完整个字符串,如果字符串很长的话,或者遇到极端情况,就是结尾没有指定字符时,也要将整个字符串遍历完毕。显然这种实现方式的效率并不高。 那么我们改进一下算法,从字符串的尾部进行遍历。
void TrimTailEx(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
int iStrLen = strlen(pszSrc);
char* pszStr = pszSrc;
int iLastIdx = iStrLen - 1;
while(iLastIdx >= 0 && *(pszStr+iLastIdx) == chTrim)
iLastIdx--;
iStrLen = iLastIdx+1;
*(pszSrc+iStrLen) = 0;
}
上述实现方式是从字符串的尾部进行遍历,实现的方式也更加的简洁。如果结尾没有指定字符,该函数会在遍历第一个字符后就退出,性能显然要好过方式一。
那么对于TrimHead和TrimTail的两种实现,方式二和方式一到底谁快呢?是不是和我们想象的一样有差距或者差距很大呢? ?
三、测试比较
这里写了一个测试函数TestSpeedTrim,为了让时间更加明显,在该函数中设置的循环次数为10000000。大家可以亲自运行测试一下,看看debug和release两个版本的差异,结果一定会让你吃惊,可能和你想的并不一样哦。
#include <time.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
void TestSpeedTrim(bool bTrimHead)
{
char szTrim1[256] = {0};
char szTrim2[256] = {0};
char* pszOrigin = " This is a trim test head/tail ";
strcpy(szTrim1, pszOrigin);
strcpy(szTrim2, pszOrigin);
int i = 0;
int iCount = 10000000;
clock_t cStart = 0;
cStart = clock();
for(i = 0; i < iCount; i++)
{
bTrimHead ? TrimHead(szTrim1, ' ') : TrimTail(szTrim1, ' ');
}
clock_t cSpan1 = clock() - cStart;
cStart = clock();
for(i = 0; i < iCount; i++)
{
bTrimHead ? TrimHeadEx(szTrim2, ' ') : TrimTailEx(szTrim2, ' ');
}
clock_t cSpan2 = clock() - cStart;
printf("cSpan1 = %d, cSpan2 = %d\r\n", cSpan1, cSpan2);
printf("szTrim1=[%s]\r\n", szTrim1);
printf("szTrim2=[%s]\r\n", szTrim2);
}
int main(int argc, char* argv[])
{
printf("删除头部的空字符:\r\n");
TestSpeedTrim(true);
printf("\r\n删除尾部的空字符:\r\n");
TestSpeedTrim(false);
getchar();
return 0;
}
这里就不给出比较结果了,因为只有自己亲自动手实现并跑一遍后,才会记得更加牢靠。
|