0. Intro
在使用操作数据库之前,记录信息,录入数据需要文件操作,这样就可以对诸如通讯录的程序记录信息,增加和删除信息,我们通过文件可以将数据直接存放在电脑的硬盘上,做到数据持久化,而不是在内存中
1. 文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。 文件名包含3部分:文件路径+文件名主干+文件后缀
例如: c:\demo\test.cpp 为了方便起见,文件标识常被称为文件名。
2. 文件的打开和关闭
2.1 文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE.
VS2013编译环境提供的stdio.h 头文件中有以下的文件类型申明:
struct _iobuf {
char* _ptr;
int _cnt;
char* _base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char* _tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。 每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。 一般都是通过一个FILE* 的指针来维护这个FILE结构的变量,这样使用起来更加方便。 创建一个FILE* 的指针变量:
FILE* pf;
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变 量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联 的文件。
2.2 打开和关闭文件
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
FILE * fopen ( const char * filename, const char * mode );
int fclose ( FILE * stream );
文件可以用一下方式操作打开
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
fclose(pf);
pf = NULL;
3. 文件顺序读写
3.1 利用以上函数实现拷贝文件操作
int main()
{
FILE* pr = fopen("data.txt", "r");
if (pr == NULL)
{
printf("open for reading: %s\n", strerror(errno));
return 0;
}
FILE* pw = fopen("data2.txt", "w");
if (pw == NULL)
{
printf("open for writting: %s\n", strerror(errno));
fclose(pr);
pr = NULL;
return 0;
}
int ch = 0;
while ((ch = fgetc(pr)) != EOF)
{
fputc(ch, pw);
}
fclose(pr);
pr = NULL;
fclose(pw);
pw = NULL;
return 0;
}
3.2 二进制的读写
int main()
{
struct Stu s[2] = { {"张三", 20, 95.5} , {"lisi", 16, 66.5}};
FILE* pf = fopen("data.txt", "wb");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
fwrite(s, sizeof(struct Stu), 2, pf);
fclose(pf);
pf = NULL;
return 0;
}
int main()
{
struct Stu s[2] = {0};
FILE* pf = fopen("data.txt", "rb");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
fread(s, sizeof(struct Stu), 2, pf);
printf("%s %d %lf\n", s[0].name, s[0].age, s[0].d);
printf("%s %d %lf\n", s[1].name, s[1].age, s[1].d);
fclose(pf);
pf = NULL;
return 0;
}
3.3 格式化输入输出函数
上面函数的区别就是
下面是使用示例标准化读入一个自定义的结构体
struct Stu
{
char name[20];
int age;
double d;
};
int main()
{
struct Stu s = { 0 };
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
fscanf(pf, "%s %d %lf", s.name, &(s.age), &(s.d));
printf("%s %d %lf\n", s.name, s.age, s.d);
fclose(pf);
pf = NULL;
return 0;
}
4. 文件的随机读写操作
4.1 fseek
根据文件指针的位置和偏移量来定位文件指针。也就是从一个特定的位置偏移多少偏移量
int fseek ( FILE * stream, long int offset, int origin );
使用实例:
#include <stdio.h>
int main()
{
FILE* pFile;
pFile = fopen("example.txt", "wb");
fputs("This is an apple.", pFile);
fseek(pFile, 9, SEEK_SET);
fputs(" sam", pFile);
fclose(pFile);
return 0;
}
fseek(pf, 3, SEEK_CUR);
fseek(pf, 5, SEEK_SET);
fseek(pf, -1, SEEK_END);
4.2 ftell
返回文件指针相对于起始位置的偏移量
long int ftell ( FILE * stream );
4.3 rewind
让文件指针的位置回到文件的起始位置
void rewind ( FILE * stream );
使用实例:
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
int ch = fgetc(pf);
printf("%c\n", ch);
ch = fgetc(pf);
printf("%c\n", ch);
int ret = ftell(pf);
printf("%d\n", ret);
rewind(pf);
fseek(pf, 0, SEEK_SET);
ret = ftell(pf);
printf("%d\n", ret);
fclose(pf);
pf = NULL;
return 0;
}
5. 文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。 数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。 如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文 本文件。
5.1 一个数据在内存中的存储方式
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。 如有整数20000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而 二进制形式输出,则在磁盘上只占4个字节(VS2013)。
6. 文件读取错误的判定
6.1 被错误使用的feof
?? 在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
🍁 文本文件读取是否结束,判断返回值是否为EOF ( fgetc ),或者NULL ( fgets) fgetc 判断是否为EOF fgets 判断返回值是否为NULL
🍁 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。 fread判断返回值是否小于实际要读的个数。
int main(void)
{
int c;
FILE* fp = fopen("test.txt", "r");
if (!fp) {
perror("File opening failed");
return EXIT_FAILURE;
}
while ((c = fgetc(fp)) != EOF)
{
putchar(c);
}
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
}
二进制文件
enum { SIZE = 5 };
int main()
{
double a[SIZE] = { 1.,2.,3.,4.,5. };
FILE* fp = fopen("test.bin", "wb");
fwrite(a, sizeof * a, SIZE, fp);
fclose(fp);
double b[SIZE];
fp = fopen("test.bin", "rb");
size_t ret_code = fread(b, sizeof * b, SIZE, fp);
if (ret_code == SIZE) {
puts("Array read successfully, contents: ");
for (int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
putchar('\n');
}
else {
if (feof(fp))
printf("Error reading test.bin: unexpected end of file\n");
else if (ferror(fp)) {
perror("Error reading test.bin");
}
}
fclose(fp);
}
7. 文件缓冲区
ANSIC 标准采用**“缓冲文件系统”处理的数据文件,所谓缓冲文件系统是指系统自动地在内存中为程序 中每一个正在使用的文件开辟一块“文件缓冲区”**。从内存向磁盘输出数据会先送到内存中的缓冲区,装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据 送到程序数据区(程序变量等)。缓冲区的大小根 据C编译系统决定的。
刷新缓冲区的意思就是为了立马看到缓冲区里的东西,不用再积累到满再输出
测试代码,下面的这个代码其实就是在说在Sleep的时候程序是写数据时先写到缓冲区中,当主动刷新的时候就会把数据从缓冲区写入硬盘,主动刷新可以使用函数fflush ,当然再关闭文件的时候其实也是会自动刷新的,所以关闭文件很重要,Java文件操作也是要关闭文件
#include <stdio.h>
#include <windows.h>
int main()
{
FILE* pf = fopen("test.txt", "w");
fputs("abcdef", pf);
printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);
printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
fclose(pf);
pf = NULL;
return 0;
}
7.1 行缓冲
倘若是这样的代码在Linux中的话会一直无输出直到缓冲区满
倘若加了’\n’的话就是行缓冲,会直接打印出来
小结:
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。 如果不做,可能导致读写文件的问题。
8. 牛刀小试
下列关于文件名及路径的说法中错误的是:( )
A.文件名中有一些禁止使用的字符
B.文件名中一定包含后缀名
C.文件的后缀名决定了一个文件的默认打开方式
D.文件路径指的是从盘符到该文件所经历的路径中各符号名的集合
B选项中,文件名可以不包含后缀名。A的话,文件中不能包含这些字符:\/:*?"<>| ,C表述了后缀名的作用,D是路径的基本概念。故选B。
C语言中关于文件读写函数说法不正确的是:( )
A.fgetc是适用于所有输入流字符输入函数
B.getchar也是适用于所有流的字符输入函数
C.fputs是适用于所有输出流的文本行输出函数
D.fread是适用于文件输入流的二进制输入函数
B选项中,getchar只针对标准输入流stdin。即使对stdin重定向,getchar针对的也只是stdin。f系列的输入输出函数都是作用于所有流的的,所以AC没问题,D的表述也没问题,fread做的就是二进制的活。
下面说法不正确的是:( )
A.scanf和printf是针对标准输入、输出流的格式化输入、输出语句
B.fscanf和fprintf是针对所有输入、输出流的格式化输入、输出语句
C.sscanf是从字符串中读取格式化的数据
D.sprintf是把格式化的数据写到输出流中
D选项中,sprintf是把格式化的数据写到字符串中,与输出流无关。其他三句都准确描述了函数功能。
|