文件操作(你真的会读写文件吗?)

发布时间:2024年01月12日


欢迎各位小伙伴关注我的专栏,和我一起系统学习C语言,共同探讨和进步哦!

学习专栏:

《零基础学C语言》


一、为什么使用文件?

如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的保存,我们可以使用文件。

二、什么是文件?

磁盘上的文件是文件。 但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。

2.1 程序文件

程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

2.2 数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。


我们讨论的重点就是对数据文件进行操作!


2.3 文件名

一个文件要有一个唯一的文件标识

文件名包含3部分:文件路径 + 文件名主干 + 文件后缀

  • 例如: c:\code\test.txt

为了方便起见,文件标识常被称为文件名

三、二进制文件和文本文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件

3.1 二进制文件

数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。

3.2 文本文件

如果转换为以ASCII字符的形式存储的文件,就是文本文件。


那么,为什么要分两种不同文件存储呢?这就关系到数据在内存中的存储。

字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。

  • 如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符?个字节),而二进制形式输出,则在磁盘上只占4个字节

所以使用二进制文件可以节省内存空间,但是文本文件的优势在于可读性(二进制文件一般都是乱码)

四、文件的打开和关闭

4.1 流和标准流

4.1.1 流

因为程序的数据需要和外部设备进行交互,而不同的外部设备交互方式不同,所以为了简化操作,抽象出一种概念——流。

流相当于数据与外部设备的中转站,程序员对流进行操作,就可以将数据与不同的外部设备交互,而并不需要知道其中的细节(相当于封装)。

4.1.2 标准流

那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢?

那是因为C语言程序在启动的时候,默认打开了3个流:

  • stdin - 标准输入流,从键盘输入,scanf函数就是从标准输入流中读取数据。
  • stdout - 标准输出流,输出到屏幕,printf函数就是将信息输出到标准输出流中。
  • stderr - 标准错误流,输出到屏幕。

stdin、stdout、stderr 三个流的类型是: FILE* ,通常称为文件指针
C语言中,就是通过 FILE* 的文件指针来维护流的各种操作的。

4.2 文件指针

文件类型指针,简称为文件指针。

  • 每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。
  • 这些信息是保存在?个结构体变量中的。该结构体类型是由系统声明的,取名FILE
//VS2013编译环境提供的 stdio.h 
struct _iobuf
{
	char *_ptr;
	int _cnt;
	char *_base;
	int _flag;
	int _file;
	int _charbuf;
	int _bufsiz;
	char *_tmpfname;
};
typedef struct _iobuf FILE;

那么,我们可以创建?个FILE*的指针变量pf,来维护FILE结构体(文件信息区),间接达到操作该文件的效果

4.3 fopen和fclose

在编写程序的时候,在打开文件的同时,都会返回?个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系

ANSIC 规定使用 fopen 函数来打开文件fclose关闭文件(可以类比于malloc和free的关系)

//打开?件
FILE * fopen ( const char * filename, const char * mode );
//关闭?件
int fclose ( FILE * stream );

打开文件时,要输入文件名和打开模式,如下代码:

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}
	//操作文件
	//...
	fclose(pf);
	pf = NULL;
	return 0;
}

下面是一些常用的打开模式:

文件使用方式含义如果指定文件不存在
“r”(只读)为了输?数据,打开?个已经存在的?本?件出错
“w”(只写)为了输出数据,打开?个?本?件建??个新的?件
“a”(追加)向?本?件尾添加数据建??个新的?件

以上指令打开的是文本文件,如果要打开二进制文件,那就在后面加个b,比如rb,wb,ab。

五、文件的顺序读写

5.1 顺序读写函数

函数名功能适用于
fgetc字符输入所有输入流
fputc字符输出所有输入流
fgets文本行输入所有输入流
fputs文本行输出所有输入流
fscanf格式化输入所有输入流
fprintf格式化输出所有输入流
fread二进制输入文件
fwrite二进制输出文件

5.1.1 fgetc和fputc

int fputc ( int character, FILE* stream );

将字符写入流

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}
	
	for (int i = 0; i < 26; ++i)
	{
		fputc('a' + i, pf);
	}

	fclose(pf);
	pf = NULL;
	return 0;
}
int fgetc ( FILE* stream );

从流中读取字符

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}

	for (int i = 0; i < 26; ++i)
	{
		printf("%c ", fgetc(pf));
	}

	fclose(pf);
	pf = NULL;
	return 0;
}

5.1.2 fgets和fputs

int fputs ( const char* str, FILE* stream );

将字符串写入流

int main()
{
	FILE* pf = fopen("data.txt", "w");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}
	
	for (int i = 0; i < 5; ++i)
	{
		fputs("hello world\n", pf);
	}

	fclose(pf);
	pf = NULL;
	return 0;
}
char* fgets ( char* str, int num, FILE* stream );

从流中读取num个字符(包含\0)放入字符数组

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}

	char arr[20] = "xxxxxxxxxxxxxxxxx";

	fgets(arr, 10, pf);

	fclose(pf);
	pf = NULL;
	return 0;
}

5.1.3 fscanf和fprintf

int fscanf ( FILE* stream, const char* format, ... );

从流中读取格式化数据

int fprintf ( FILE* stream, const char* format, ... );

将格式化数据写入流

typedef struct stu
{
	char name[20];
	int age;
	float score;
}stu;

int main()
{
	stu s = { 0 };
	fscanf(stdin, "%s %d %f", s.name, &(s.age), &(s.score));
	fprintf(stdout, "%s %d %f", s.name, s.age, s.score);
	return 0;
}

5.1.4 fread和fwrite

size_t fwrite ( const void* ptr, size_t size, size_t count, FILE* stream );

将ptr中count个大小为size的数据写入流

int main()
{
	stu s = { "lisi", 19, 69.36 };
	FILE* pf = fopen("data.txt", "wb");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}

	fwrite(&s, sizeof(s), 1, pf);

	fclose(pf);
	pf = NULL;
	return 0;
}
size_t fread ( void* ptr, size_t size, size_t count, FILE* stream );

从流中读取count个大小为size的数据到ptr

int main()
{
	stu s = { 0 };
	FILE* pf = fopen("data.txt", "rb");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}

	fread(&s, sizeof(s), 1, pf);

	fclose(pf);
	pf = NULL;
	return 0;
}

5.2 对比一组函数

函数名应用场景
scanf/printf针对标准输入/输出流
fscanf/fprintf针对所以输入/输出流
sscanf/sprintf针对字符串

六、文件的随机读写

6.1 fseek

int fseek ( FILE* stream, long int offset, int origin );

可以根据偏移量和流起始位置,重定位文件指针

流起始位置有三种:

常量名位置
SEEK_SET文件开头
SEEK_CUR文件指针当前位置
SEEK_END文件结尾
int main()
{
	FILE* pf = fopen("data.txt", "r");

	printf("%c", fgetc(pf));
	printf("%c", fgetc(pf));

	fseek(pf, -3, SEEK_END);

	printf("%c", fgetc(pf));
	printf("%c", fgetc(pf));
	return 0;
}

6.2 ftell

long int ftell ( FILE * stream );

返回当前文件指针相对于文件开头的偏移量

6.3 rewind

void rewind ( FILE * stream );

让文件指针返回文件开头

七、文件读取结束的判定

7.1 是否结束的判定

文本文件读取是否结束:

  • fgetc返回值是否为EOF
  • fgets返回值是否为NULL

二进制文件读取是否结束:

  • fread返回值是否小于实际要读的个数

7.2 结束原因的判定

int feof ( FILE * stream );

判断是否遇到文件末尾(非0代表遇到)

int ferror ( FILE * stream );

判断是否遇到错误(非0代表遇到)


举个例子:

int main()
{
	FILE* pf = fopen("data.txt", "r");
	if (pf == NULL)
	{
		perror("fopen fail");
		return 1;
	}

	int ch = 0;
	while ((ch = fgetc(pf)) != EOF)
	{
		putchar(ch);
	}

	if (feof(pf))
	{
		printf("reach the end of file");
	}
	else if (ferror(pf))
	{
		printf("I/O error while reading");
	}

	fclose(pf);
	pf = NULL;
	return 0;
}

八、文件缓冲区

其实,程序数据区和磁盘之间,并不是直接进行交互的,它们有一个中转站——文件缓冲区。无论是写入数据还是读取数据,都要等待缓冲区充满或者刷新,才能进行传递。

有了文件缓冲区,操作系统才能保持较高效率。要不然读取一个字符,就要打断一次操作系统,那效率将低的无法想象。

#include <stdio.h>
#include <windows.h>
//VS2019 WIN11环境测试
int main()
{
	FILE*pf = fopen("test.txt", "w");
	fputs("abcdef", pf);//先将代码放在输出缓冲区
	printf("睡眠10秒-已经写数据了,打开test.txt?件,发现?件没有内容\n");
	Sleep(10000);
	printf("刷新缓冲区\n");
	fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到?件(磁盘)
	//注:fflush 在?版本的VS上不能使?了
	printf("再睡眠10秒-此时,再次打开test.txt?件,?件有内容了\n");
	Sleep(10000);
	fclose(pf);
	//注:fclose在关闭?件的时候,也会刷新缓冲区
	pf = NULL;
	return 0;
}

结论:因为有缓冲区的存在,C语言在操作文件的时候,需要刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。

看到这里了还不给博主扣个: ?? 点赞??收藏 ?? 关注! 💛 💙 💜 ?? 💚💓 💗 💕 💞 💘 💖
拜托拜托这个真的很重要! 你们的点赞就是博主更新最大的动力! 有问题可以评论或者私信呢秒回哦。

文章来源:https://blog.csdn.net/2301_79188764/article/details/135551187
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。