【Linux】进程周边001之进程概念

发布时间：2023年12月17日

👀樊梓慕：个人主页

?🎥个人专栏：《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C++》《Linux》

🌝每一个不曾起舞的日子，都是对生命的辜负

前言

1.基本概念

2.描述进程-PCB

2.1task_struct-Linux中的PCB

2.2task_struct内容分类（成员）

4.1PCB是属于操作系统的还是属于进程的？

前言

上篇文章我们说学习系统我们要翻越三座大山：进程周边、文件周边以及线程周边。

那今天我们就对第一座大山：进程周边开启攀登之旅💪

本篇文章主要讲解有关进程的基本概念，以及Linux系统下是如何管理进程的，还记得学习管理的六字真言么？没错，对于进程的管理也是先描述，再组织。

之后我们再来学习下如何查看进程以及进程的标识符PID、父进程的标识符PPID。

最后我们初步的认识下fork函数，并利用fork函数实现创建子进程等。

话不多说，直接进入我们今天的学习?

欢迎大家📂收藏📂以便未来做题时可以快速找到思路，巧妙的方法可以事半功倍。

=========================================================================

GITEE相关代码：🌟fanfei_c的仓库🌟

=========================================================================

1.基本概念

较为官方的说法：

课本概念：?程序的一个执行实例，正在执行的程序等。
内核观点：?担当分配系统资源（CPU时间，内存）的实体。

辅助理解：

对代码进行编译链接产生的文件我们称之为可执行程序（.exe），执行该程序，该程序会被加载到内存中，此时便称之为进程。

2.描述进程-PCB

上节课我们学习了管理的概念，并总结为六字真言：先描述，再组织。

那对于操作系统来说，管理进程的方式仍然归结于这六字真言中。

我们也可以将进程描述起来，描述得到的就是进程控制块PCB（process control block）。

PCB就是进程属性的集合（数据结构），里面存储的是进程信息。

管理不是直接管理人，而是管理人的信息；

管理不是直接管理进程，而是管理进程的信息（PCB）。

此时操作系统对进程的管理就转化为对PCB对象的管理。

那对于某个数据结构的管理我们是很熟悉的，假如我们利用链表的方式进行组织，那对于进程的管理说白了就是对链表的增删查改。

换句话说：进程=PCB（内核数据结构）+可执行程序?

未来，所有对进程的控制和操作，都只和进程的PCB有关，和进程的可执行程序没有关系。

如果愿意，你可以把PCB（Node节点）放到任意数据结构中去。

2.1task_struct-Linux中的PCB

task_struct就是在Linux中描述进程的结构体（Linux是C语言编写）。

你可以理解为PCB是操作系统学科抽象的叫法，而在Linux中具体为task_struct。

即task_struct是Linux内核的一种数据结构，它会被装载到RAM（内存）里并且包含进程的信息。

2.2task_struct内容分类（成员）

标示符（PID）：描述本进程的唯一标示符，用来区别其他进程（每次启动都会变化）。
状态：任务状态，退出代码，退出信号等。
优先级：相对于其他进程的优先级。
程序计数器(pc)：程序中即将被执行的下一条指令的地址。
内存指针：包括程序代码和进程相关数据的指针，还有和其他进程共享的内存块的指针。
上下文数据：进程执行时处理器的寄存器中的数据。
I/O状态信息：包括显示的I/O请求，分配给进程的I/O设备和被进程使用的文件列表。
记账信息：可能包括处理器时间总和，使用的时钟总和，时间限制，记账号等。
其他信息。

3.查看进程

3.1通过系统目录查看

根目录下的proc目录，/proc下存储着进程信息。

目录名为数字的即为进程信息的目录，每个目录内存储着他们对应的进程信息。

而这些数字对应着该进程的标识符PID。

比如查看标识符PID=1的进程信息：

当我们新建一个普通的进程，并进入该进程所在目录时：

我们可以利用chdir系统调用接口修改工作目录。

3.2通过用户级工具ps查看

实例：ps ajx/ps aux

该命令可以查看所有系统进程。

现在我们来写一段代码并生成可执行程序，执行后变成进程我们如何查看呢？

（1）代码：

#include<stdio.h>
#include<unistd.h>                                                                                                                  

int main()
{
	while(1)
	{
		printf("I am a process!\n");
		sleep(1);
	}
	return 0;
}

（2）编译后执行：

?（3）打开多窗口方便我们观察

?（4）如何查看单个进程？

首先我们已经知道如何查看系统中所有进程了，即ps ajx，那我们可以利用Linux之前学习的一些指令来显示我们想要查看的单个指令。

实例：ps ajx | head -1 && ps ajx | grep test

对以上指令的解释：

我们来观察一下是否是我们想要的结果：

?我们发现：test进程利用刚才的指令我们得到了该进程的相关信息，但是黄色框内是什么？

其实是grep命令：

?这里也侧面反映出几乎所有独立的指令，就是程序，运行起来也是进程。

这里grep实际也是进程，且该进程内包含有test的信息，所以也显示出来了。

如何去掉这多余信息呢？

实例：ps ajx | head -1 && ps ajx | grep test | grep -v grep

-v选项是反向搜索的意思，即过滤掉包含有grep内容的信息。??

另外我们也可以通过指令对进程进行检测，检测他是否运行：

实例：while :; do?ps ajx | head -1 && ps ajx | grep test | grep -v grep; sleep 1;done

观察进程创建和销毁的过程：?

?所以我们发现：进程是有生命的！

4.通过系统调用获取进程标识符（PID）

4.1PCB是属于操作系统的还是属于进程的？

答案是属于操作系统的，虽然PCB记录的是进程的相关信息，但是PCB是由操作系统创建并维护的。

那既然PCB是属于操作系统的，那我们如何查看PCB的信息呢？

在操作系统的那篇文章中我们提到过用户想要获取操作系统的信息，需要调用系统接口。

所以获取进程标识符(PID)等PCB的信息我们需要通过系统调用来获得，所以我们来认识下getpid()。

首先我们利用man getpid查看下命令手册：

我们发现getpid是在2号手册中，利用man man我们知道2号手册中记录的就是系统调用接口。?

?4.2使用getpid和getppid

（1）编写代码：

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main()
{
	pid_t id = getpid();
	while (1)
	{
		printf("I am a process!pid:%d\n", id);
		sleep(1);
	}
	return 0;
}

（2）执行可执行程序并观察

那我们再来学习一下getppid（获取父进程的进程标识符）。

一般在Linux中，普通进程，都有他的父进程。

每一个子进程都是由父进程创建出来的。?

子进程只能有一个父进程，父进程可以有多个子进程。

每次执行可执行程序，进程标识符会改变（因为每次都是新的进程）。?

那我们来观察一下他的父进程：

（3）编写代码：

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main()
{
	pid_t id = getpid();
    pid_t fid = getppid();
	while (1)
	{
		printf("I am a process!pid:%d ppid:%d\n", id, fid);
		sleep(1);
	}
	return 0;
}

（4）执行可执行程序并观察?

我们来查询一下该进程的父进程究竟是什么？?

我们发现该进程的父进程是bash（命令行解释器）。

在命令行启动的进程都是bash的子进程。

5.通过系统调用创建进程（fork初识）

./+可执行程序的方式是一种手动创建进程的方式。fork则是通过系统调用创建进程。

5.1fork函数创建子进程

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
	printf("before fork : I am a process,pid:%d,ppid:%d\n", getpid(), getppid());

	fork();

	printf("after fork : I am a process,pid:%d,ppid:%d\n", getpid(), getppid());
	sleep(2);
	return 0;
}

现象：

?确实如我们所料，fork执行后，创建出了一个子进程。

并且我们发现fork后面的语句执行了两次。

也就是说fork之后，代码共享，从一个进程分为两个分支，一为父，一为子。

?那我们如何知道谁是父谁是子呢？

这就要研究一下fork函数的返回值问题了。

5.2fork的返回值

意思是返回给父进程的是子进程的PID，返回给子进程的是0.

为什么？

因为父：子= 1：n，子找父是很容易的，而父找子必须有子的pid。

两个返回值么？

我们来验证一下：

执行结果：?

也就是说父进程使用该变量就返回子进程的pid，子进程使用就返回0。

提问：fork函数为什么会返回两次？?

当一个函数运行到了最后执行return的时候，这个函数的核心逻辑已经执行完成了！

而fork函数中必然会有创建子进程这一操作，所以在fork函数返回值之前，子进程已经存在了。

所以fork函数会返回两次值写入到变量中。

提问：id怎么可能同一个变量既等于0又等于pid？?

一个进程崩溃会不会影响其他进程呢？答案是不会。

注：任意进程之间是具有独立性的，互相不能影响，即便是父子进程。

子进程被创建时，会继承大部分父进程的属性，即子进程的创建是以父进程为模板的。

模拟场景：父进程或子进程对一共享数据进行修改会发生什么？

前面我们刚说到任意进程之间具有独立性，互相不能影响，所以操作系统必须保证这一点。

假如为子进程修改该数据：子进程会从父进程那拷贝一份到自己这里进行修改，这一行为称之为写时拷贝。

父进程修改该数据也如此。

id就是这一共享数据，返回的本质就是写入。

linux中可以使用同一变量名，表示不同的内存。

提问：我们创建子进程的目的是什么？

一般而言：我们想让父子做不同的工作。

所以我们就可以利用返回值的不同使用if进行分流。

5.3使用if进行分流

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
	int ret = fork();
	if (ret < 0) {
		perror("fork");
		return 1;
	}
	else if (ret == 0) { 
        //child的工作代码段
	}
	else { 
		//father的工作代码段
	}
	sleep(1);
	return 0;
}

本篇内容就到这里，其中有些知识需要学习到进程地址空间才能深入研究，博主会持续更新Linux系列文章，欢迎大家关注哈！

=========================================================================

如果你对该系列文章有兴趣的话，欢迎持续关注博主动态，博主会持续输出优质内容

🍎博主很需要大家的支持，你的支持是我创作的不竭动力🍎

🌟~ 点赞收藏＋关注 ~🌟

=========================================================================

文章来源:https://blog.csdn.net/2301_77112634/article/details/134793150
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！