第四章学习笔记(20191213蓝一达)
第四章学习笔记
一、概述
本章讨论并发编程,介绍并行计算的概念,并指出并行计算的重要性。将顺序算法与并行算法进行了比较,并对并行性和并发性进行了比较。解释线程的原理及其相对于进程的优势。解释死锁问题,并解释如何防止并发程序中的死锁问题。讨论了信号量,并展示了它们相对于数千个条件变量的优势。它还解释了Linux中独特的线程方式。
二、线程
线程是同一地址空间中进程的独立执行单元。创建进程就是在一个唯一的地址空间中创建一个线程。当一个进程启动时,该进程的主线程被执行。如果只有一个主线程,那么进程和线程就没有真正的区别。但是,主线程可能会创建其他线程。每个线程可以创建更多的线程等等。一个进程的所有线程都在该进程的同一地址空间中执行,但每个线程都是一个独立的执行单元。
线程优势
更快的线程创建和切换:要在进程中创建线程,操作系统不需要为新线程分配内存和创建页表,因为线程和进程共享相同的地址空间。因此,创建线程比创建进程更快。
线程响应更快:一个进程只有一条执行路径。当一个进程被挂起时,所有其他进程都将停止执行。相反,当一个线程挂起时,同一进程中的其他线程可以继续执行。
线程更适合运行良好的计算:并行计算的目标是使用多个执行路径来更快地解决问题。基于分治原则的算法(如二叉树搜索和快速排序等。)经常表现出高度的并行性,这可以通过使用并行或并发执行来提高计算速度。
螺纹缺陷
由于地址空间共享,线程需要用户显式同步。
许多库函数可能对线程不安全。
在单CPU系统上,使用线程解决问题实际上比使用顺序程序慢,这是由运行时创建线程和切换上下文的开销造成的。
线程操作
线程的执行轨迹类似于进程的执行轨迹。线程可以在内核模式或用户模式下执行。在用户模式下,线程在进程的相同地址空间中执行,但是每个线程都有自己的执行堆栈。线程是独立的执行单元,可以根据操作系统内核的调度策略对内核进行系统调用,并被激活继续执行。为了利用线程的共享地址空间,操作系统内核的调度策略可能会优先考虑同一进程中的线程,而不是不同进程中的线程。
三、线程管理函数
Pthread并发编程
Pthread库为线程管理提供了以下apt。
pthread_create(thread,attr,function,arg):创建线程
pthread_exit(状态):终止线程
pthread_cancel(线程):取消线程
pthread_attr_init(attr) :初始化线程属性
pthread _ attr _ destroy(attr):销毁线程属性
使用pthread_ create()函数创建一个线程。int pthread _ create(pthread _ t pthread _ id,pthread_attr_t?attr,void * (func) (void *),void * arg);如果成功,则返回0,如果失败,则返回错误代码。
pthread_id是指向pthread_t类型变量的指针。它由操作系统内核分配的唯一线程标识填充。在POSIX中,pthread_t是一种不透明类型。程序员不应该知道不透明对象的内容,因为它可能依赖于成千上万的实现。一个线程可以通过pthread_self()函数获取自己的ID。在Linux中,pthread_t类型被定义为无符号长整数,所以线程ID可以打印为%lu。
Attr是指向另一个不透明数据类型的指针,它指定线程属性。
Func是要执行的新线程函数的填充地址。
Arg是指向线程函数参数的指针,可以写成void *func(void *arg),attr),attr参数使用:
定义了一个pthread可扩展索引pt:hread _ attr _ tattr。
使用pthread_attr_init(attr)初始化屈曲。
设置属性更改,并在pthread_ create()调用中使用它。
必要时通过pthread_attr_destroy(attr)释放attr资源。
线程ID是一种不透明的数据类型,这取决于实现情况。因此,不应直接比较线程id。如有必要,您可以使用pthread_ equal()函数来比较它们。
int pthread _ equal(pthread _ t t1,pthread _ t T2);
当函数结束时,线程终止。或者,线程可以调用函数int PTH rad _ axit { void * status }。
一个
个线程可以等待另一个线程的终止, 通过:int pthread_join (pthread_t thread, void **status__ptr); 终止线程的退出状态以status_ptr返回。
在 Pthread中,锁被称为互斥量,意思是相互排斥。互斥变呈是用 ptbread_mutex_t 类型声明的在使,用之前必须对它们进行初始化。有两种方法可以初始化互斥址。
静态方法,pthreaa—mutex_t m = PTHREAD_MUTEX_INITIALIZER;定义互斥量m,并使用默认属性对其进行初始化。
动态方法,使用 pthread_ mutex _init() 函数
四、死锁预防
-
预防死锁
通过破坏产生死锁的四个必要条件来预防死锁,
但因互斥条件是必须的,所以不能破坏该条件。 -
预防死锁-破坏“请求和保持”条件
为了破坏该条件,OS需要保证:
当进程请求资源时,不可持有不可抢占资源。
可通过两个协议实现: -
第一种协议
进程在开始运行前,一次性申请整个运行过程中所需的全部资源。
缺点:
资源严重浪费。
进程进程出现饥饿现象。
第二种协议
进程在开始运行前,仅请求初期所需资源,运行时逐步释放不再需要的资源,并请求新的所需资源。 -
预防死锁-破坏“不可抢占”条件
保持了不可抢占资源的进程,提出新资源申请,但不被满足时,释放所有已得到的资源。
实现复杂,且释放已有资源很可能付出很大代价。
预防死锁-破坏“循环等待”条件
对系统所有资源类型进行排序,并赋予不同序号,进程在请求资源时,必须按序号递增顺序请求资源。如果一个拥有高序号资源的进程,请求低序号资源,则需要先释放高序号资源,再请求低序号资源。
资源利用率与吞吐量相较前两策略改善不少。 -
缺点:
新设备的增加被限制。
资源标号困难。
限制用户编程思路。 -
避免死锁
在资源动态分配过程中,防止系统进入不安全状态,限制弱,但成本低。
避免死锁-系统安全状态
死锁避免中,系统状态被划分成安全状态与不安全状态,处于不安全状态时,系统可能进入死锁。
允许进程动态申请资源,但OS进行分配资源前,应先评估资源分配安全性,仅安全状态下可分配。
安全状态,是指OS能按某进程推进顺序为各进程分配资源(包括释放资源),满足各进程对资源的最大需求。
安全状态下不会出现死锁。
安全状态的例子见P119,很简单的一个例子。
避免死锁-利用银行家算法避免死锁
由Dijkstra的银行家算法是一个非常有代表性的避免死锁算法。
为实现银行家算法,每个新进程在进入系统时,先申明各所需资源的最大数目。
OS分配资源时,先确认有足够资源分配给该进程,再确认分配资源后是否会进入不安全状态。
银行家算法的数据结构
Available[]:可利用资源向量,包含m个元素的数组,表示系统中该类资源的数目。
Max[][]:nm矩阵,n个进程对m个资源的最大需求。
Allocation[][]:nm矩阵,n个进程已获得m个资源的数量。
Need[][]:n*m矩阵,n个进程所需的m个资源的数量。
关系:Need[i, j] = Max[i, j] - Allocation[i, j]
书本中的Need等二维向量,仅用一对[],但为了区分,变量名中我使用两对[]。
银行家算法
Request是进程p的请求向量,
Request[j]=k表示当前p进程对j资源需要k个数量。
如无特别说明,带序号的步骤为顺序步骤。
Request[][]=Need[][],如果大于,则认为出错,因为超过了它原先宣布的最大值。
Request[][]=Available[],如果大于,则等待。
将数据结构中各数据修改成分配资源后的值。
执行安全性算法,若安全,则分配数据,若不安全,则本次分配作废,进程等待。
安全性算法
设置两个临时变量Work[]=Available[]、Finish[]=false,分别表示当前可用资源数目、是否已经安全分配资源。
从进程集合中找到一进程i满足:Finish[i]false,并且Need[i, j]Work[j]的进程,若找到,进入3,否则进入4.
设置Work[j]+=Available[i, j],Finish[i]=true,即分配完资源给进程,进程结束后释放资源,Work增加,安全分配,Finish置真。
步骤3结束后,跳回步骤2.
所有进程Finish[]true,是则表示处于安全状态,不是则不安全。
五、实践与代码
#include stdio.h
#include stdlib.h
#include pthread.h
#define N 4
int A[N][N],sum[N];
void *func(void *arg)
{
int j,row ;
pthread_t tid = pthread_self();
row = (int)arg;
printf("Thread %d [%lu] computes sum of row %d\n",row,tid,row);
for(j=0;jN; j++)
sum[row] += A[row][j];
printf("Thread %d [%lu] done:sum [%d] =%d\n",row,tid,row,sum[row]);
pthread_exit ((void*)0);
}
int main(int argc, char *argv[])
{
pthread_t thread[N];
int i,j,r,total = 0;
void *status;
printf("Main: initialize A matrix\n");
for(i=0; iN;i++){
sum[i] = 0;
for(j=0;jN;j++){
A[i][j]=i*N+j+1;
printf("%4d ",A[i][j]);
}
printf( "\n" );
}
printf ("Main: create %d threads\n",N);
for(i=0;iN;i++) {
pthread_create(thread[i],NULL,func,(void *)i);
}
printf("Main: try to join with thread\n");
for(i=0; iN; i++) {
pthread_join(thread[i],status);
printf("Main: joined with %d [%lu]: status=%d\n",i,thread[i],
(int)status);
}
printf("Main: compute and print total sum:");
for(i=0;iN;i++)
total += sum[i];
printf ("tatal = %d\n",total );
pthread_exit(NULL);
}
- 用线程计算矩阵的和
假设我们要计算一个N×N整数矩阵中所有元素的和。这个问题可通过使用线程的并发算法来解决。在本示例中,主线程会先生成一个N×N整数矩阵。然后,它会创建N个工作线程,将唯一行号作为参数传递给各工作线程,并等待所有工作线程终止。每个工作线程计算不同行的部分和,并将部分和存入全局数组int sum[N]的相应行中。当所有工作线程计算完成后,主线程继续进行计算。它将工作线程生成的部分和相加来计算总和。
六、问题与解决
问题:在试用Linux 线程模块时,试用pthread_create 函数。
编译命令为 gcc main.c -o test时,会出现如下错误
解决办法:解决:在gcc编译的时候,附加要加 -lpthread参数即可解决。
试用如下命令即可编译通过:gcc c41.c -o c41 -lpthread
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/53734.html