Linux环境多线程编程基础设施

本文介绍多线程环境下并行编程的基础设施。主要包括:

  • volatile
  • __thread
  • Memory Barrier
  • __sync_synchronize

volatile

编译器有时候为了优化性能,会将一些变量的值缓存到寄存器中,因此如果编译器发现该变量的值没有改变的话,将从寄存器里读出该值,这样可以避免内存访问。

但是这种做法有时候会有问题。如果该变量确实(以某种很难检测的方式)被修改呢?那岂不是读到错的值?是的。在多线程情况下,问题更为突出:当某个线程对一个内存单元进行修改后,其他线程如果从寄存器里读取该变量可能读到老值,未更新的值,错误的值,不新鲜的值。

如何防止这样错误的“优化”?方法就是给变量加上volatile修饰。


  1. volatile int i=10;//用volatile修饰变量i 
  2.  
  3. ......//something happened 
  4.  
  5. int b = i;//强制从内存中读取实时的i的值  

OK,毕竟volatile不是完美的,它也在某种程度上限制了优化。有时候是不是有这样的需求:我要你立即实时读取数据的时候,你就访问内存,别优化;否则,你该优化还是优化你的。能做到吗?

不加volatile修饰,那么就做不到前面一点。加了volatile,后面这一方面就无从谈起,怎么办?伤脑筋。

其实我们可以这样:


  1. int i = 2; //变量i还是不用加volatile修饰 
  2.  
  3. #define ACCESS_ONCE(x) (* (volatile typeof(x) *) &(x))  

需要实时读取i的值时候,就调用ACCESS_ONCE(i),否则直接使用i即可。

这个技巧,我是从《Is parallel programming hard?》上学到的。

听起来都很好?然而险象环生:volatile常被误用,很多人往往不知道或者忽略它的两个特点:在C/C++语言里,volatile不保证原子性;使用volatile不应该对它有任何Memory Barrier的期待。

第一点比较好理解,对于第二点,我们来看一个很经典的例子:


  1. volatile int is_ready = 0; 
  2.  
  3. char message[123]; 
  4.  
  5. void thread_A 
  6.  
  7.  
  8.   while(is_ready == 0) 
  9.  
  10.   { 
  11.  
  12.   } 
  13.  
  14.   //use message; 
  15.  
  16.  
  17. void thread_B 
  18.  
  19.  
  20.   strcpy(message,"everything seems ok"); 
  21.  
  22.   is_ready = 1; 
  23.  
  24. }  

线程B中,虽然is_ready有volatile修饰,但是这里的volatile不提供任何Memory Barrier,因此12行和13行可能被乱序执行,is_ready = 1被执行,而message还未被正确设置,导致线程A读到错误的值。

这意味着,在多线程中使用volatile需要非常谨慎、小心。

__thread

__thread是gcc内置的用于多线程编程的基础设施。用__thread修饰的变量,每个线程都拥有一份实体,相互独立,互不干扰。举个例子:


  1. #include 
  2.  
  3. #include 
  4.  
  5. #include 
  6.  
  7. using namespace std; 
  8.  
  9. __thread int i = 1; 
  10.  
  11. void* thread1(void* arg); 
  12.  
  13. void* thread2(void* arg); 
  14.  
  15. int main() 
  16.  
  17.  
  18.   pthread_t pthread1; 
  19.  
  20.   pthread_t pthread2; 
  21.  
  22.   pthread_create(&pthread1, NULL, thread1, NULL); 
  23.  
  24.   pthread_create(&pthread2, NULL, thread2, NULL); 
  25.  
  26.   pthread_join(pthread1, NULL); 
  27.  
  28.   pthread_join(pthread2, NULL); 
  29.  
  30.   return 0; 
  31.  
  32.  
  33. void* thread1(void* arg) 
  34.  
  35.  
  36.   coutiendl;//输出 2   
  37.  
  38.   return NULL; 
  39.  
  40.  
  41. void* thread2(void* arg) 
  42.  
  43.  
  44.   sleep(1); //等待thread1完成更新 
  45.  
  46.   coutiendl;//输出 2,而不是3 
  47.  
  48.   return NULL; 
  49.  
  50. }  

需要注意的是:

1,__thread可以修饰全局变量、函数的静态变量,但是无法修饰函数的局部变量。

2,被__thread修饰的变量只能在编译期初始化,且只能通过常量表达式来初始化。

Memory Barrier

为了优化,现代编译器和CPU可能会乱序执行指令。例如:


  1. int a = 1; 
  2.  
  3. int b = 2; 
  4.  
  5. a = b + 3; 
  6.  
  7. b = 10;  

CPU乱序执行后,第4行语句和第5行语句的执行顺序可能变为先b=10然后再a=b+3

有些人可能会说,那结果不就不对了吗?b为10,a为13?可是正确结果应该是a为5啊。

哦,这里说的是语句的执行,对应的汇编指令不是简单的mov b,10和mov b,a+3。

生成的汇编代码可能是:


  1. movl    b(%rip), %eax ; 将b的值暂存入%eax 
  2.  
  3. movl    $10, b(%rip) ; b = 10 
  4.  
  5. addl    $3, %eax ; %eax加3 
  6.  
  7. movl    %eax, a(%rip) ; 将%eax也就是b+3的值写入a,即 a = b + 3  

这并不奇怪,为了优化性能,有时候确实可以这么做。但是在多线程并行编程中,有时候乱序就会出问题。

一个最典型的例子是用锁保护临界区。如果临界区的代码被拉到加锁前或者释放锁之后执行,那么将导致不明确的结果,往往让人不开心的结果。

还有,比如随意将读数据和写数据乱序,那么本来是先读后写,变成先写后读就导致后面读到了脏的数据。因此,Memory Barrier就是用来防止乱序执行的。具体说来,Memory Barrier包括三种:

1,acquire barrier。acquire barrier之后的指令不能也不会被拉到该acquire barrier之前执行。

2,release barrier。release barrier之前的指令不能也不会被拉到该release barrier之后执行。

3,full barrier。以上两种的合集。

所以,很容易知道,加锁,也就是lock对应acquire barrier;释放锁,也就是unlock对应release barrier。哦,那么full barrier呢?

__sync_synchronize

__sync_synchronize就是一种full barrier。

本文作者:佚名

来源:51CTO

时间: 2025-01-25 14:06:52

Linux环境多线程编程基础设施的相关文章

Linux的多线程编程的高效开发经验

简介:本文中我们针对 Linux 上多线程编程的主要特性总结出 5 条经验, 用以改善 Linux 多线程编程的习惯和避免其中的开发陷阱.在本文中,我们穿 插一些 Windows 的编程用例用以对比 Linux 特性,以加深读者印象. 背景 Linux 平台上的多线程程序开发相对应其他平台(比如 Windows)的多线程 API 有一些细微和隐晦的差别.不注意这些 Linux 上的一些开发陷阱,常常会 导致程序问题不穷,死锁不断.本文中我们从 5 个方面总结出 Linux 多线程编 程上的问题,

Linux下多线程编程(C语言)

Linux下多线程编程(C语言) 2.6内核开始使用NPTL(Native POSIX Thread Library)线程库,这个线程库有以下几个目标: POSIX兼容,都处理结果和应用,底启动开销,低链接开销,与Linux Thread应用的二进制兼容,软硬件的可扩展能力,与C++集成等. 这里的线程是指用户空间的线程操作 一.线程相关操作 1.1  pthread_t      pthread_t 在头文件  /usr/include/i386-linux-gnu/bits/pthreadt

Linux 的多线程编程的高效开发经验

  简介:          本文中我们针对 Linux 上多线程编程的主要特性总结出 5 条经验,用以改善 Linux 多线程编程的习惯和避免其中的开发陷阱.在本文中,我们穿插一些 Windows 的编程用例用以对比 Linux 特性,以加深读者印象.   背景:    Linux 平台上的多线程程序开发相对应其他平台(比如 Windows)的多线程 API 有一些细微和隐晦的差别.不注意这些 Linux 上的一些开发陷阱,常常会导致程序问题不穷,死锁不断.本文中我们从 5 个方面总结出 Li

初探linux pthread多线程编程

多线程的创建,pthread_create: 1 //头文件 2 #include<pthread.h> 3 //函数声明 4 intpthread_create(/*指向线程标识符的指针*/,/*线程属性参数,通常为NULL*/,/*返回值是void类型指针的函数 */,/*运行函数的参数*/); 5 //成功返回0,失败返回错误编号. 注意:被创建的线程可能在pthread_create执行完毕之前就开始执行. 编译注意:编译时注意加上-lpthread参数,以调用静态链接库.因为pthr

Linux下多线程编程遇到的一些问题

今天在学习了Linux的多线程编程的基础的知识点.于是就试着做了一个简单的Demo.本以为会得到预期的结果.不成想却遇到了意想不到的问题. 代码展示 我的C 代码很简单,就是一个简单的示例程序,如下: #include <stdio.h> #include <stdlib.h> #include<pthread.h> int sum ; void* runner(void *param); int main( int argc, char*argv[]) { pthre

linux c多线程编程实例代码_C 语言

直接看代码吧,代码里有注释 复制代码 代码如下: #include <stdio.h>#include <stdlib.h>#include <string.h>#include <pthread.h>#include <time.h>#define MAX 3 int number =0;pthread_t id[2];pthread_mutex_t mut; //初始化静态互斥锁 void thread1(void){    int i;  

linux c++ 多线程编程

文章参考: http://www.cnblogs.com/forstudy/archive/2012/04/05/2433853.html 一. 进程和线程      进程      (1) 系统中程序执行和资源分配的基本单位      (2) 每个进程有自己的数据段.代码段和堆栈段     (3) 在进行切换时需要有比较复杂的上下文切换        线程     (1) 减少处理机的空转时间,支持多处理器以及减少上下文切换开销, 比创建进程小很多     (2) 进程内独立的一条运行路线  

linux多线程编程(五)_Linux

线程 线程是计算机中独立运行的最小单位,运行时占用很少的系统资源.可以把线程看成是操作系统分配CPU时间的基本单元.一个进程可以拥有一个至多个线程.它线程在进程内部共享地址空间.打开的文件描述符等资源.同时线程也有其私有的数据信息,包括:线程号.寄存器(程序计数器和堆栈指针).堆栈.信号掩码.优先级.线程私有存储空间. 为什么有了进程的概念后,还要再引入线程呢?使用多线程到底有哪些好处?什么的系统应该选用多线程? 使用多线程的理由之一是和进程相比,它是一种非常"节俭"的多任务操作方式.

Linux多线程编程(一)_Linux

一.什么是线程?       线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源. 二.什么时候使用多线程?     当多个任务可以并行执行时,可以为每个任务启动一个线程. 三.线程的创建     使用pthread_create函数.     #include<pthread.h> int pthre