1. 线程同步问题 伴随着多线程的使用,同步的问题是不可避免的出现,这是为什么呢?
首先我们看以下的例子: 全局变量g_nData在主线程及子线程中都有分别加10万次,结果会是怎样呢?
using namespace std;
int g_nData = 0;
//回调函数中对全局变量g_nData做加法操作
//子线程中加10万次
void foo() {
for (int i = 0; i < 100000; i++) {
g_nData++;
}
}
int _tmain(int argc, _TCHAR* argv[])
{
//定义一个子线程的对象 回调函数为foo()
std::thread t(foo);
//主线程中全局变量g_nData也加10万次
for (int i = 0; i < 100000; i++) {
g_nData++;
}
t.join();
std::cout << g_nData << std::endl;
return 0;
}
运行结果: 看到结果一脸懵逼,怎么着也不应该是119797呀!按想法应该要跑20万次呀!再跑一次看看。 值又不一样了,这就是多线程带来的同步的问题。
2. 线程同步问题的产生原因 分析一下问题:我们所写的C++语言属于高级语言,电脑在运行时会想将其转为低级语言即汇编语言。高级语言(c/c++)–>低级语言(汇编代码) (1)在子线程的g_nData++处设置断点并进行反汇编 (2)一行g_nData++ 的高级语言反汇编后看到有三句 释义:
/*
00DB42F3 mov eax,dword ptr [g_nData (0DBF380h)] 寄存器eax=内存中g_nData数值
g_nData++;
00DB42F8 add eax,1 寄存器eax++
00DB42FB mov dword ptr [g_nData (0DBF380h)],eax 内存中g_nData数值=寄存器eax
*/
查看反汇编代码的方法: (3) 同时主线程g_nData++处设置断点并进行反汇编,并与子线程的汇编代码放在一起比较:
子线程
00DB42F3 mov eax,dword ptr [g_nData (0DBF380h)] 寄存器eax=内存中g_nData数值
00DB42F8 add eax,1 寄存器eax++
00DB42FB mov dword ptr [g_nData (0DBF380h)],eax 内存中g_nData数值=寄存器eax
主线程:
005A48D9 mov eax,dword ptr [g_nData (0DBF380h)]
005A48DE add eax,1
005A48E1 mov dword ptr [g_nData (0DBF380h)],eax
子线程和主线程同时运行,其实质是利用时间片即交替20ms分别执行,一个执行完就挂起执行另一个线程,那么就有一种可能,一个线程中三行代码没执行完,但是时间到了,转而执行另一个线程。
(4)通俗易懂的举个例子: 子线程在20ms期间执行5000次,时间到的时候刚执行完以下代码:005A48E1 mov dword ptr [g_nData (0DBF380h)],eax ,并没有从寄存器中将值传递给内存,就转而执行主线程。 主线程接着执行了6000次,时间到了之后又传递给子线程,诡异的事情就在此时发生,因为刚才从子线程转到主线程的时候,下一步就是005A48E1 mov dword ptr [g_nData (0DBF380h)],eax ,这个时候系统就会让寄存器的值变为5000,紧接着运行,主线程的6000次就白跑了。
3. 线程同步问题的解决方法 为了解决上面的问题,我们可以怎么去修改代码呢? 方法很多,其中一种就是将t.join(); 提前,这样就可以等前面子线程运行结束才会执行下面的10万次的加法,这样就可以实现结果为20万次。
int _tmain(int argc, _TCHAR* argv[])
{
//定义一个子线程的对象 回调函数为foo()
std::thread t(foo);
t.join();
//主线程中全局变量g_nData也加10万次
for (int i = 0; i < 100000; i++) {
g_nData++;
}
std::cout << g_nData << std::endl;
return 0;
}
但是这种方法将同步运行变成了先后的运行,并未实现并发的要求,是伪并发,下篇我们将会讨论如何解决这些问题。
4. 学习视频地址:线程同步问题的产生原因
|