Java核心知识体系1:泛型机制详解
Java核心知识体系2:注解机制详解
Java核心知识体系3:异常机制详解
Java核心知识体系4:AOP原理和切面应用
Java核心知识体系5:反射机制详解
Java核心知识体系6:集合框架详解
1 为什么需要多线程
我们都知道,CPU、内存、I/O 设备的速度是有极大差异的,为了合理利用 CPU 的高性能,平衡这三者的速度差异,计算机体系结构、操作系统、编译程序都做出了优化,主要体现为:
- CPU增加了缓存,均衡了与内存之间的速度差异,但会导致可见性问题
- 操作系统增加了进程、线程,以分时复用 CPU,进而均衡 CPU 与 I/O 设备的速度差异,但会导致原子性问题
- 编译程序优化指令执行服务器托管网次序,使得缓存能够得到更加合理地利用,但会导致有序性问题
从上面可以看到,虽然多线程平衡了CPU、内存、I/O 设备之间的效率,但是同样也带来了一些问题。
2 线程不安全案例分析
如果有多个线程,对一个共享数据进行操作,但没有采取同步的话,那操作结果可能超出预想,产生不一致。
下面举个粒子,设置一个计数器count,我们通过1000个线程同时对它进行增量操作,看看操作之后的值,是不是符合预想中的1000。
public class UnsafeThreadTest {
private in服务器托管网t count = 0;
public void add() {
count += 1;
}
public int get() {
return count;
}
}
public static void main(String[] args) throws InterruptedException {
final int threadNum = 1000;
UnsafeThreadTest threadTest = new UnsafeThreadTest();
final CountDownLatch countDownLatch = new CountDownLatch(threadSize);
ExecutorService executorSvc = Executors.newCachedThreadPool();
// 执行并发计数
for (int idx = 0; idx {
threadTest.add();
countDownLatch.countDown();
});
}
countDownLatch.await();
// 关闭线程池
executorSvc.shutdown();
System.out.println("最终计数:" + threadTest.get());
}
最终计数:994 // 结果跟预期的 1000 不一样
3 并发出现问题的原因
可以看到,上述代码输出的结果跟预期的 1000 不一样,我们需要理清楚发生了什么问题?
★ 并发三要素:可见性、原子性、有序性
3.1 可见性:由CPU缓存引起
CPU缓存是一种高速缓存,用于存储CPU最近使用的数据。由于CPU缓存比主存储器更快,因此CPU会尽可能地使用缓存,以提高程序的性能。但是,这也会导致可见性问题。
可见性问题是指当一个线程修改了一个共享变量的值时,另一个线程可能无法立即看到这个修改。
我们举个简单的例子,看下面这段代码:
// 主存中 index 的值默认为 10
System.out.println("主存中的值:" + index);
// Thread1 执行赋值
index = 100;
// Thread2 执行的
threadA = index;
因为Thread1修改后的值可能仍然存储在CPU缓存中,而没有被写回主存储器。这种情况下,Thread2无法读取到修改后的值,所以导致错误信息。
具体来说,当多个线程同时运行在同一个处理器上时,它们共享该处理器的缓存。如果一个线程修改了某个共享变量的值,该值可能被存储在处理器缓存中,并且未被立即写回到主存储器中。
因此,当另一个线程试图读取该变量的值时,它可能会从主存储器中读取旧的值 10,而不是从处理器缓存中读取已更新的值 100。
3.2 原子性: 由分时复用引起
原子性:原子性是指一个操作在执行过程中不可分割,即该操作要么完全执行,要么完全不执行。
我们举个简单的例子,看下面这段代码:
// 主存中 index 的值默认为 10
System.out.println("主存中的值:" + index);
// Thread1 执行增值
index += 1;
// Thread2 执行增值
index += 1
以上的信息可以看出:
- 主存的值为10
- i += 1 这个操作实际执行三条 CPU 指令
- 变量 i 从内存读取到 CPU寄存器;
- 在CPU寄存器中执行 i + 1 操作;
- 将最后的结果i写入内存,因为有缓存机制,所以最终可能写入的是 CPU 缓存而不是内存。
- 由于CPU分时复用(线程切换)的存在,Thread1执行了第一条指令后,就切换到Thread2执行,Thread2全部执行完成之后,再切换会Thread1执行后续两条指令,将造成最后写到内存中的index值是11而不是12。
3.3 有序性: 重排序引起
有序性:即程序执行的顺序按照代码的先后顺序执行。
重排序(Reordering)是指在计算机系统中,由于处理器优化或编译器优化等原因,导致指令执行的顺序与程序代码中的顺序不一致。重排序可能会引起有序性错误,即在并发或多线程环境中,程序执行的顺序与代码的先后顺序不一致,导致程序结果不正确或出现意外的结果。
我们举个简单的例子,看下面这段代码:
int idx = 10;
boolean isCheck = true;
idx += 1; // 执行语句1
isCheck = false; // 执行语句2
上面代码定义了一个int型变量,定义了一个boolean类型变量,然后分别对两个变量进行操作。
从代码顺序上看,执行语句1是在执行语句2前面的,那么JVM在真正执行这段代码的时候会保证语句1一定会在语句2前面执行吗? 不一定,为什么呢? 这里可能会发生指令重排序(Instruction Reorder)。
重排序(Reordering)是指在计算机系统中,由于处理器优化或编译器优化等原因,导致指令执行的顺序与程序代码中的顺序不一致。重排序可能会引起有序性错误,即在并发或多线程环境中,程序执行的顺序与代码的先后顺序不一致,导致程序结果不正确或出现意外的结果。
重排序引起的有序性错误主要有以下几种情况:
- 指令重排序:处理器为了优化程序的执行,可能会对指令进行重排序。这种重排序不会改变单线程程序的执行结果,但可能会影响多线程程序的行为。例如,一个线程修改了一个共享变量的值,但由于指令重排序,另一个线程在读取该变量时可能读取到过时的值。
- 内存访问重排序:处理器为了提高程序的执行效率,可能会对内存访问进行重排序。例如,一个线程先读取一个共享变量的值,然后再写入该值,但由于内存访问重排序,处理器可能会先执行写入操作,再执行读取操作,从而导致其他线程无法正确地读取到修改后的值。
- 同步操作重排序:在并发或多线程环境中,同步操作可能会被重排序。例如,一个线程先释放了一个锁,然后再执行另一个操作,但由于同步操作重排序,释放锁的操作可能会先于另一个操作执行,从而导致其他线程无法正确地获取锁。
为了避免重排序引起的有序性错误,可以采用一些同步机制来确保程序的执行顺序,如内存屏障(Memory barrier,intel 称为 memory fence)、指令fence等。这些同步机制可以确保指令的执行顺序与代码中的顺序一致,避免指令重排序和内存访问重排序等问题。同时,也可以使用串行化(Serialization)或事务内存(Transactional memory)等技术来保证并发程序的有序性。
4 总结
- CPU、内存、I/O 设备的速度是有极大差异的,多线程 的实现是为了合理利用 CPU 的高性能,平衡这三者的速度差异
- 多线程情况下,并发产生问题的三要素:可见性、原子性、有序性
- 可见性:由CPU缓存引起
- 原子性: 由分时复用引起
- 有序性: 重排序引起
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
机房租用,北京机房租用,IDC机房托管, http://www.fwqtg.net
相关推荐: Vue中如何进行分布式日志收集与日志分析(如ELK Stack)
在Vue中实现分布式日志收集与日志分析(使用ELK Stack) 日志收集和分析在现代应用程序中是至关重要的,它们可以帮助开发人员监视和诊断应用程序的行为,从而提高应用程序的稳定性和性能。ELK Stack(Elasticsearch、Logstash和Kib…