分布式数据库学习--分布式并发控制-白红宇

分布式数据库学习--分布式并发控制

阅读量：368 次

发布时间：2019-03-05

本文共 1248 字，大约阅读时间需要 4 分钟。

并发控制理论在分布式计算领域是一项非常重要的内容。掌握了这方面的知识，相信大家在实际工作中会遇到许多实际的难题，而通过学习和实践，笔者最近对分布式数据库系统原理书中关于分布式并发控制的相关内容有了一定的理解，下面就从一些初步的学习和理解开始着手进行总结。

在日常的开发工作中，我们提到并发这个词，首先会联想到多线程。不过，需要指出的是，并发的概念并不仅仅局限于多线程操作。事实上，数据库中的事务更新也是一个典型的并发场景。那么，为什么我们需要引入并发控制机制呢？它的目标是什么？这些问题的答案就是：在大规模的并发操作环境下，如何保证数据的正确性和一致性。没有合适的控制机制，可能会出现操作顺序混乱、数据丢失等多种异常情况。

接下来，我们需要了解并发控制机制的具体分类。在传统的多线程编程中，最常见的控制方式有两种：悲观方式和乐观方式。悲观方式主要是基于锁的控制机制，包括粗粒度锁（Synchronized）和细粒度锁（ReadLock、WriteLock）。而乐观方式则是基于时间戳的加锁机制，通过在数据对象上加上时间戳，确保操作的有序性。

在并发控制理论体系中，对于并发控制机制的分类更加细致。主要可以分为悲观算法和乐观算法。悲观算法主要包括基于加锁和基于排序的方式，其中基于时间戳的加锁算法也可以看作是一种基于排序的方式。乐观算法则主要包括基于加锁和基于时间戳的方式。需要注意的是，这两种类型并不互斥，实际应用中往往会结合使用，以达到更高的并发控制效率。

基于加锁的并发控制算法通过锁机制来确保数据的互斥性。在这种机制中，每个涉及数据更新的操作都需要申请锁单元。一旦获得锁，说明你是当前对数据进行修改的唯一权利，其他操作必须等待当前操作完成，直到锁被释放。这种方式虽然能保证数据的一致性，但也存在效率上的问题，因为即使没有冲突的操作，也需要进行锁申请和等待操作。

而基于时间戳的并发控制算法则采用了另一种思路。它利用了时间戳的单调性和唯一性，通过为每个事务分配唯一的时间戳来确保操作的有序性。具体来说，TO（Timestamp Ordering）规则规定：对于两个事务Ti和Tk，如果Ti的时间戳小于Tk的时间戳，则Ti的事务操作优先于Tk的事务操作执行。调度程序会在每次提交新操作时，检查它与已有的冲突操作的时间戳关系。如果新操作属于较新的事务，就可以接受；否则，就会拒绝该操作，并为事务分配新的时间戳进行重启。

最后，我们来看看悲观算法和乐观算法在执行过程中的区别。悲观算法的执行流程一般是先进行有效性验证，然后再执行读、计算等操作，最后再进行写操作。而乐观算法则将有效性验证的操作移到了写操作之前，这样可以让读、计算等操作在读取数据时不需要进行锁等等待，而是在最后提交写操作时进行一次检查，确保数据的一致性。

总的来说，并发控制理论的学习是一个需要持续探索和实践的过程。通过对上述两种主要算法的理解，我们可以更好地在实际开发中选择适合的并发控制机制，以确保系统的高效运行和数据的一致性。

转载地址：http://aang.baihongyu.com/

你可能感兴趣的文章