什么是MVCC?
MVCC,全稱Multi-Version Concurrency Control,即多版本并發(fā)控制。MVCC是一種并發(fā)控制的方法,一般在數(shù)據(jù)庫(kù)管理系統(tǒng)中,實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的并發(fā)訪問(wèn),在編程語(yǔ)言中實(shí)現(xiàn)事務(wù)內(nèi)存。 在Mysql的InnoDB引擎中就是指在已提交讀(READ COMMITTD)和可重復(fù)讀(REPEATABLE READ)這兩種隔離級(jí)別下的事務(wù)對(duì)于SELECT操作會(huì)訪問(wèn)版本鏈中的記錄的過(guò)程。 這就使得別的事務(wù)可以修改這條記錄,反正每次修改都會(huì)在版本鏈中記錄。SELECT可以去版本鏈中拿記錄,這就實(shí)現(xiàn)了讀-寫(xiě),寫(xiě)-讀的并發(fā)執(zhí)行,提升了系統(tǒng)的性能。
MySQL的InnoDB引擎實(shí)現(xiàn)MVCC的3個(gè)基礎(chǔ)點(diǎn)
1.隱式字段
如上圖,DB_ROW_ID是數(shù)據(jù)庫(kù)默認(rèn)為該行記錄生成的唯一隱式主鍵;DB_TRX_ID是當(dāng)前操作該記錄的事務(wù)ID; 而DB_ROLL_PTR是一個(gè)回滾指針,用于配合undo日志,指向上一個(gè)舊版本;delete flag沒(méi)有展示出來(lái)。
2.undo log
從上面,我們就可以看出,不同事務(wù)或者相同事務(wù)的對(duì)同一記錄的修改,會(huì)導(dǎo)致該記錄的undo log成為一條記錄版本線性表,既鏈表,undo log的鏈?zhǔn)拙褪亲钚碌呐f記錄,鏈尾就是最早的舊記錄
3.ReadView
已提交讀和可重復(fù)讀的區(qū)別就在于它們生成ReadView的策略不同。
ReadView中主要就是有個(gè)列表來(lái)存儲(chǔ)我們系統(tǒng)中當(dāng)前活躍著的讀寫(xiě)事務(wù),也就是begin了還未提交的事務(wù)。通過(guò)這個(gè)列表來(lái)判斷記錄的某個(gè)版本是否對(duì)當(dāng)前事務(wù)可見(jiàn)。假設(shè)當(dāng)前列表里的事務(wù)id為[80,100]。
a) 如果你要訪問(wèn)的記錄版本的事務(wù)id為50,比當(dāng)前列表最小的id80小,那說(shuō)明這個(gè)事務(wù)在之前就提交了,所以對(duì)當(dāng)前活動(dòng)的事務(wù)來(lái)說(shuō)是可訪問(wèn)的。
b) 如果你要訪問(wèn)的記錄版本的事務(wù)id為90,發(fā)現(xiàn)此事務(wù)在列表id最大值和最小值之間,那就再判斷一下是否在列表內(nèi),如果在那就說(shuō)明此事務(wù)還未提交,所以版本不能被訪問(wèn)。如果不在那說(shuō)明事務(wù)已經(jīng)提交,所以版本可以被訪問(wèn)。
c) 如果你要訪問(wèn)的記錄版本的事務(wù)id為110,那比事務(wù)列表最大id100都大,那說(shuō)明這個(gè)版本是在ReadView生成之后才發(fā)生的,所以不能被訪問(wèn)。
這些記錄都是去undo log 鏈里面找的,先找最近記錄,如果最近這一條記錄事務(wù)id不符合條件,不可見(jiàn)的話,再去找上一個(gè)版本再比較當(dāng)前事務(wù)的id和這個(gè)版本事務(wù)id看能不能訪問(wèn),以此類推直到返回可見(jiàn)的版本或者結(jié)束。
舉個(gè)例子 ,在已提交讀隔離級(jí)別下:
比如此時(shí)有一個(gè)事務(wù)id為100的事務(wù),修改了name,使得的name等于小明2,但是事務(wù)還沒(méi)提交。則此時(shí)的版本鏈?zhǔn)?/p>
那此時(shí)另一個(gè)事務(wù)發(fā)起了select 語(yǔ)句要查詢id為1的記錄,那此時(shí)生成的ReadView 列表只有[100]。那就去版本鏈去找了,首先肯定找最近的一條,發(fā)現(xiàn)trx_id是100,也就是name為小明2的那條記錄,發(fā)現(xiàn)在列表內(nèi),所以不能訪問(wèn)。
這時(shí)候就通過(guò)指針繼續(xù)找下一條,name為小明1的記錄,發(fā)現(xiàn)trx_id是60,小于列表中的最小id,所以可以訪問(wèn),直接訪問(wèn)結(jié)果為小明1。
那這時(shí)候我們把事務(wù)id為100的事務(wù)提交了,并且新建了一個(gè)事務(wù)id為110也修改id為1的記錄,并且不提交事務(wù)
這時(shí)候版本鏈就是
這時(shí)候之前那個(gè)select事務(wù)又執(zhí)行了一次查詢,要查詢id為1的記錄。
已提交讀隔離級(jí)別下的事務(wù)在每次查詢的開(kāi)始都會(huì)生成一個(gè)獨(dú)立的ReadView,而可重復(fù)讀隔離級(jí)別則在第一次讀的時(shí)候生成一個(gè)ReadView,之后的讀都復(fù)用之前的ReadView。
1.如果你是已提交讀隔離級(jí)別,這時(shí)候你會(huì)重新一個(gè)ReadView,那你的活動(dòng)事務(wù)列表中的值就變了,變成了[110]。按照上的說(shuō)法,你去版本鏈通過(guò)trx_id對(duì)比查找到合適的結(jié)果就是小明2。
2.如果你是可重復(fù)讀隔離級(jí)別,這時(shí)候你的ReadView還是第一次select時(shí)候生成的ReadView,也就是列表的值還是[100]。所以select的結(jié)果是小明1。所以第二次select結(jié)果和第一次一樣,所以叫可重復(fù)讀!
這就是Mysql的MVCC,通過(guò)版本鏈,實(shí)現(xiàn)多版本,可并發(fā)讀-寫(xiě),寫(xiě)-讀。通過(guò)ReadView生成策略的不同實(shí)現(xiàn)不同的隔離級(jí)別。