如果想看自己的數(shù)據(jù)庫默認(rèn)使用的那個存儲引擎,可以通過使用命令:
SHOW VARIABLES LIKE 'storage_engine';
一、存儲引擎
1.是事務(wù)型數(shù)據(jù)庫的首選引擎
支持事務(wù)安全表(ACID)
事務(wù)的ACID屬性:即原子性、一致性、隔離性、持久性
a.原子性:原子性也就是說這組語句要么全部執(zhí)行,要么全部不執(zhí)行,如果事務(wù)執(zhí)行到一半出現(xiàn)錯誤,數(shù)據(jù)庫就要回滾到事務(wù)開始執(zhí)行的地方。
實現(xiàn):主要是基于MySQ日志系統(tǒng)的redo和undo機(jī)制。事務(wù)是一組SQL語句,里面有選擇,查詢、刪除等功能。每條語句執(zhí)行會有一個節(jié)點。例如,刪除語句執(zhí)行后,在事務(wù)中有個記錄保存下來,這個記錄中儲存了我們什么時候做了什么事。如果出錯了,就會回滾到原來的位置,redo里面已經(jīng)存儲了我做過什么事了,然后逆向執(zhí)行一遍就可以了。
b.一致性:事務(wù)開始前和結(jié)束后,數(shù)據(jù)庫的完整性約束沒有被破壞。(eg:比如A向B轉(zhuǎn)賬,不可能A扣了錢,B卻沒有收到)
c.隔離性:同一時間,只允許一個事務(wù)請求同一數(shù)據(jù),不同的事務(wù)之間彼此沒有任何干擾;
如果不考慮隔離性則會出現(xiàn)幾個問題:
i、臟讀:是指在一個事務(wù)處理過程里讀取了另一個未提交的事務(wù)中的數(shù)據(jù)(當(dāng)一個事務(wù)正在多次修改某個數(shù)據(jù),而在這個事務(wù)中這多次的修改都還未提交,這時一個并發(fā)的事務(wù)來訪問該數(shù)據(jù),就會造成兩個事務(wù)得到的數(shù)據(jù)不一致);(讀取了另一個事務(wù)未提交的臟數(shù)據(jù))
ii、不可重復(fù)讀:在對于數(shù)據(jù)庫中的某個數(shù)據(jù)php讀取數(shù)據(jù)庫新聞列表分頁 帶添加修改刪除,一個事務(wù)范圍內(nèi)多次查詢卻返回了不同的數(shù)據(jù)值,這是由于在查詢間隔,被另一個事務(wù)修改并提交了;(讀取了前一個事務(wù)提交的數(shù)據(jù),查詢的都是同一個數(shù)據(jù)項)
iii、虛讀(幻讀):是事務(wù)非獨立執(zhí)行時發(fā)生的一種現(xiàn)象(eg:事務(wù)T1對一個表中所有的行的某個數(shù)據(jù)項做了從“1”修改為“2”的操作,這時事務(wù)T2又對這個表中插入了一行數(shù)據(jù)項,而這個數(shù)據(jù)項的數(shù)值還是為“1”并且提交給數(shù)據(jù)庫。而操作事務(wù)T1的用戶如果再查看剛剛修改的數(shù)據(jù),會發(fā)現(xiàn)還有一行沒有修改,其實這行是從事務(wù)T2中添加的,就好像產(chǎn)生幻覺一樣);(讀取了前一個事務(wù)提交的數(shù)據(jù),針對一批數(shù)據(jù)整體)
d.持久性:事務(wù)完成后,事務(wù)對數(shù)據(jù)庫的所有更新將被保存到數(shù)據(jù)庫,不能回滾
2.是mySQL默認(rèn)的存儲引擎
默認(rèn)的隔離級別是RR,并且在RR的隔離級別下更近一步,通過多版本并發(fā)控制(MVCC)解決不可重復(fù)讀問題,加上間隙鎖(也就是并發(fā)控制)解決幻讀問題。因此的RR隔離級別其實實現(xiàn)了串行化級別的效果,而保留了比較好的并發(fā)性能。
MySQL數(shù)據(jù)庫為我們提供的四種隔離級別:
a、(串行化):可避免臟讀、不可重復(fù)讀、幻讀的發(fā)生;
b、 read(可重復(fù)讀):可避免臟讀、不可重復(fù)讀的發(fā)生;
c、Read (讀已提交):可避免臟讀的發(fā)生;
d、Read (讀未提交):最低級別,任何情況都無法保證;
從a----d隔離級別由高到低,級別越高,執(zhí)行效率越低
3.支持行級鎖。
行級鎖可以最大程度的支持并發(fā),行級鎖是由存儲引擎層實現(xiàn)的。
鎖:鎖的主要作用是管理共享資源的并發(fā)訪問,用于實現(xiàn)事務(wù)的隔離性
類型:共享鎖(讀鎖)、獨占鎖(寫鎖)
MySQL鎖的力度:表級鎖(開銷小、并發(fā)性低),通常在服務(wù)器層實現(xiàn)
行級鎖(開銷大、并發(fā)性高)php讀取數(shù)據(jù)庫新聞列表分頁 帶添加修改刪除,只會在存儲引擎層面進(jìn)行實現(xiàn)
4、是為處理巨大數(shù)據(jù)量的最大性能設(shè)計。
它的CPU效率可能是任何基于磁盤的關(guān)系型數(shù)據(jù)庫引擎所不能匹敵的
5、存儲引擎完全與MySQL服務(wù)器整合
存儲引擎為在主內(nèi)存中緩存數(shù)據(jù)和索引而維持它自己的緩沖池。將它的表和索引在一個邏輯表空間中,表空間可以包含數(shù)個文件(或原始磁盤文件);
6、支持外鍵完整性約束
存儲表中的數(shù)據(jù)時,每張表的存儲都按照主鍵順序存放,如果沒有顯示在表定義時指定主鍵。會為每一行生成一個6字節(jié)的ROWID,并以此作為主鍵
7、被用在眾多需要高性能的大型數(shù)據(jù)庫站點上
8、中不保存表的行數(shù)(eg: count(*)from table時,需要掃描一遍整個表來計算有多少行);清空整個表時,是一行一行的刪除,效率非常慢;
不創(chuàng)建目錄,使用時,MySQL將在MySQL數(shù)據(jù)目錄下創(chuàng)建一個名為的10MB大小的自動擴(kuò)展數(shù)據(jù)文件,以及兩個名為和的5MB大小的日志文件
二、引擎的底層實現(xiàn)
的存儲文件有兩個,后綴名分別是 .frm和 .idb;其中 .frm是表的定義文件, .idb是表的數(shù)據(jù)文件。
1、引擎采用B+Tree結(jié)構(gòu)來作為索引結(jié)構(gòu)
B-Tree(平衡多路查找樹):為磁盤等外存儲設(shè)備設(shè)計的一種平衡查找樹
系統(tǒng)從磁盤讀取數(shù)據(jù)到內(nèi)存時是以磁盤塊位基本單位的,位于同一磁盤塊中的數(shù)據(jù)會被一次性讀取出來,而不是按需讀取。
存儲引擎使用頁作為數(shù)據(jù)讀取單位,頁是其磁盤管理的最小單位,默認(rèn)page大小是16k.
系統(tǒng)的一個磁盤塊的存儲空間往往沒有那么大,因此每次申請磁盤空間時都會是若干地址連續(xù)磁盤塊來達(dá)到頁的大小16KB。
在把磁盤數(shù)據(jù)讀入到磁盤時會以頁為基本單位,在查詢數(shù)據(jù)時,如果一個頁中的每條數(shù)據(jù)都能助于定位數(shù)據(jù)記錄的位置,這將會減少磁盤I/O的次數(shù),提高查詢效率。
B-Tree結(jié)構(gòu)的數(shù)據(jù)可以讓系統(tǒng)高效的找到數(shù)據(jù)所在的磁盤塊
B-Tree中的每個節(jié)點根據(jù)實際情況可以包含大量的關(guān)鍵字信息和分支,例
每個節(jié)點占用一個盤塊的磁盤空間,一個節(jié)點上有兩個升序排序的關(guān)鍵字和三個指向子樹根節(jié)點的指針,指針存儲的是子節(jié)點所在磁盤塊的地址。
以根節(jié)點為例,關(guān)鍵字為17和35,P1指針指向的子樹的數(shù)據(jù)范圍小于17,P2指針指向的子樹的數(shù)據(jù)范圍為17----35,P3指針指向的子樹的數(shù)據(jù)范圍大于35;
模擬查找關(guān)鍵字29的過程:
a.根據(jù)根節(jié)點找到磁盤塊1,讀入內(nèi)存。【磁盤I/O操作第一次】
b.比較關(guān)鍵字29在區(qū)間(17,35),找到磁盤塊1的指針P2;
c.根據(jù)P2指針找到磁盤塊3,讀入內(nèi)存。【磁盤I/O操作第二次】
d.比較關(guān)鍵字29在區(qū)間(26,30),找到磁盤塊3的指針P2;
e.根據(jù)P2指針找到磁盤塊8,讀入內(nèi)存。【磁盤I/O操作第三次】
f.在磁盤塊8中的關(guān)鍵字列表中找到關(guān)鍵字29.
MySQL的存儲引擎在設(shè)計時是將根節(jié)點常駐內(nèi)存的,因此力求達(dá)到樹的深度不超過3,也就是I/O不需要超過三次;
分析上面的結(jié)果,發(fā)現(xiàn)需要三次磁盤I/O操作,和三次內(nèi)存查找操作。由于內(nèi)存中的關(guān)鍵字是一個有序表結(jié)構(gòu),可以利用二分法查找提高效率;而三次磁盤I/O操作時影響整個B-Tree查找效率的決定因素。
B+Tree
B+Tree是在B-Tree基礎(chǔ)上的一種優(yōu)化,使其更適合實現(xiàn)外存儲索引結(jié)構(gòu),B-Tree中每個節(jié)點中有key,也有data,而每一頁的存儲空間是有限的,如果data數(shù)據(jù)較大時將會導(dǎo)致每個節(jié)點(即一個頁)能存儲的key的數(shù)量很小。當(dāng)存儲的數(shù)據(jù)量很大時同樣會導(dǎo)致B-Tree的深度較大,增大查詢時的磁盤I/O次數(shù),進(jìn)而影響查詢效率。
在B+Tree中所有數(shù)據(jù)記錄節(jié)點都是按照鍵值大小順序存放在同一層的葉子節(jié)點上,而非葉子節(jié)點上只存儲key值信息,這樣可以大大加大每個節(jié)點存儲的key值數(shù)量,降低B+Tree的高度;
通常在B+Tree上有兩個頭指針,一個指向根節(jié)點,另一個指向關(guān)鍵字最小的葉子節(jié)點,而且所有葉子節(jié)點(即數(shù)據(jù)節(jié)點)之間是一種鏈?zhǔn)江h(huán)結(jié)構(gòu)。
因此可以對B+Tree進(jìn)行兩種查找運算,一種是對于主鍵的范圍查找和分頁查找,另一種是從根節(jié)點開始,進(jìn)行隨機(jī)查找。
中的B+Tree
是以ID為索引的數(shù)據(jù)存儲
采用引擎的數(shù)據(jù)存儲文件有兩個,一個定義文件,一個是數(shù)據(jù)文件。
通過B+Tree結(jié)構(gòu)對ID建索引,然后在葉子節(jié)點中存儲記錄
若建立索引的字段不是主鍵ID,則對該字段建索引,然后在葉子節(jié)點中存儲的是該記錄的主鍵,然后通過主鍵索引找到對應(yīng)記錄。