領(lǐng)測軟件測試網(wǎng)
很多的時侯,做 DBA的我們,當應(yīng)用管理員向我們通告現(xiàn)在應(yīng)用很慢、數(shù)據(jù)庫很慢的時侯,我們到數(shù)據(jù)庫時做幾個示例的也發(fā)現(xiàn)同樣的問題時,有些時侯我們會無從下手,因為我們認為數(shù)據(jù)庫的各種命種率都是滿足文檔的建議。實際上如今的優(yōu)化己經(jīng)向優(yōu)化等待(waits)轉(zhuǎn)型了,實際中性能優(yōu)化最根本的出現(xiàn)點也都集中在IO,這是影響性能最主要的方面,由系統(tǒng)中的等待去發(fā)現(xiàn)庫中的不足、操作系統(tǒng)某些資源利用的不合理是一個比較好的辦法,下面把我的一點實踐經(jīng)驗與大家分享一下,本文測重于Unix環(huán)境。
一、通過操作系統(tǒng)的一些工具檢查系統(tǒng)的狀態(tài),比如CPU、內(nèi)存、交換、磁盤的利用率,根據(jù)經(jīng)驗或與系統(tǒng)正常時的狀態(tài)相比對,有時系統(tǒng)表面上看起來看空閑這也可能不是一個正常的狀態(tài),因為cpu可能正等待IO的完成。除此之外我們還應(yīng)觀注那些占用系統(tǒng)資源(cpu、內(nèi)存)的進程。
1、如何檢查操作系統(tǒng)是否存在IO的問題?使用的工具有sar,這是一個比較通用的工具。
Rp1#sar -u 2 10
即每隔2秒檢察一次,共執(zhí)行20次,當然這些都由你決定了。
示例返回:
HP-UX hpn2 B.11.00 U 9000/800 08/05/0318:26:32 %usr %sys %wio %idle
注:我在下查看是這種結(jié)果,不知%就是所謂的%wio。
Linux 2.4.21-20.ELsmp (YY075) 05/19/:36:07 AM CPU %user %nice % %:36:09 AM all 0.00 0.00 0.13 99.8710:36:11 AM all 0.00 0.00 0.00 100.0010:36:13 AM all 0.25 0.00 0.25 99.4910:36:15 AM all 0.13 0.00 0.13 99.7510:36:17 AM all 0.00 0.00 0.00 100.0010:36:17 AM CPU %user %nice % %:36:19 AM all 0.00 0.00 0.00 100.0010:36:21 AM all 0.00 0.00 0.00 100.0010:36:23 AM all 0.00 0.00 0.00 100.0010:36:25 AM all 0.00 0.00 0.00 100.00
其中的%usr指的是用戶進程使用的cpu資源的百分比,%sys指的是系統(tǒng)資源使用cpu資源的百分比,%wio指的是等待io完成的百分比,這是值得我們觀注的一項,%idle即空閑的百分比。如果wio列的值很大,如在35%以上,說明你的系統(tǒng)的IO存在瓶頸,你的CPU花費了很大的時間去等待IO的完成。Idle很小說明系統(tǒng)CPU很忙。像我的這個示例,可以看到wio平均值為11說明io沒什么特別的問題,而我的idle值為零,說明我的cpu已經(jīng)滿負荷運行了。
當你的系統(tǒng)存在IO的問題,可以從以下幾個方面解決:
*聯(lián)系相應(yīng)的操作系統(tǒng)的技術(shù)支持對這方面進行優(yōu)化,比如hp-ux在劃定卷組時的條帶化等方面。
*查找中不合理的sql語句,對其進行優(yōu)。
*對中訪問量頻繁的表除合理建索引外,再就是把這些表分表空間存放以免訪問上產(chǎn)生熱點,再有就是對表合理分區(qū)。
常用的工具便是,對于hp-unix來說可以用,Aix來說可以用topas,當你發(fā)現(xiàn)中pi列非零,中的free列的值很小,,topas中內(nèi)存的利用率多于80%時,這時說明你的內(nèi)存方面應(yīng)該調(diào)節(jié)一下了oracle dba手記3:數(shù)據(jù)庫性能優(yōu)化與內(nèi)部原理解析,方法大體有以下幾項。
*劃給使用的內(nèi)存不要超過系統(tǒng)內(nèi)存的1/2,一般保在系統(tǒng)內(nèi)存的40%為益。
*為系統(tǒng)增加內(nèi)存。
*如果你的連接特別多,可以使用MTS的方式。
*打全補丁,防止內(nèi)存漏洞。
3、如何找到點用系用資源特別大的的及其執(zhí)行的語句。
Hp-unix可以用,top,IBM AIX可以用topas,此外可以使用ps的命令。通過這些程序我們可以找到點用系統(tǒng)資源特別大的這些進程的進程號,我們就可以通過以下的sql語句發(fā)現(xiàn)這個pid正在執(zhí)行哪個sql,這個sql最好在pl/sql ,toad等軟件中執(zhí)行, 把中的spid換成你的spid就可以了。
a.,a.,a.,a.sid,a.#,a.,c.piece,c. from v$ a,v$ b,v$ c WHERE b.spid='ORCL' AND b.addr=a.paddr AND a.=c.(+)order BY c.piece
我們就可以把得到的這個sql分析一下,看一下它的執(zhí)行計劃是否走索引,對其優(yōu)化避免全表掃描,以減少IO等待,從而加快語句的執(zhí)行速度。
提示:我在做優(yōu)化sql時,經(jīng)常碰到使用in的語句,這時我們一定要用把它給換掉,因為在處理In時是按Or的方式做的,即使使用了索引也會很慢。
比如:
col1,col2,col3 FROM a.col1 not in ( col1 FROM )
可以換成:
col1,col2,col3 FROM not ( 'x' FROM a.col1=b.col1)
4、另一個有用的腳本:查找前十條性能差的sql。
* FROM ( ,,SORTS,,, FROM v$ BY DESC )where
二、迅速發(fā)現(xiàn) 的性能問題的成因,我們可以求助于v$這個視圖,看系統(tǒng)的這些在等什么,使用了多少的IO。以下是我提供的參考腳本:
腳本說明:查看占io較大的正在運行的。
se.sid,se.#,pr.SPID,se.,se.,se.,se.,se.,、se.,st.event,st.,si.,si. FROM v$ se,v$ st,v$ si,v$ pr WHERE st.sid=se.sid AND st.sid=si.sid AND se.PADDR=pr.ADDR AND se.sid>6 AND st.=0 AND st.event NOT LIKE '%SQL%' ORDER BY DESC
對檢索出的結(jié)果的幾點說明:
1、我是按每個正在等待的已經(jīng)發(fā)生的物理讀排的序,因為它與實際的IO相關(guān)。
2、你可以看一下這些等待的進程都在忙什么,語句是否合理?
from v$ where sid=; * from v$ where =;
執(zhí)行以上兩個語句便可以得到這個的語句。你也以用alter kill 'sid,#';把這個殺掉。
3、應(yīng)觀注一下event這列,這是我們調(diào)優(yōu)的關(guān)鍵一列,下面對常出現(xiàn)的event做以簡要的說明:
a、 busy waits,free waits這兩個參數(shù)所標識是dbwr是否夠用的問題,與IO很大相關(guān)的,當v$中的free wait的條目很小或沒有的時侯,說明你的系統(tǒng)的dbwr進程決對夠用,不用調(diào)整;free wait的條目很多,你的系統(tǒng)感覺起來一定很慢,這時說明你的dbwr已經(jīng)不夠用了,它產(chǎn)生的wio已經(jīng)成為你的數(shù)據(jù)庫性能的瓶頸,這時的解決辦法如下:
a.1增加寫進程,同時要調(diào)整參數(shù)。
示例:修改或添加如下兩個參數(shù)
=s=8
a、2開異步IO,IBM這方面簡單得多,hp則麻煩一些,可以與Hp工程師聯(lián)系。
b、db file read,指的是順序讀oracle dba手記3:數(shù)據(jù)庫性能優(yōu)化與內(nèi)部原理解析,即全表掃描,這也是我們應(yīng)該盡量減少的部分,解決方法就是使用索引、sql調(diào)優(yōu),同時可以增大這個參數(shù)。
c、db file read,這個參數(shù)指的是通過索引來讀取,同樣可以通過增加這個參數(shù)來提高性能。
d、latch free,與栓相關(guān)的了,需要專門調(diào)節(jié)。
e、其他參數(shù)可以不特別觀注。
其他的優(yōu)化手段似乎主要集中在SQL查詢語句上面,本身也提供了優(yōu)化器??磥鞤BA的學問不少啊。
論壇精華帖