擊上方"walkingcloud"關注,并選擇"星標"公眾號
在上一篇文章【利用騰訊云主機+SSH遠程端口轉發實現內網穿透】中使用SecureCRT進行遠程端口轉發,但是轉發到云主機(外網)服務器后,發現從外網訪問連接轉發后的端口出現報錯,無法正常訪問
通過Google搜索相關問題,最終找到了問題的根因
(圖片可放大查看)
第一款:SecureCRT
SecureCRT 是一款支持ssh登錄網絡設備和服務器設備的終端仿真程序,支持 SSH1,SSH2,Telnet,RLogin,Serial,和 TAPI 等協議。
這款軟件基本每天都在用,每天都需要登錄到不同的網絡設備查看設備配置。第二款:Putty
putty 是一款支持Raw、telnet、rlogin、ssh、串口的連接軟件,該軟件完全免費、體積小、操作簡單、方便使用,它可以讓用戶對窗口進行自定義設置,
還可以將連接過的設備進行會話保存,方便用戶下次使用無需再次輸入ip地址和或主機名稱即可連接。
第三款:tftp
TFTP全稱是:Trivial File Transfer Protocol即簡單文件傳輸協議,是TCP/IP協議族中的一個用來在客戶機與服務器之間進行簡單文件傳輸的協議,
提供不復雜、開銷不大的文件傳輸服務。端口號為69。該軟件使用最多的場景就是對設備進行iOS升級時,時長會用到它,該軟件體積小、操作簡單。
第四款:子網掩碼計算器
該工具可自動劃分A、B、C類IP,可以輸出劃分后的子網掩碼、子網位、最多子網數、主機位、最多主機數以及所有的子網列表,并可以將結果保存到文本文件。
以上四款軟件是個人經常使用的。
【2018-12-20 二更】最近好多網友都提出沒有抓包軟件wireshark,今天就把抓包軟件wireshark添加上
第五種:抓包軟件WireShark
下圖是wireshark的軟件界面
主要功能:
Wireshark(前稱Ethereal)是一個網絡封包分析軟件。網絡封包分析軟件的功能是擷取網絡封包,并盡可能顯示出最為詳細的網絡封包資料。Wireshark使用WinPCAP作為接口,直接與網卡進行數據報文交換。
目的:
1.掌握 Wireshark 的使用方法,熟悉其基本設置,尤其是 Capture Filter 和 Display Filter的使用。
2.通過對 Wireshark 抓包實例進行分析,進一步加深對各類常用網絡協議的理解,如:TCP、UDP、IP、SMTP、POP、FTP、TLS 等。
3.查找資料,了解相關網絡協議的提出背景,幀格式,主要功能等。
4.根據所獲數據包的內容分析相關協議,從而加深對常用網絡協議理解。
接下來將分享個人的一些經驗,有不足之處還請各位指正。
網絡事件發生后,以快速排除故障、盡快恢復業務為最高目標。用戶報障、工程師巡檢或監控時發現網絡設備或線路故障時,網絡工程師應盡快根據事件現象進行故障定位。
故障定位后有應急預案的,按應急預案處理;沒有應急預案的,根據分析結果,由所屬團隊出具解決方案,經批準后按方案進行處理。
一、網絡故障排查思路
當故障發生時,遵循以下排查思路:
1、 首先盡可能準確收集故障信息:故障發生時間、故障現象、影響范圍。
了解故障表現出來的現象,然后才能確定可能產生這些現象的故障根源或癥結,對網絡故障做出完整、清晰的描述是第一步。
2、 根據用戶反映的故障現象,結合網管告警,判斷是個別終端故障還是同時影響多個用戶的網絡故障。
3、 根據網絡故障影響范圍,工程師根據經驗判斷最可能的原因,并進行驗證,如確實為該處故障,立即制定相應解決方法,如果不是,進行系統排障。
4、 系統性網絡排障有三種方法:按照OSI七層模型,有自上而下(應用層到物理層)、自下而上(物理層到應用層)和從中間層(網絡層)入手的排障方法。
5、 明顯屬于應用層故障的,如到DNS服務器網絡可達,但DNS無法解析或解析異常,可從應用層開始從上向下進行排查。
6、 對于明顯屬于物理層故障的,如網卡燈不亮、光模塊不發光、網管告警顯示相關網絡設備存在硬件告警的,可優先從物理層開始,從下至上進行排障。
7、 對于無法確定是物理層故障或應用層故障的,可以先從OSI七層模型的中間層-網絡層開始進行故障定位。
8、 源到目的業務端口不可達:如果業務系統訪問對端不通,可根據源目地址、TCP端口等信息,執行源到目地址和端口的聯通性測試:
從源地址telnet目的地址的TCP業務端口,看能否建立連接。如果無法建立連接,可以使用tracert檢查路由是否正確,定位出錯的網絡設備或網段,在該設備上檢查設備CPU、
內存利用率是否異常,設備日志是否有告警信息,路由協議是否正常,ARP信息是否正確,地址轉換是否正常,并發連接數是否正常,雙機是否正常,在路徑中所有防火墻上檢查安全策略是否開放。
9、 源到目的端口可達但傳輸速度慢:如果業務端口可達,但傳輸速度慢,使用ping大包(2000字節)和tracert檢查無規律丟包和明顯延遲的網絡位置,在該設備上檢查設備CPU、
內存利用率是否異常,設備日志是否有告警信息,路由協議和VRRP協議是否正常,地址轉換是否正常,并發連接數是否正常,
雙機是否正常,接口有無錯誤計數或專線帶寬是否擁塞,從網絡層往上或往下進行故障原因的分析。
10、 如果業務路徑經過專線,需判斷專線是否異常,點對點連通性丟包率超過萬分之五(注意QOS影響),接口輸入錯誤或CRC出現連續增長,則需要聯系運營商進行專線排查。
11、 如果連通性、設備性能、鏈路質量安全策略都沒有問題,則需要進一步對業務系統的負載均衡配置情況、業務系統本身情況、DNS解析情況進行分析和排查。
12、 對于疑難故障,則需要聯系業務部門獲取業務依賴關系,理清數據訪問路徑,通過流量分析工具進行進一步的原因分析。
下面列出一些常見的網絡故障及其處理方式:
二、故障處置
網絡方面常見故障及其處理方法:
1. 普通接入故障。了解用戶故障的相關信息,如用戶辦公地點、用戶準入系統認證是否通過、用戶終端是否進入正確的VLAN、能否正確獲取IP地址、用戶網線連接情況、用戶所接入交換機狀態或接入端口狀態等進行排查分析。找到故障原因后,進行相應的故障處理。
2. 網絡設備配置故障。根據用戶反饋的故障現象, 了解相關網絡結構或配置是否最近修改過,即問題出現是否與網絡變化有關,是否近期的變更造成,對相關變更方案和變更操作情況進行回溯和排查,對相關訪問策略、路由策略等配置情況進行排查,判斷故障是否因為設備配置原因造成。如是,按照ITIL流程提出變更申請,審批通過后進行配置變更。
3. 鏈路利用率過高。當網絡遭受攻擊或網絡內病毒爆發時,會出現帶寬利用率過高或設備CPU利用率過高等異常現象。此時應通知安全工程師通過安全監控平臺檢查網絡內是否存在網絡攻擊,同時登陸相關的網絡設備,實時分析是否有異常流量,如存在異常流量通知相關團隊進行處理,必要時可以通過斷開網絡端口或使用ACL的方式對該問題主機實施斷網。
4. 設備性能異常。在網絡設備遭受攻擊或網絡內存在環路的情況下會出現此類性能異常。此時應通知安全工程師通過安全監控平臺檢查網絡內是否存在網絡攻擊,同時登陸相關的網絡設備,分析設備性能異常原因,對故障源進行定位,對攻擊主機進行上報,通知相關團隊進行處理,必要時通過關閉網絡端口或斷開的方式對該問題主機或環路端口實施斷網,對引起廣播風暴的接口進行關閉。
5. 設備軟件故障。對設備軟件BUG引起的故障,提出臨時解決方案,根據臨時解決方案,經審批后作為臨時應急措施實施。現場工程師收集故障信息并記錄后,向設備廠商開CASE,和廠商共同分析故障。根據廠商推薦的軟件更新版本,按照ITIL流程進行版本升級。
6. 設備硬件故障。判斷為硬件故障的,收集故障信息,如有備件,使用存放在備件庫房的備件進行故障部件的更換,將配置恢復至新的設備中。對故障信息進行記錄,向設備廠商開 case 進行硬件的更換。
7. 廣域網線路故障。發現故障后由負責工程師即刻向運營商進行線路故障申告,配合運營商進行故障線路的分析處理。當一條線路發生故障時,該線路上承載的業務會自動迂回到其他線路上。但是當該線路不停翻轉(端口持續up/down)時,會對業務造成影響,這時應首先關閉該線路端口或斷開該線路的BGP連接,使該線路不再承載流量,然后向運營商進行故障申告,配合運營商進行故障排查,待線路恢復后重新啟用該線路。
8. Internet出口線路流量異常。當Internet出口線路受到DDOS攻擊時,會造成線路流量擁塞而無法訪問internet。網銀線路已購買運營商的防DDOS攻擊服務,應立即通知運營商進行流量清洗。辦公互聯網線路未購買防DDOS攻擊服務,情況嚴重時應考慮關閉該條線路到internet的連接。
9. 雙機故障:查看雙機熱備狀態、查看配置同步狀態,查看物理鏈路,檢查相關配置,如配置正確但主設備異常或出現雙活時,可以在收集完成相關信息后,在行方批準后把應用切換到備機或把主設備重啟或把主設備從網絡隔離。
10. 其他故障。對于非配置引起的無法確定的故障,現場工程師收集故障信息并記錄后,即刻向設備廠商開CASE,和廠商共同分析故障,根據廠商提供的解決方案,按照ITIL流程進行配置變更。
感謝大家的閱讀。若您有其他問題在評論區留言,喜歡的朋友請多多關注轉發支持一下。
曾經我最對口的職業就是網絡工程師、運維工程師之類,并且有一些從事網絡運維工作的小伙伴,因此最這方面比較了解。我覺得運維需要會的應該不僅僅是軟件,范圍應該擴大,包括一些程序之類。
運維需要會什么軟件呢?
1.Nginx、Apache、Tomcat等,很多時候需要運維人員搭建開發環境并進行優化,不過對這些操作一般都需要寫命令。
2.MySQL、SQL server、Oracle、mangodb、redis等數據庫的搭建、優化、維護肯定是必不可少的。
3.LVS(Linux虛擬服務器),可能有的公司要采取LVS實現負載均衡。,
4.Jenkins(持續集成引擎),最近多次看到有運維小伙伴提到這個,用于監控持續重復的工作,聽說非常重要,但也難學。
5.OpenStack云計算管理平臺,我搭建過類似的CloudStack平臺,不顧在最后分配服務器一直搞不定,這個搭建及操作還是比較麻煩的,不過同上面,也非常重要。
6.zabbix是一個基于WEB界面的提供分布式系統監視以及網絡監視功能的企業級的開源解決方案。一般公司里都會用到這個,不過我跟我小伙伴聊過,搭建熟悉使用一個多周即可上手,當然系統監控的軟件不僅僅只有這個。
7.SVN、Git版本控制需要會,不過現在似乎git用的比較多,當然我現在是在用Git。
8.docker、elasticsearch、Kubernetes(k8s)、VMware vSphere等虛擬化的知識,虛擬化還是比較熱的。
9.SaltSack等自動化運維工具,自動化運維是運維進階的方向,當然自動化運維還要會寫腳本。
運維還應該掌握什么呢?
1.Linux、unix、win server等各種服務器系統必須熟練掌握,不過linux各個版本用的比較多,我比較喜歡CentOs。
2.python、shell等腳本語言,現在運維不僅僅是需要寫命令,而且要求會編程,我看python已經成為運維工程師招聘的必要條件。
網維工程師可以說是現在最復雜的一個工程師了,隨著網絡的發展,也顯得格外重要,這樣一來,他所需要學習的內容真的很多。
首先是比較基礎的一些軟件,比如說Apache Tomcat等
這類的軟件主要適用于網絡環境的開發,優化,可以說是進行網維的一個前提了。所以,首先要會的就是這個類型的,雖然很基礎,但是很重要。
第二種就應該是類似于SQL這個類型的
用于網絡的維護與數據庫的建立。這類軟件也是身為一個網維工程師必須要掌握的一項技能,可以說只要踏足網維這個工作圈,這類軟件可以說是每天都會打交道了。
第三種就是zabbix類型的軟件
這是一種基于系統監視的軟件。也可以用于網絡監視功能,這種類型的軟件運用很廣泛,但是卻比較容易上手,一般來說學一段時間就可以輕松入門,所以,網維的工程師如果不覺得麻煩的話可以用這類型的軟件入手。
剩下的還有很多,比如Unix shell等,都是網維工程師必備的一項技能,但是一般來說一個類型的會一個就可以了。所以,雖然很難,但是需要學習的也不多,只要投入一定的時間,就一定會有回報的。