來源:公眾號開源中國 作者 h4cd
Windows 操作系統本身是不開源的,但是近日微軟內核工程師 Axel Rietschin 發表了一篇博客,帶大家一窺了 Windows 10 內核的魅力。
Axel 介紹,Windows 10 與 Windows 8.x、7、Vista、XP、2000 和 NT 的代碼庫是相同的,其中每一代都在之前的基礎上進行重大的重構,并增加大量新功能,改進性能和硬件支持,此外還有安全性的提升,同時保持非常高的后向兼容性。
目前在 GitHub 上其實可以找到 Windows 內核研究的泄露副本,雖然這些代碼已經過時且很不完整,但它們還是具有很高的研究價值。
比如 wrk-v1.2/base/ntos/config 源碼實現了一個大名鼎鼎的內核組件配置管理器 Registry,也就是注冊表,它在內部稱被為 Cm。
其實 Axel 這個博客是在回答一個問題:“Windows 10 是由什么語言寫就的?”
他介紹,ntoskrnl.exe 內核大部分是使用 C 編寫的,在內核模式下運行的大多數內容也是用 C 編定的,包括文件系統、網絡與驅動程序等。其中也包含一些 C++ 代碼,而越靠近用戶模式、越接近新的源碼時,C 的使用變得越來越少,反之 C++ 變多。
具體看一下 Windows 10 “DVD” 的源碼,作者猜測其中 98% 由 C 和 C++ 寫就,而 C 占據大比例。
此外,.NET BCL 與一些相關庫和框架通常都是用 C# 編寫的,“但它們也只不過是帶有幾座 C++ 小島的 C 汪洋大海的一栗”,它們自不同的部門,代碼并不屬于 Windows 源碼樹。
作者驚呼:Windows 源碼的規模巨大,這是一個真正史詩般的巨型項目。
完整的源碼樹包含所有代碼,如上圖所示,測試代碼與一起構成“Windows 源碼”的所有內容加起來有超過 400 萬個文件、50 萬個文件夾、大小超過 0.5 TB,其中包含了構成 OS 工作站、服務器和所有版本的工具、相關開發工具包的每個組件的代碼。
源碼的規模有多恐怖呢?作者估計完全查看這些源碼的文件名,并試圖理解源碼具體是用來干什么的,需要花上一生的時間。
他還舉了一個例子:有一次,我離開了一個 Git 分支幾個星期,當我回來時,已經落在了將近 60 000 次 commit 之后。
注:本文轉載自微信號:iProgrammer
2013 年 10 月,我們在微博(@程序員的那些事 )發過一張信息圖《知名軟件系統代碼庫對比》。
信息圖中提到,Windows XP 和 Windows 7 操作系統的代碼量約 4 千萬行級別。
(信息圖部分截圖,完整版在這里:http://t.cn/EXMs07e )
Windows Vista 源碼體量約 5 千萬行。
所以,Windows 10 源碼體量至少在 5 千萬行咯。
Windows 操作系統是用什么編程語言開發的?
Windows 操作系統這么個量級的代碼庫,用了哪些/哪種編程語言,肯定有人好奇。
這不,就有人在 Quora 發帖問《開發 Windows 10 用了哪種編程語言?》
2019 年 3 月,微軟內核工程師 Axel Rietschin 在 Quora 上回復了這個帖子。
「程序員的那些事」摘編如下:
Axel 說,Windows 10 和 Windows 8.x、7、Vista、XP、2000 和 NT 有著相同的代碼庫,每一代操作系統都經歷了重大的重構,添加了大量的新特性,改進了性能、硬件支持和安全性,同時保持了非常高的向后兼容性。
內核(ntoskrnl.exe)大部分是用 C 語言編寫的。在 Github 可以找到 Windows Research Kernel 的泄露版。
有興趣的童鞋可以看看:github.com/markjandrews/wrk-v1.2
Axel 表示,雖然 WRK 代碼已經過時了,而且很大程度上還不完整,但那些代碼應該會給大家一些深刻的見解。
比如:wrk-v1.2/base/ntos/config 目錄下是大家熟知的注冊表(Registry)的源碼,這個內核組件就是配置管理器(configuration manager,CM)。
在內核模式下運行的大多數程序,也是用 C 語言編寫的(大多數文件系統、網絡、大多數驅動程序……),還有一些 C++。
至于 Window 10 是用什么編程語言寫的,Axel 認為是 C 和 C++,并且 C 占了絕大部分。
.NET BCL 和其他托管庫及框架通常都是用 C# 編寫的,來自不同的部門(開發者部門),并且也不屬于 Windows 源代碼樹。相比散落著 C++ 島嶼的 C 代碼海洋,C# 寫的代碼簡直就是滄海一粟。
Windows 真的真的真的真的真的很大
Axel 提示大家,大多數人沒有意識到 Windows 系統的龐大,真一個具有史詩規模的巨大項目。
Windows 的完整源代碼樹(包括全部代碼、測試代碼等)的大小超過 0.5 TB,涉及 56 多萬個文件夾,400 多萬個文件。
你可以花一年時間深入源代碼樹,鉆入到那些文件中。它們包括了所有組成 OS 工作站和服務器產品,及其所有版本,工具,相關的開發包。
然后你再讀文件名,看看里面有什么,它們是用來做什么的。想做完這些事,一個人(或兩個人)恐怕要窮盡一生咯。
有一次 Axel 離開 Git 分支幾周,他回來時發現落后了近 6 萬次提交。Axel 想有人會說,沒人可以每天把添加到 Windows 的所有代碼都看完,更不用說去讀過去 30 年來編寫的代碼了!