lash Attention
Flash-attn(Flash Attention),作為一種用于神經網絡模型的注意力機制,在處理序列數據時有顯著的優勢,可以提高計算效率并減少內存使用,特別是Transformer模型。它通過優化數據布局和計算流程,降低了注意力計算的內存訪問開銷,在本地部署大模型可以減輕GPU的開銷,加快推理速度。項目地址 :https://github.com/Dao-AILab/flash-attention
然而,官方發布的版本只支持linux,沒有windows包,如果要在windows下安裝,要么使用docker,要么自己編譯,而自己編譯耗時很長,而且也會遇到各種問題。這里我使用的是Brian Dashore編譯好的whl. 下載地址:https://github.com/bdashore3/flash-attention/releases
要注意選擇對應的版本,首先查看自己的cuda版本,在CMD 里輸入:nvcc --version
查看cuda版本
我的本地環境如下:
系統 windows10 ,python版本11,cuda版本12.1
下載對應的版本為:flash_attn-2.5.9.post1+cu122torch2.3.1cxx11abiFALSE-cp311-cp311-win_amd64.whl
flash-attn版本
下載到本地后執行,pip安裝:
pip install d:\downloads\flash_attn-2.5.9.post1+cu122torch2.3.1cxx11abiFALSE-cp311-cp311-win_amd64.whl
注意:安裝完成后,如果你以前已經安裝過PyTorch,需要重新安裝一遍,否則運行會報錯。
打開網址https://pytorch.org/get-started/locally/ 選擇對應的版本
安裝pytorch
根據pytorch.org給出的提示命令,在本地執行安裝:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
安裝完成,寫一個簡單的腳本檢驗一下。
test.py
import flash_attn
print(flash_attn.__version__)
運行結果如果正確輸出版本號,則表示安裝成功。
檢驗flash_attn版本
IT之家 10 月 28 日消息 微軟剛剛在其更新目錄上發布了一個新的 Windows 10 更新,可以下載并手動安裝,以刪除遺留的垃圾——Adobe Flash Player,其已經成為 Windows 操作系統的一部分超過十年了。
Adobe 已經確認,將在 2020 年 12 月底前結束對其 Flash Player 的支持。此外,Adobe 還計劃停止其 Flash Player 插件,目前微軟 Edge、Chrome 等瀏覽器中都包含了該插件。
微軟目前已經通過更新目錄公布了 Windows 10 KB4577586,但似乎至少在 2021 年之前,用戶無法從 Windows 更新設置中下載和安裝這一更新。
這個補丁的標題是 “刪除 Adobe Flash Player 的更新。2020 年 10 月 27 日”,目前適用于以下版本的 Windows 10。
版本 1909,也就是 2019 年 11 月更新。
版本 1903 ,也稱為 2019 年 5 月更新。
版本 1809 、1803 及更老版本。
要下載和安裝從 Windows 中刪除 Flash Player 的更新,只需按照以下步驟進行。
前往微軟的更新目錄
在搜索框中搜索 'KB4577586'。
單擊您使用的 Windows 版本旁邊的 "下載" 按鈕。
如果你的 Windows 版本沒有列出,請稍后再檢查。
雙擊 . msu 文件。
當被問及時,請重新啟動您的計算機。
安裝 Windows 10 KB4577586 后將自動從 Windows 10 中刪除 Adobe Flash Player。安裝后將無法刪除更新,也無法在控制面板中找到與 Flash Player 相關的任何設置。
根據 Flash Player 的原始公告,微軟將在 2021 年上半年開始通過 Windows Update 向用戶推送該更新。
IT之家了解到,如果安裝了 KB4577586,你想再次使用 Flash Player,你需要重新安裝或重置 Windows 10,或者將設備還原到早期的還原點。