段時間Facebook 發布了超強的文本轉音樂工具audiocraft,上線不到一個月在GitHub上就收獲了8.2k個星星,號稱是目前最強的文本轉音樂工具,GitHub項目地址:https://github.com/facebookresearch/audiocraft。作者建議部署這個軟件電腦顯卡最好要16G顯存以上,我試了一下低配置顯卡電腦也可以使用,下面說一下具體操作步驟。
1、安裝python
打開Python官網下載鏈接:https://www.python.org/downloads/,你是什么系統,就下載那個對應版本就可以。
我們下載Python 3.10.11穩定版
下載到電腦上之后,雙擊運行安裝Python,先點擊勾選add python.exe to path,在點擊install now安裝。
2、安裝pytorch
按鍵盤上的Windows+R鍵,打開運行,輸入cmd,回車,啟動終端,輸入如下命令,回車,
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
注意這個過程需要安裝一個約2.6G左右的文件,時間可能會久一些。出現提示Successfully installed。。。一大串信息就表明安裝成功了。
3、配置ffmpeg
首先打開ffmpeg官網:https://ffmpeg.org/download.html,下載對應系統的文件,這里以Windows為例
將壓縮包下載到本地電腦上解壓,然后打開bin文件夾,復制路徑,
然后鼠標右鍵點擊我的電腦-屬性-高級系統設置-環境變量-選中Path點擊編輯-新建,然后在輸入框內輸入上面的文件夾路徑,然后確定。
這時在cmd里輸入如下命令:
ffmpeg
出現ffmpeg詳細信息就表示ffmpeg安裝成功。
4、安裝Microsoft C++ 生成工具
Windows系統需要安裝Microsoft C++ 生成工具,鏈接:https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/
點擊按鈕【下載生成工具】,將應用程序下載到電腦上,然后運行安裝。
開始安裝的時候程序會自動下載一些文件,稍后就會進入程序選擇界面,勾選【使用C++的桌面開發】和右側【Windows 10 SDK】最上面的這個版本。
然后點擊右下角【安裝】按鈕,注意硬盤容量??偣?0GB多,下載并安裝所需時間比較長。
5、安裝git,克隆項目
git官網地址:https://git-scm.com/download
64位Windows版git程序文件鏈接:https://github.com/git-for-windows/git/releases/download/v2.41.0.windows.1/Git-2.41.0-64-bit.exe
全部默認安裝就可以,一直下一步,完成安裝。
接下來克隆項目文件,以安裝在D盤為例,打開D盤,在地址欄里輸入cmd,回車,啟動終端,在終端里輸入如下命令,回車,
git clone https://github.com/facebookresearch/audiocraft.git
6、安裝項目依賴
打開audiocraft文件夾,在地址欄里輸入cmd,回車,啟動終端,運行如下命令。
pip install -e .
提示Successfully installed 。。。很長一大串信息就是安裝完成了,然后再依次運行如下命令:
pip uninstall -y xformers
pip install xformers
pip install gradio
安裝完成后audiocraft本地電腦部署就完成了,下面就可以運行使用該文本轉音樂軟件了。
繼續在上面的終端里輸入如下命令運行,也就是在audiocraft這個目錄內,
python app.py
看到輸出URL信息后,復制鏈接地址,在瀏覽器里打開這個鏈接頁面,Input Text里輸入待合成音樂的描述詞,如果是melody模式的話右側File可以上傳一個參考音樂,然后根據這段音樂生成新的音樂,也可以不上傳直接由文本生成,其它模式的話只能由文本生成,模型越大對電腦配置要求越高。生成的音樂時長最大為120秒。
設置完后點擊提交按鈕就可以生成音樂了,首次生成音樂會先下載模型文件,如果下載失敗的話就開全局科學上網。我的電腦顯卡是2060 6G顯存,在melody模式下生成了幾段10秒的音頻試了試,所耗時間大約在30-70秒之間,看樣也不是必須16G顯存才能玩,低配電腦也能玩。
也可以在huggingface上免費體驗,鏈接:https://huggingface.co/spaces/facebook/MusicGen
Google colab 一鍵部署腳本鏈接:https://colab.research.google.com/drive/1NJ2XF9_E8sy-dT11OR46BBXwliC3meG5?usp=sharing
大家有感興趣的可以去試試吧。
原文:https://dyss.top/1087
腦版剪映教程(130)怎樣克隆自己的音色
先請看演示視頻:
<script src="https://lf6-cdn-tos.bytescm.com/obj/cdn-static-resource/tt_player/tt.player.js?v=20160723"></script>
然后再詳細看文字內容,文字內容和演示視頻結合起來學習,一定能事半功倍。
這一講,給大家介紹一下剪映專業版的“克隆音色”功能,這個功能是限免功能。
“克隆音色”,就是用來模擬我們說話的語氣,以及我們說話的聲音,和說話的速度。從而保存為一個音色,供以后使用。
操作過程如下:
打開剪映,點擊開始創作。素材庫選擇背景素材,添加到主軌道,點擊文本,默認文本??截悾╟trl+c)準備好的一段文字,“春天是一個五彩斑斕的季節,各種色彩交織在一起,構成了一幅美麗的畫卷。從探出新綠的樹葉,到盛開的鮮花,再到藍天白云,任何一種色彩都無法抗拒春天的魅力?!?,粘貼(ctrl+v)到文本軌道,選擇文本軌道,點擊朗讀,選擇克隆音色,在已閱讀并同意前打鉤。
點擊登錄,通過抖音登錄,在手機抖音APP的主頁,點左上角三個橫,點擊右上角掃一掃,掃電腦上抖音二維碼,點同意授權,點擊克隆,不要超過十秒錄音,我確認并同意同意前打鉤,點擊去錄制,點按開始錄制,讀屏幕上提供的文字。
你按照期望的音色效果進行朗讀,然后,我們單擊這個按鈕,就可以開始朗讀。朗讀完之后,單擊“結束”。這時就會在生成中,要稍等一會兒。
那這邊呢我們可以再試聽一下,我們單擊,這是你的專屬克隆音色,希望你能喜歡。然后,給這個音色改個名字,單擊保存音色。
接下來,我們選擇文本,單擊朗讀,單擊我們剛剛克隆的這個音色,聽一聽。如果說你錄制的時候說話語氣很慢,那么它生成的這個音頻,語速就會非常慢,還有就是聲情并茂。
你想克隆什么樣的效果,那你就要以什么樣的效果去錄制就好。
起文件重命名,大家一般都會想到用F2修改主文件名或顯示出擴展名再做修改的技巧,更進一步則會想到按序號批量命名等方法。然而,由于文件使用的復雜性,文件重命名的需求也是多樣化的。借助于Bulk Rename Utility、拖把更名器等工具,我們可以實現特殊需求下的文件批量重命名。此外,甚至還可以用簡單的批處理來實現批量文件的快速重命名。
1. 改掉無意義的照片文件名
我們拍攝的數碼照片常常是一些諸如DSC1089.JPG或IMG_7543.JPG格式的文件名,從中只能看出拍攝序號,而如果要查看照片的拍攝日期,還得借助于系統文件屬性或用工具軟件,從照片的EXIF元數據中提取日期查看。其實,可以用批量文件命名軟件Bulk Rename Utility,將這些照片的EXIF參數中提取拍攝日期,作為照片文件名的一部分。這樣,當我們看到照片文件名后,一下子就能辨認出是哪個日期拍攝的了。
先從Bulk Rename Utility的上部窗口目錄樹中定位要批量命名的照片文件,選中這些文件,然后勾選“自動日期”參數組后的復選框;方式選擇為“后綴”;選擇類型為“拍攝(原始日期)”;選擇格式為“年月日”;分隔符填寫"_”,用來連接原文件名和后綴;連接符填寫“-”,用來分隔日期。如此設置之后,在上方右側的文件名預覽窗口中,馬上會顯示出更名后的效果,可以看出文件名后部已經加上了拍攝日期。
(圖1)
最后,點擊“重命名”按鈕讓批量命名生效。
2. MP3音樂標簽變身歌名
大家知道,正規的MP3歌曲文件名中應該包含有唱片集、藝術家、標題等與歌曲有關的屬性,這些信息以MP3 ID3標簽的形式與MP3文件合并保存。平常我們可能只能看到歌曲文件的文件名而看不到標簽,如果在Windows 8.1或Windows 10環境下,將文件顯示方式切換為“詳細信息”,則可以看到這些標簽。
(圖2)
但是,不是所有軟件都能像Windows資源管理器這樣顯示出MP3文件的標簽。例如在一些播放器的文件選擇窗口中,是沒法通過文件名判斷出其文件標簽信息的。在這種情況下,如果文件名中不帶有專輯屬性顯示,借助于“拖把更名器”更名軟件,從MP3文件中提取音樂標簽,然后將這些標簽作為文件名的一部分,即可完成用標簽對音樂文件的重命名。
啟動拖把更名器,將MP3系列文件拖動到更名窗口中。點擊“標簽命名”選項卡,可以看到下面一些帶有百分號的數字變量分別代表了歌曲標簽中的某種屬性。用這些變量的組合,可以輕松構建新的標簽表達式,而將構造的表達式應用到文件名中,就可以完成用標簽來命名文件了。這里假設我們要用“專輯名+歌曲標題”的形式來命名文件,只需在“標簽表達式”文本框中輸入“%4 - %2”,然后點擊后面的“預覽”按鈕,在下部窗口的中間“預覽”列就會出現更名效果。如果更名預覽效果滿意,則可以按下組合鍵“Ctrl+E”實現真正意義上的文件更名。
(圖3)
小技巧:
有時,我們獲得的MP3歌曲由于某種原因丟失了文件中的MP3標簽。丟失了標簽的MP3文件,在播放時播放軟件無法識別出音樂的專輯名或藝術家名等標簽信息,這樣給播放選曲會帶來不便。要解決這個問題,可通過拖把更名器的“標簽寫入”功能寫入歌曲標簽。先在標簽輸入框中輸入要添加的標簽文字,然后在表達式中輸入標簽的變量組合,點擊“保存”即可將標簽保存到MP3文件當中。
3. 借歌單批量命名歌曲
如果從某音樂網站下載的某個專輯,其中的歌曲文件名是01.MP3到15.MP3這樣的形式,而網頁上卻有明確的從01到15的歌曲名單,這時可以借助于文本文件命名的方法,將歌單文本應用于文件名中。
具體方法:先將歌名按一個一行拷貝到一個新建的TXT文件中,然后從拖把更名器窗口中執行“更名→調用文本文件命名”,讀取該TXT文件,執行命名操作,即可讓這個系列專輯的MP3文件名變為歌曲本身的名稱,識別起來就方便多了。
4. 讓照片名稱附帶出處
在數碼庫中,如果給照片文件名附帶一個所藏文件夾的路徑名稱,那么,即便是這張照片被拷貝到不同的電腦上,也會一眼判斷出這張照片原來是藏在何處的。
假設照片文件夾名為“頤和園旅行”,照片名為形如“IMG_0629.JPG”的格式,希望命名后為“頤和園旅行-IMG_0629.JPG”??梢杂肂ulk Rename Utility軟件,選中“附加文件夾名”,名稱選擇“前綴”,加上分隔符“-”,根據需要選擇文件夾層級。最后在預覽合格后,執行“重命名”按鈕即可。
(圖4)
5. 不顯示擴展名也更名
在我們傳統的印象中,要更改文件的擴展名,需要先通過系統設置將擴展名顯示出來,然后更改。其實,如果用一些更名軟件,可以不理會文件擴展名是否顯示出來,直接在擴展名項目中填入新的擴展名,執行更名命令即可實現文件擴展名的批量更改。
(圖5)
小技巧:
也可以進入文件夾的命令提示符窗口,然后執行“COPY *.* *.JPG”此類命令,一次性更改文件擴展名。其中“*.*”表示目錄現存所有文件,“*.JPG”表示更改為JPG格式文件。