【分享成果,隨喜正能量】人生莫過做好三件事:一是知道如何選擇,找一條適合自己走的路,別左顧右盼pdf格式的文件有什么特點,莫貪多求快,不要誤入亂花迷了眼;二是明白如何堅持,好走的路上景色少,人稀的途中困苦多,勿隨意盲從,忌一味跟風(fēng),堅守這一刻,才能看到下一刻風(fēng)景;三是懂得如何放棄,屬于你的終究有限,放棄繁星,才能收獲黎明。 。我的教程一共九套,分為初級、中級、高級三大部分。是對VBA的系統(tǒng)講解,從簡單的入門pdf格式的文件有什么特點,到數(shù)據(jù)庫,到字典,到高級的網(wǎng)抓及類的應(yīng)用。大家在學(xué)習(xí)的過程中可能會存在困惑,這么多知識點該如何組織成自己的程序呢?VBA可否能組織一個大型的程序呢?如何讓VBA形成一個工具,拿來就用呢?在我的教程完結(jié)后,我陸續(xù)推出這類技術(shù)工具資料,這類工具整合了若干多的VBA知識點,讓大家感受到VBA之強大。工具資料共兩個系列,一個是YZ系列,一個是NZ系列。今日給大家介紹的是NZ系列工具:VBA讀取PDF文件的應(yīng)用開發(fā)
NZ02 VBA讀取PDF使用說明PDF文件大家并不陌生,很多資料的傳遞都是依靠這種文件格式進行,如一些報表,合同書,甚至個人的一些資料。這個格式的文件有著自己的特點,不易被修改,但是我們的一些數(shù)據(jù)信息往往來自于這類文件,那么怎么利用VBA技術(shù)讀取把這類文件的信息呢?這個應(yīng)用就是實現(xiàn)這個目的。提供給學(xué)員7項功能:功能1:在指定路徑下的PDF中查找字符串;功能2:將指定路徑下的PDF文件拆分成若干個文件,每個文件的頁數(shù)是指定的;功能3:將某個文件夾下的多個pdf文件合并,功能4:提取pdf文件中表的數(shù)據(jù),表中不能有合并單元格,功能5:提取PDF中某個段落數(shù)據(jù)到EXCEL 功能6 :提取pdf文件中表的數(shù)據(jù),表中可以有合并單元格 功能7:將文件夾下的多個PDF轉(zhuǎn)變成WORD文件,并放在同路徑下的WORD文件夾下(事前建立)
一 準(zhǔn)備工作當(dāng)你得到這個應(yīng)用技術(shù)后,可以看到兩個文件夾及一個使用的文檔說明。
1 我們首先打開“up”文件夾,安裝一下ADODB,這個文件夾下有安裝的說明,如果按照過程出現(xiàn)異常,按照這個說明進行處理即可。安裝ADODB的目的是要獲得VBA中利用的控件。2 安裝好后,我們打開“程序及示例文件文件”這個文件夾,這個文件如下截圖:
這個文件夾中包含兩個文件夾和兩個文件,其中“word”文件夾是空的,用于文檔裝換后的目的地址;“測試文檔”中包含我們可以用于測試各個功能的PDF文件;.xlam文件是加載項文件,是整個文件的技術(shù)核心部分,如果您得到的是不開放源碼的資料,您是無法打開這個文件并看到代碼的,如果您得到的是開放源碼的資料,可以輸入密碼“”打開這個加載項,并看到里面的代碼,但是建議您不要輕易打開。.xlsm文件是我們應(yīng)用這個加載項的程序,提供了應(yīng)用的界面,我們打開這個文件,截圖如下:
以上的界面截圖提供了各項功能的運行按鈕及要提供的輸入?yún)?shù)。您只要在這個界面中按照要求輸入相應(yīng)的參數(shù)就可以了。二 功能1:在指定路徑下的PDF中查找字符串測試參數(shù)輸入,在D2單元格中輸入路徑地址“D:\VBA筆記\\程序及示例文件文件\測試文檔”;在E2單元格中輸入文件名;在F2單元格中輸入我們要查找的字符。
點擊運行按鈕.
結(jié)果:
三 功能2:拆分PDF文件測試參數(shù)輸入,在D4單元格中輸入路徑地址:D:\VBA筆記\\程序及示例文件文件\測試文檔;在E4單元格中輸入文件名”調(diào)試”;在F4單元格中輸入我們要形成每個文件的頁數(shù),這里我們選擇10。
點擊運行按鈕.
結(jié)果:
以上我們看到,已經(jīng)將”調(diào)試文件,分隔成每10頁一個文件,運行也是非常的快。四 功能3:將某個文件夾下的多個pdf文件合并測試參數(shù)輸入,在D6單元格中輸入路徑地址:D:\VBA筆記\\程序及示例文件文件;在E6單元格中輸入文件名””;在F6單元格為空,沒有參數(shù)。如下截圖:
點擊運行按鈕.
結(jié)果:
以上結(jié)果,已經(jīng)將“文件”和“文章”文件合并到“”文件。當(dāng)然,你也可以在這個文件夾下放入多個PDF文件。五 功能4:提取pdf文件中表數(shù)據(jù)(表中不能有合并單元格)測試參數(shù)輸入:在D8單元格中輸入路徑地址“D:\VBA筆記\\程序及示例文件文件\測試文檔”;在E8單元格中輸入文件名”myPDF(無合并單元格)”;在F8單元格為空,沒有參數(shù)。如下截圖:
點擊運行按鈕.
結(jié)果:
程序運行后,會形成一個新的文件,把表格中的內(nèi)容放到新的工作簿文件中。六 功能5:提取PDF中某個段落數(shù)據(jù)到EXCEL 測試參數(shù)輸入:在D10單元格中輸入路徑地址“D:\VBA筆記\\程序及示例文件文件\測試文檔”;在E10單元格中輸入文件名“文章”;在F8單元格輸入“要提取的段落號”這里我們輸入1。如下截圖:
點擊運行按鈕.
結(jié)果:
程序運行后,會形成一個新的文件,把PDF文件“文章”中的第一段內(nèi)容放到新的工作簿文件中。七 功能6:提取pdf文件中表的數(shù)據(jù)(可以有合并單元格) 測試參數(shù)輸入:在D12單元格中輸入路徑地址“D:\VBA筆記\\程序及示例文件文件\測試文檔”;在E12單元格中輸入文件名“myPDF(有合并單元格)”;在F12單元格輸入表間隔參數(shù),是指兩個表的間隔行數(shù),這里用的是3。如下截圖:
點擊運行按鈕.
結(jié)果:
程序運行后,會形成一個新的文件,把PDF各個表格中的內(nèi)容放到新的工作簿文件中。八 功能7:將文件夾下的多個PDF轉(zhuǎn)變成WORD文件測試參數(shù)輸入:在D14單元格中輸入路徑地址“D:\VBA筆記\\程序及示例文件文件”;沒有其他參數(shù),如下截圖:
點擊運行按鈕.
結(jié)果:
程序運行后,會在word文件夾中形成相應(yīng)新的word文件.九 技術(shù)總結(jié)這個應(yīng)用中,我們大體上解決了VBA讀取PDF文件中常見的七大問題:功能1:在指定路徑下的PDF中查找字符串;功能2:將指定路徑下的PDF文件拆分成若干個文件,每個文件的頁數(shù)是指定的;功能3:將某個文件夾下的多個pdf文件合并,功能4:提取pdf文件中表的數(shù)據(jù),表中不能有合并單元格,功能5:提取PDF中某個段落數(shù)據(jù)到EXCEL 功能6 :提取pdf文件中表的數(shù)據(jù),表中可以有合并單元格 功能7:將文件夾下的多個PDF轉(zhuǎn)變成WORD文件,并放在同路徑下的WORD文件夾下(事前建立)但是,由于有些PDF的文件完全完美的讀取對于VBA而言是非常困難的,還不能夠完全實現(xiàn),也希望學(xué)員的技術(shù)在我的基礎(chǔ)上有所突破,
如何能獲得NZ系列資料呢?NZ系列資料有兩個版本,一是核心技術(shù)不開放源碼的,二是核心技術(shù)開放源碼的。獲得條件如下:1 如果您成為了我的學(xué)員,肯于學(xué)習(xí),并且取得了我的所有教程(可以不含第4套),那么恭喜您,您可以直接獲得不開放源碼的所有NZ系列技術(shù)工具。雖然不開放源碼,但可以使用這些工具(此優(yōu)惠已經(jīng)停止)。2 如果您獲得了我的部分教程,需要NZ工具系列的其一,您可以聯(lián)絡(luò)我取得。這時您獲得的是開發(fā)源碼的資料。開放源碼文件中,您可以看到核心技術(shù)的代碼組成,可以根據(jù)自己的需要修改。3 如果您已經(jīng)有了不開放源碼的資料,需要對某個部分進行修改,那么您可以聯(lián)絡(luò)我取得源碼文件做二開。開放源碼文件中,您可以看到核心技術(shù)的代碼組成,可以根據(jù)自己的需要修改。