欧美vvv,亚洲第一成人在线,亚洲成人欧美日韩在线观看,日本猛少妇猛色XXXXX猛叫

新聞資訊

    此文是《10周入門數(shù)據(jù)分析》系列的第5篇。

    想了解學(xué)習(xí)路線,可以先行閱讀“10周計劃”

    公中號上已更新到第11篇,詳情可見文末。


    上周更新了兩篇Excel學(xué)習(xí),有讀者反映寫得不夠?qū)嵅佟_@里解釋下,文字真的很難將每一步細化,不然真的要出一本書。文章更多是一個引路,告訴大家為什么要學(xué)這個,主要學(xué)什么,怎么學(xué)?深入的操作,還需大家業(yè)余加餐啊,已經(jīng)盡量給大家留了材料了。

    也有人提議,出個視頻,不錯!很贊!明年計劃下。即使沒有時間,我也會推薦一些我認為OK的視頻讓大家學(xué)習(xí)。

    年底了,近幾個晚上都在苦熬年終報告,各位寫好了么?

    好了,回到正文,本篇講數(shù)據(jù)庫知識:

    經(jīng)常有剛從事數(shù)據(jù)分析的職場萌新,問我做數(shù)據(jù)分析工作要學(xué)些什么,應(yīng)該怎樣規(guī)劃學(xué)習(xí)路徑。我會告訴他:如果你Excel還用的不溜的話,就先學(xué)學(xué)Excel,當(dāng)你用Excel處理和分析一些小數(shù)據(jù)集沒有問題的時候(具體表現(xiàn)就是:常用函數(shù)公式信手拈來,數(shù)據(jù)透視表,篩選,排序,圖表繪制操作熟練),你就去學(xué)習(xí)SQL語言,然后用BI去分析去熟悉業(yè)務(wù)。然后到了一定階段,你可以上手R或者Python。后面如果你能更進一步,可以去了解一些Spark等大數(shù)據(jù)框架。

    為什么要學(xué)習(xí)Excel?

    首先Excel是我們最常用的數(shù)據(jù)分析和處理工具,Excel的功能非常豐富,基本可以涵蓋我們在之后在其它軟件(SQL、BI、Python、R)中要學(xué)到的那些功能。

    有的人可能會問,既然Excel這么強大,為什么還要學(xué)其它的工具?這是因為Excel是通過菜單的形式來進行操作的,很難實現(xiàn)自動化和功能復(fù)用,當(dāng)然你也可以通過VBA來實現(xiàn),用VBA也就是編程了,不過因為VBA這種語言學(xué)會了基本只能在office軟件中使用,學(xué)習(xí)的投入成本和產(chǎn)出收益不成比例,不推薦學(xué)習(xí),這是客觀原因之一;另外就是Excel在處理比較大的數(shù)據(jù)集的時候,性能很差,并且經(jīng)常崩潰。(雖然Excel2013及以上版本宣稱可以容納100+萬條記錄,但幾萬條數(shù)據(jù)就開始卡頓了)。

    為什么Excel學(xué)完要學(xué)SQL?

    客觀原因是絕大部分數(shù)據(jù)分析崗都有SQL技能的要求。企業(yè)里面為了保證數(shù)據(jù)的安全性和管理的方便,數(shù)據(jù)都是統(tǒng)一存放在數(shù)據(jù)庫中,從數(shù)據(jù)庫中提取和查詢數(shù)據(jù)需要使用SQL語言,甚至有的公司就是用SQL語言來做數(shù)據(jù)分析。

    另外一個原因就是即使你先學(xué)了其它的工具,比如R,Python,甚至Spark等大數(shù)據(jù)框架,你會發(fā)現(xiàn)最后你還是得學(xué)習(xí)SQL。如果你先學(xué)習(xí)SQL,那么很多概念你都能在學(xué)習(xí)R,Python,Spark等更加復(fù)雜的工具之前弄清楚。對于后面的學(xué)習(xí)會有幫助。這就好比建房子,都是先打地基,然后一層一層的蓋。

    SQL語言的學(xué)習(xí)排在Excel之后,其它工具之前,還有一個很重要的原因就是,SQL可以在一定程度上幫Excel解決大數(shù)據(jù)集的問題,同時架起一個通往其它工具的橋梁。

    關(guān)于數(shù)據(jù)庫和SQL的學(xué)習(xí),也是分為兩篇,第一篇講數(shù)據(jù)庫以及表的概念。第二篇是SQL語句的掌握和數(shù)據(jù)庫的操作。

    一、數(shù)據(jù)庫基礎(chǔ)知識

    先談一下我對數(shù)據(jù)庫的理解。數(shù)據(jù)庫顧名思義就是數(shù)據(jù)的集合,是由一張張數(shù)據(jù)表組成的。

    放在物理實體上,是一堆寫在磁盤上的文件,文件中有數(shù)據(jù)。這些最基礎(chǔ)的數(shù)據(jù)組成了表(table),我們把它想象成一張Excel的sheet,如下圖:

    每一張表都有一個唯一標識,即主鍵,也就是ID。ID是數(shù)據(jù)庫中重要的概念,叫做唯一標識符/主鍵,用來表示數(shù)據(jù)的唯一性。就相當(dāng)于我們的身份證,是唯一的,有了身份證,就知道數(shù)據(jù)在哪了。

    ID通常沒有業(yè)務(wù)含義,就是一種唯一標識,每張表只能有一個主鍵,且主鍵通常是整數(shù),主鍵一旦設(shè)立,值通常不允許修改。

    數(shù)據(jù)庫是表的集合。一個數(shù)據(jù)庫中可以放多張表,我們給每張表命名,表與表之間能互相聯(lián)系。聯(lián)系就是數(shù)據(jù)能夠?qū)?yīng)匹配,正式名稱叫聯(lián)接,對應(yīng)的操作叫做Join,我們想象成Excel中的vlookup。

    比如上面兩張圖,左圖是學(xué)生信息表,右圖是老師信息表。左圖的主鍵是學(xué)生ID,右圖的主鍵是老師ID。細心的讀者可能發(fā)現(xiàn)右圖還有一個學(xué)生ID,這里的學(xué)生ID是專門用來聯(lián)接用戶表的,它并不是主鍵。只不過兩張表通過學(xué)生ID這個唯一信息來關(guān)聯(lián)。

    但兩張表關(guān)聯(lián)也并不是信息能一一對應(yīng)的,也會存在空缺的時候,比如:

    那兩表建立連接就會變成:

    了解上面的概念,你就知道什么叫關(guān)系型數(shù)據(jù)庫。簡單說,它是由多張能互相聯(lián)接的二維行列表格組成的數(shù)據(jù)庫。在數(shù)據(jù)準備時,我們通常要建立表關(guān)聯(lián)來分析。

    關(guān)系型數(shù)據(jù)庫是基于關(guān)系代數(shù)模型發(fā)展而來,常用的關(guān)系型數(shù)據(jù)庫有SQL Server、MySQL、Oracle、DB2等,這個視企業(yè)使用為準,我們后續(xù)學(xué)習(xí)都以MySQL為主。

    各關(guān)系型數(shù)據(jù)庫(不感興趣可跳過):

    DB2: 關(guān)系型數(shù)據(jù)庫, 適用于大型的分布式應(yīng)用系統(tǒng), 確實是非常非常好的數(shù)據(jù)庫, 無論穩(wěn)定性, 安全性, 恢復(fù)性等等都無可挑剔, 而且從小規(guī)模到大規(guī)模的應(yīng)用都非常適合。但是使用起來覺得非常繁瑣, 安裝的時候要求頗多, 很多軟件都可能和DB2產(chǎn)生沖突, 因為一般DB2都是安裝在小型機或者服務(wù)器上的, 所以在PC上安裝很費事兒。新建一個庫需要設(shè)置很多東西, 分配各種各樣的存儲空間。

    Oracle: 是目前市場占有率最大的數(shù)據(jù)庫, 我在學(xué)習(xí)SSH的時候用的就是Oracle, 安裝起來很繁瑣, 而且居然程序文件有3G之多... 用起來非常方便, 對于我這樣的初學(xué)者, 有很簡單的配置, 對于要求很高的企業(yè)級應(yīng)用, 也有很復(fù)雜的配置和管理方法, 有很強大的數(shù)據(jù)字典, 可以說是最實用的數(shù)據(jù)庫了, 但是查了一下, 價格不菲...

    MS SQL: 當(dāng)初用的是2000和2005版, 這兩個版本差了很多。2000的數(shù)據(jù)庫做的不錯, 程序很小, 操作簡單, 功能較全, 算是各方面都很中庸的數(shù)據(jù)庫吧, 是中型數(shù)據(jù)庫, 我的畢業(yè)設(shè)計就是用MS SQL 2000做的。2005中加入了很多功能, 復(fù)雜多了, 有大型數(shù)據(jù)庫的風(fēng)范了, 而且價格也變高了, 個人覺得除非用的是Window Server 系統(tǒng)或者針對Microsoft產(chǎn)品, 否則不如用Oracle好。

    MySQL: MySQL是一個很好的關(guān)系型數(shù)據(jù)庫, 免費, 而且功能很全, 程序又小, 安裝簡單, 現(xiàn)在很多網(wǎng)站都用MYSQL, 在字段約束上做的差了點兒, 其他的都不錯, 和MS SQL 用著差不多。

    Access: 典型的桌面數(shù)據(jù)庫, 覺得做個單機系統(tǒng), 比如記賬, 記事兒什么的還成, 在局域網(wǎng)里跑個小系統(tǒng)都夠嗆, 數(shù)據(jù)源連接很簡單, 因為是Office的數(shù)據(jù)庫, 所以Windows自帶數(shù)據(jù)源。

    更多關(guān)于數(shù)據(jù)庫的知識,看一本《數(shù)據(jù)庫系統(tǒng)概論》就夠了。

    二、嘗試使用MySQL數(shù)據(jù)庫

    如果還沒有接觸過數(shù)據(jù)庫或者說SQL,推薦大家下載并安裝MySQL數(shù)據(jù)進行嘗試,MySQL數(shù)據(jù)庫的下載安裝比較簡單,安裝完成就可以使用。

    可以訪問MySQL官網(wǎng)進行下載,網(wǎng)址如下(這里給出的是Windows版下載地址):

    「鏈接」

    下載MySQL時,需要進行免費注冊,注冊頁面是英文的。下載該工具后,點擊運行,這個程序就能夠聯(lián)網(wǎng)自動為你安裝MySQL,并自動進行配置。在安裝過程中,需要你設(shè)置密碼,自己設(shè)置一個登陸密碼,并記住,下次登陸MySQL時,需要這個密碼。

    解壓之后沒有my.ini文件(我的端口設(shè)置的3308),截圖中是我增加的。

    管理員命令行:

    在MySQL安裝目錄的 bin 目錄下執(zhí)行命令:

    mysqld --initialize --console

    得到如下結(jié)果:

    看到有個警告,查了一下mysql建議使用utf8mb4

    修改my.ini文件

    警告沒有了,上面打印了默認密碼:nj>uUJkpH4/I

    然后,安裝服務(wù):

    mysqld --install MySQL8.0

    因為這是電腦上第二個mysql 所以服務(wù)名改成了 MySQL8.0

    啟動服務(wù):

    net start MySQL8.0

    修改初始密碼

    登錄mysql之后執(zhí)行:

    ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '123456';

    將MySQL和Excel或者其它數(shù)據(jù)分析工具連接起來

    默認安裝的情況下,有一個插件允許MySQL數(shù)據(jù)庫和Excel相連接,試想一下,我們在MySQL數(shù)據(jù)庫中通過SQL語言進行大量數(shù)據(jù)的處理和計算,將計算結(jié)果存放在特定的數(shù)據(jù)表中,再通過Excel連接上MySQL數(shù)據(jù)庫,將數(shù)據(jù)讀取到Excel中,用Excel進行分析并繪制圖表,免去了將數(shù)據(jù)從數(shù)據(jù)庫導(dǎo)出再導(dǎo)入Excel的麻煩,是不是就可以提高效率了呢?

    后面會分享一篇通過ODBC驅(qū)動程序連接一些報表\BI工具來做分析的操作。

    關(guān)于MySQL的學(xué)習(xí)推薦書籍《MySQL必知必會》。

    關(guān)于學(xué)習(xí)計劃

    近期,我的公眾號【數(shù)據(jù)分析不是個事兒】在策劃《10周入門數(shù)據(jù)分析》系列文章,教課書式手把手教大家入門數(shù)據(jù)分析。

    本文是系列中的第5篇,公中號上已更新到第11篇。

    可以戳下“了解更多”前往關(guān)注。

    安裝數(shù)據(jù)庫 安裝程序如果沒有的請回復(fù)索取。
    sql2000安裝步驟

    說明:截圖中用紅色方框標記出來的表示是安裝過程中需要點擊或者或選擇的,過程中每一步選擇完后點下一步出現(xiàn)下一個安裝的界面

    1、點開數(shù)據(jù)庫安裝包找到里面的X86文件夾里面的setup文件夾,找到SETUPSQL.EXE雙擊

    2、彈出安裝向?qū)Ы缑妫c下一步

    3、然后選擇 "本地計算機" 進行安裝。

    4、在 "安裝選擇" 窗口,選擇 "創(chuàng)建新的SQL Server實例..."。對于初次安裝的用戶,應(yīng)選用這一安裝模式,不需要使用 "高級選項" 進行安裝。 "高級選項" 中的內(nèi)容均可在安裝完成后進行調(diào)整。

    5、在 "用戶信息" 窗口點下一步并接受軟件許可證協(xié)議。

    6、在 "安裝定義"窗口,選擇 "服務(wù)器和客戶端工具" 選項進行安裝。我們需要將服務(wù)器和客戶端同時安裝。

    7、在 "實例名" 窗口,選擇 "默認" 的實例名稱。

    8、在 "安裝類型" 窗口,選擇 "典型" 安裝選項,并指定 "目的文件夾"。程序和數(shù)據(jù)文件的默認安裝位置都是 "C:\Program Files\Microsoft SQL Server\"。筆者因為C盤是系統(tǒng)區(qū)、D盤是應(yīng)用區(qū),因此選擇了D盤。注意,如果您的數(shù)據(jù)庫數(shù)據(jù)有10萬條以上的話,請預(yù)留至少1G的存儲空間,以應(yīng)付需求龐大的日志空間和索引空間。

    9、在 "服務(wù)賬號" 窗口,請選擇 "對每個服務(wù)使用統(tǒng)一賬戶..." 的選項。在 "服務(wù)設(shè)置" 處,選擇 "使用本地系統(tǒng)賬戶"



    10、在 "身份驗證模式" 窗口,請選擇 "混合模式..." 選項,并設(shè)置管理員"sa"賬號的密碼。在使用數(shù)據(jù)庫工具建立數(shù)據(jù)庫時需要使用到該賬號。

    11、在 "選擇許可模式" 窗口,根據(jù)您購買的類型和數(shù)量輸入

    然后就是幾分鐘左右的安裝時間,安裝完畢后,出現(xiàn)該界面,并新增了以下的菜單,點完成就可以

    安裝完成后在開始——運行中輸入sqlmangr——確定,彈出服務(wù)管理器界面點開始繼續(xù),將數(shù)據(jù)庫服務(wù)器運行就可以了

網(wǎng)站首頁   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權(quán)所有