太強大了!一款可以像操作Excel一樣玩Pandas的視覺化神器來了!
Pandas這個庫對Python來說太重要啦!因為它的出現,讓Python進行資料分析如虎添翼,作為Python裡面最最牛逼的庫之一,它在
資料處理
和
資料分析方面,
擁有極大的優勢,受到資料科學開發者的廣大歡迎。
最近在逛GitHub的時候,發現了一款神器,
一款神器分析Pandas DataFrames的圖形化介面
,可以幫助我們對資料集進行視覺化的處理,非常不錯!
01 如何安裝
安裝步驟其安裝步驟十分簡單,只需要使用pip命令安裝即可。
pip3 install pandasgui
#清華映象
pip3 install -i https://pypi。tuna。tsinghua。edu。cn/simple pandasgui
建議大家用清華映象安裝,這樣會穩定而且快很多。
02 功能特點
PandasGUI是一個互動式的資料操作介面,類似於Excel,但是其對於資料處理更加方便快捷,共擁有7項功能特點:
檢視DataFrames和Series資料
互動式繪圖
資料篩選
統計摘要
資料編輯和複製/貼上
拖放匯入CSV檔案
搜尋工具欄
03 使用方式
啟動PandasGUI的方式,程式碼也十分簡單,只需要匯入相關庫,獲取DataFrames資料並顯示就好了。示例程式碼如下:
然後我們就可以看到一個影象化的介面了。
04 實戰練習
這次我們拿大名鼎鼎的泰坦尼克資料集來做練習,一起看一下用這款神器如何分析,還是用上面的幾行示例程式碼來啟動PandaGui:
在首頁中我們可以看到資料的大小維數(第一個紅框)891*12,以及我們選擇的六個選單欄:
DataFrame,Filters,Statistics,Grapher,Reshaper
等,六個選單欄可以按照自己所需調整到不同區域方便操作。
上圖展示小編將過濾器和統計調整在右邊的畫面,大家可根據需求進行自行調整,下面將對選單欄分別進行學習操作。
DataFrame
這裡對資料進行展示,當我們想要檢視資料時,點選DataFrame便可檢視。
Filters資料篩選
這是一個可以根據輸入條件對資料進行初步篩選的互動介面,只需要將條件輸入框中,點選ADD Filter按鈕即可,在這裡,小編輸入了Survived == 1、Age>30、Sex == “male”三個條件,但是之選中了其中兩個條件,其過濾結果如下圖所示。
Statistics統計選單欄
顯示了資料各個變數之間的統計結果,包含了每個變數的資料型別,總數,平均值,最大值,最小值等。
Grapher畫圖選單欄
提供了直方圖、散點圖、折線圖、餅狀圖、詞雲等12種影象格式,使用者可以根據需求選取變數繪製相應的圖形。
下面以直方圖和詞云為例子向大家進行展示:
上圖繪製了年齡大於30的船上游客的年齡直方圖,可以看到Filter工具在畫圖時仍可以同時使用。
上圖以名字為例子,繪製了船上人員名字的詞雲圖。
ReshaperReshaper選單欄
展示了了對原始資料進行重新組合為新DataFrames的功能。它包含了DataFrames的基本屬性,實際上代表了DataFrames的兩個方法,df。melt(),df。pivot(),以影象化的形式進行了展現。這裡以pivot進行展示:pivot()引數:values:對應的二維NumPy值陣列。columns:列索引:列名稱。index:行的索引:行號或行名。aggfun: 使用方法
上圖中以Sex為行索引,Age為列索引,Fare系統值,操作後的表格展示為:
在上圖中,我們可以看到,在最左邊增加了df_pivot的DataFrames資料,每操作一次,會增加一個DataFrames資料,並在左邊顯示,新增之後的DataFrames資料依然適用於之前所有的操作。此外,新生成的DataFrames可以直接拖拽在資料夾生成新的csv檔案,儲存方便。
到這裡,小編的探索就結束了,
有了這個工具,大家就可以像操作Excel一樣操作Dataframe資料,迅速獲取有用的資訊
,不知道大家有沒有心動呢!
相關文章
- 2021-09-11厲害!廈門這家企業,竟然讓三星堆“活”起來了
- 2021-08-21詹姆斯199次25+10+5 排名NBA歷史第幾
- 2021-07-27Facebook將花費數年時間完成資料庫向MySQL 8.0的遷移
- 2021-06-21打底褲的裝扮顯出女性的青春氣息,別緻穿搭更具風格
- 2021-06-0450噸的“沙漠泰坦”,搭29.6L康明斯V12,700馬力震撼眾人