太強大了!一款可以像操作Excel一樣玩Pandas的視覺化神器來了!

Pandas這個庫對Python來說太重要啦!因為它的出現,讓Python進行資料分析如虎添翼,作為Python裡面最最牛逼的庫之一,它在

資料處理

資料分析方面,

擁有極大的優勢,受到資料科學開發者的廣大歡迎。

最近在逛GitHub的時候,發現了一款神器,

一款神器分析Pandas DataFrames的圖形化介面

,可以幫助我們對資料集進行視覺化的處理,非常不錯!

01 如何安裝

安裝步驟其安裝步驟十分簡單,只需要使用pip命令安裝即可。

pip3 install pandasgui

#清華映象

pip3 install -i https://pypi。tuna。tsinghua。edu。cn/simple pandasgui

建議大家用清華映象安裝,這樣會穩定而且快很多。

02 功能特點

PandasGUI是一個互動式的資料操作介面,類似於Excel,但是其對於資料處理更加方便快捷,共擁有7項功能特點:

檢視DataFrames和Series資料

互動式繪圖

資料篩選

統計摘要

資料編輯和複製/貼上

拖放匯入CSV檔案

搜尋工具欄

03 使用方式

啟動PandasGUI的方式,程式碼也十分簡單,只需要匯入相關庫,獲取DataFrames資料並顯示就好了。示例程式碼如下:

然後我們就可以看到一個影象化的介面了。

04 實戰練習

這次我們拿大名鼎鼎的泰坦尼克資料集來做練習,一起看一下用這款神器如何分析,還是用上面的幾行示例程式碼來啟動PandaGui:

在首頁中我們可以看到資料的大小維數(第一個紅框)891*12,以及我們選擇的六個選單欄:

DataFrame,Filters,Statistics,Grapher,Reshaper

等,六個選單欄可以按照自己所需調整到不同區域方便操作。

上圖展示小編將過濾器和統計調整在右邊的畫面,大家可根據需求進行自行調整,下面將對選單欄分別進行學習操作。

DataFrame

這裡對資料進行展示,當我們想要檢視資料時,點選DataFrame便可檢視。

Filters資料篩選

這是一個可以根據輸入條件對資料進行初步篩選的互動介面,只需要將條件輸入框中,點選ADD Filter按鈕即可,在這裡,小編輸入了Survived == 1、Age>30、Sex == “male”三個條件,但是之選中了其中兩個條件,其過濾結果如下圖所示。

Statistics統計選單欄

顯示了資料各個變數之間的統計結果,包含了每個變數的資料型別,總數,平均值,最大值,最小值等。

Grapher畫圖選單欄

提供了直方圖、散點圖、折線圖、餅狀圖、詞雲等12種影象格式,使用者可以根據需求選取變數繪製相應的圖形。

下面以直方圖和詞云為例子向大家進行展示:

上圖繪製了年齡大於30的船上游客的年齡直方圖,可以看到Filter工具在畫圖時仍可以同時使用。

上圖以名字為例子,繪製了船上人員名字的詞雲圖。

ReshaperReshaper選單欄

展示了了對原始資料進行重新組合為新DataFrames的功能。它包含了DataFrames的基本屬性,實際上代表了DataFrames的兩個方法,df。melt(),df。pivot(),以影象化的形式進行了展現。這裡以pivot進行展示:pivot()引數:values:對應的二維NumPy值陣列。columns:列索引:列名稱。index:行的索引:行號或行名。aggfun: 使用方法

上圖中以Sex為行索引,Age為列索引,Fare系統值,操作後的表格展示為:

在上圖中,我們可以看到,在最左邊增加了df_pivot的DataFrames資料,每操作一次,會增加一個DataFrames資料,並在左邊顯示,新增之後的DataFrames資料依然適用於之前所有的操作。此外,新生成的DataFrames可以直接拖拽在資料夾生成新的csv檔案,儲存方便。

到這裡,小編的探索就結束了,

有了這個工具,大家就可以像操作Excel一樣操作Dataframe資料,迅速獲取有用的資訊

,不知道大家有沒有心動呢!

相關文章