酷知百科網

位置:首頁 > 職場理財 > 職場就業

python用matplotlib繪製散點圖、直方圖、箱形圖

python是目前使用最廣泛的程式語言,因為目前正處於大數據時代;目前大數據中可視化技術至關重要,而python的matplotlib是最主要的可視化庫,下面看看如何繪製散點圖、直方圖和箱形圖,及修改圖表屬性的函數setp

操作方法

(01)加載numpy和ot。y=dard_normal((600,2))表示隨機生成一個標準正態分佈形狀是600*2的數組,如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖
python用matplotlib繪製散點圖、直方圖、箱形圖 第2張

(02)繪製散點圖(使用plot)。re(figsize=(8,5))表示繪製圖形的畫板尺寸為8*5;(y[:,0],y[:,1],'ro')表示繪製散點圖,且為紅色圓標記;(True)表示圖形添加網格;el('1st')表示給X軸加標籤‘1st’;el('2nd')表示給Y軸加標籤‘2nd’;e('Scatter Plot')表示給圖形加標題‘Scatter Plot’;如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第3張

(03)繪製散點圖(使用scatter)。ter(y[:,0],y[:,1],marker='o')替代了上面的(y[:,0],y[:,1],'ro'),則繪圖效果類似,其中marker='o'表示圓標記;如果再加上參數c='r',修改顏色後,完全等價於上圖;如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第4張
python用matplotlib繪製散點圖、直方圖、箱形圖 第5張

(04)繪製散點圖(色彩可視化)。c=int(0,10,len(y))表示隨機生成一個第三維度的數據集,取值在0-10之間的整數;ter(y[:,0],y[:,1],c=c,marker='o')表示顏色數據來源於第三維度的c;rbar()表示添加彩條;如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第6張

(05)兩個數據集的直方圖。re(figsize=(8,5))表示繪圖畫板尺寸為8*5;(y, bins=30, label=['1st','2nd'])表示使用y繪製直方圖,數據組數有30個,標籤分別使用'1st'和'2nd';(True)表示添加網格;nd(loc=0)表示最佳位置顯示圖例;el('Value')表示X軸標籤為‘Value’;el('Frequency')表示Y軸標籤為‘Frequency’;e('Histogram')表示標題為‘Histogram’;如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第7張

(06)兩個數據集堆疊的直方圖。(y, bins=20, label=['1st','2nd'],color=['b','m'],stacked=True,rwidth=0.8)的參數stacked=True表示堆疊的直方圖;rwidth=0.8表示修改條塊的相對寬度為0.8,color=['b','m']表示顏色分別取藍色、品紅;如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第8張

(07)兩個數據集的箱形圖。fig,ax=lots(figsize=(8,5))表示畫板尺寸的設置為8*5;lot(y)表示用y繪製箱形圖;(True)表示添加網格;(ax,xticklabels=['1st','2nd'])表示刻度值標籤設置為'1st'和'2nd';el('var')表示X軸標籤為'var';el('value')表示Y軸標籤為'value';e('Boxplot')表示標題為'Boxplot';如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第9張

(08)用setp函數來修改圖表屬性。re(figsize=(8,5))表示畫板尺寸設置;line=(y,'r')表示繪製紅色的折線圖;(line,linestyle='--')修改線條為虛線;如圖所示

python用matplotlib繪製散點圖、直方圖、箱形圖 第10張

特別提示

和scatter可以等效使用,注意參數的不同意義即可

hist(x, bins=None, range=None, density=None, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None, label=None, stacked=False, normed=None, hold=None, data=None, **kwargs)參數解釋:x:列表或ndarray對象;bins:數據組數;range:數據組的下界和上界;normed:規範化為整數1;weights:x軸上每個值的權重;cumulative:每個數據組包含較低組別的計數;histtype:bar、barstacked、step、stepfilled;align:left、mid、right;orientation:horizontal、vertical;rwidth:條塊的相對寬度;log:對數刻度;color:每個數據集的顏色;label:標籤所用的字符串(序列);stacked:堆疊多個數據集;kwargs :關鍵字參數

設置圖表屬性使用函數setp