帕累托圖在概念上與帕累托法則有關。帕累托法則認為,相對少量的原因通常造成大多數的問題或缺陷。該法則通常稱為80/20原則,即80%的問題是由20%的原因導致的。帕累托圖也用于匯總各種類型的數據,并進行80/20分析。
(1)創建數據
# 帕累托分布分析 data = pd.Series(np.random.randn(10)*1200+3000,index = list('ABCDEFGHIJ'))
print(data)
print('------')
# 創建數據,10個品類產品的銷售額data.sort_values(ascending=False, inplace= True)
# 由大到小排列plt.figure(figsize = (10,4))
data.plot(kind = 'bar', color = 'g', alpha = 0.5, width = 0.7)
plt.ylabel('營收_元')
# 創建營收柱狀圖p = data.cumsum()/data.sum() # 創建累計占比,Series
key = p[p>0.8].index[0]
key_num = data.index.tolist().index(key)
print('超過80%累計占比的節點值索引為:' ,key)
print('超過80%累計占比的節點值索引位置為:' ,key_num)
print('------')
# 找到累計占比超過80%時候的index
# 找到key所對應的索引位置p.plot(style = '--ko', secondary_y=True) # secondary_y → y副坐標軸
plt.axvline(key_num,hold=None,color='r',linestyle="--",alpha=0.8)
plt.text(key_num+0.2,p[key],'累計占比為:%.3f%%' % (p[key]*100), color = 'r') # 累計占比超過80%的節點
plt.ylabel('營收_比例')
# 繪制營收累計占比曲線key_product = data.loc[:key]
print('核心產品為:')
print(key_product)
# 輸出決定性因素產品
版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。
工作时间:8:00-18:00
客服电话
电子邮件
admin@qq.com
扫码二维码
获取最新动态