相信大家在做数据分析,需要用到统计学的知识的时候,应该都会遇到第p百分位数那么在这里我将要讲讲我个人的理解: 从维基百科上查找相关概念:
百分位数,统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数,以Pk表示第k百分位数。 Pk表示至少有k%的资料小于或等于这个数,而同时也有(100-k)%的资料大于或等于这个数。 P25=Q1 P50=Q2 P75=Q3 P50称为中位数 P75与P25的差称为四分位距
看到上面的描述,也大概是一知半解,不过只需关注这个核心句子:Pk表示至少有k%的资料小于或等于这个数,而同时也有(100-k)%的资料大于或等于这个数。 相信都理解都差不多了,也就是看这个数的在全部的排好序(小->大)的位置,那么我们再看看求法:
求法: 若一群资料的个数为N,且由小到大排列,设N×k%=a
a 是整数 那么取第a和a+1的数它们的平均值a不是整数 取a接近的下一个整数(a=1.2 取2)那么我们看看例子吧 假设数据是: 栗子1
1,2,3,4,5,6,7,8,9,10total :10 那么第p(25)百分位数是多少:3 ----------------->10 25% = 2.5 取第3个数 也就是3 第p(50)百分位数是多少:5.5---------------------->1050% = 5 整数 取 5个和第5+1个的平均值 第p(75)百分位数是多少:8----------------------->10*75%=7.5 取第8个数
栗子2
6,7,15,36,39,40,41,42,43,47,49那么第p(25)百分位数是多少:15 第p(50)百分位数是多少:40 第p(75)百分位数是多少:43
栗子3
7,15,36,39,40,41那么第p(25)百分位数是多少:15 第p(50)百分位数是多少:37.5 第p(75)百分位数是多少:40
栗子4
1,2,3,4那么第p(25)百分位数是多少:1.5 第p(50)百分位数是多少:2.5 第p(75)百分位数是多少:3.5
相信看到这里大家都理解得差不多,就算不是很理解,起码这个百分位数也是会算了吧 也从几个栗子看出来,第50百分位数明显就是中位数,所以有时候我们在算中位数的时候就可以使用第p百分位数进行计算。