-
中位数 编辑
中文名:中位数
外文名:Median
别名:中值
归属学科:数学
基本释义:一组有序数据中居于中间位置的数
领域:统计学;数据挖掘
中位数,又称中点数,中值。中位数是按顺序排列的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比他大,有一半的数据比他小,这里用
有一组数据:
则当N为奇数时,
一个数集中最多有一半的数值小于中位数,也最多有一半的数值大于中位数。如果大于和小于中位数的数值个数均少于一半,那么数集中必有若干值等同于中位数。
设连续随机变量X的分布函数为
1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。
2)有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。
3)趋于一组有序数据的中间位置
对于一组有限个数的数据来说,它们的中位数是这样的一种数:这群数据里的一半的数据比它大,而另外一半数据比它小。 计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。
中位数:也就是选取中间的数,是一种衡量集中趋势的方法。
例1
找出这组数据:23、29、20、32、23、21、33、25 的中位数。
解:
首先将该组数据进行排列(这里按从小到大的顺序),得到:
20、21、23、23、25、29、32、33
因为该组数据一共由8个数据组成,即n为偶数,故按中位数的计算方法,得到中位数
例2
找出这组数据:10、20、 20、 20、 30的中位数。
解:
首先将该组数据进行排列(这里按从小到大的顺序),得到:
10、 20、 20、 20、 30
因为该组数据一共由5个数据组成,即n为奇数,故按中位数的计算方法,得到中位数为20,即第3个数。
在Matlab中,median()函数是求取一组数据的中位数的内置函数,使用规则如下:
M = median(A)
M = median(A,dim)
M = median(___,nanflag)
示例:
全部折叠
矩阵列的中位数
定义一个 4×3 矩阵。
A =
A = 4×3
0 1 1
2 3 2
1 3 2
4 2 2
计算每一列的中位数值。
M = median(A)
M = 1×3
1.5000 2.5000 2.0000
对于每一列,中位数值在排列顺序上位于中间的两个数值的均值。
矩阵行的中位数
定义一个 2×3 矩阵。
A =
A = 2×3
0 1 1
2 3 2
计算每一行的中位数值。
M = median(A,2)
M = 2×1
1
2
对于每一行,中位数值为在排列顺序上位于中间的数值。
1)平均数是通过计算得到的,因此它会因每一个数据的变化而变化。
2)中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
3)众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
优缺点:
平均数:需要全组所有数据来计算;易受数据中极端数值的影响。中位数:仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。众数:通过计数得到;不易受数据中极端数值的影响。