当数据编制成次数分布表之后,已看不到原始数据,在这种情况下,一般要使用次数分布表中各分组区间的组中值(XC)以及各组次数(f)的乘积和,代替公式3-1中的∑Xi来计算平均数。随着计算机和统计软件的普及和使用,目前,这种计算方法已很少使用。
【资料卡3-1】
使用次数分布表计算平均数的方法
根据次数分布表计算平均数,需要使用各分组区间的组中值来代表落入该区间的各个原始数据,并假设散布在各区间内的数据围绕着该区间的组中值均匀分布。基于这一假设,根据计算平均数的基本公式,推演出计算分组数据平均数的公式如下:
公式中XC为各分组区间的组中值,f为各组次数,∑f为数据的总次数(等于N)。各组的频数可视为各组组中值的权重,因而被称为平均数的加权公式。用这个公式计算分组数据的平均数时,数字往往很大,比较麻烦。如果将每一区间的组中值减去一估计平均数(一般选次数较多或位于分布表中间的分组区间的组中值),然后再将差数除以组距i,便可以使计算的数字大大缩小,最后再总的乘以i,恢复数值,计算过程会简便许多。可写作:
下表说明了分组数据求平均数的步骤: