拖拉机运输抽样调查主要内容为货运量、货物周转量、运输距离等指标。与运输量有关的其他指标,根据需要,亦可作为抽样调查的内容。
3 抽样方法
3.1 抽样方案的类型
本方案采用分层抽样。以省作调查总体,省内先以地区分层,每个地区为一大层,大层内再以拖拉机的核定吨位大小分子层(吨位层)。
按吨位大小分层及其代码如表1:
拖拉机核定吨位分层标准 表1
<font size=+1>
---------------------------------
子层代码 | 核定吨位X(吨)
--------------|------------------
1 | X<1
--------------|------------------
2 | 1≤X<2
--------------|------------------
3 | 2≤X≤4
--------------|------------------
4 | X>4
---------------------------------
</font>
各地可按照拖拉机的构成,在上述层内进行加细分层,以降低其层内方差。
3.2 样本量的确定与分配
3.2.1 全省样本量的确定
在满足要求精度下,首先确定全省样本量,然后在地区层与吨位层进行分配。
对省的主要指标Y(货运量与货物周转量),在95%的置信度下,极限相对误差为10%~20%(视拖拉机拥有量不同而有所区别)。估计层内变异系数不超过1。当在一个调查期内,取样本拖拉机的调查日期为2天,则确定全省的最低样本量如表2所示:
省最低样本量 表2
<font size=+1>
----------------------------------
省拖拉机拥有量(辆) | 最低样本量(辆)
-----------------|----------------
N<50000 | 400
-----------------|----------------
50000≤N≤100000 | 700
-----------------|----------------
N>100000 | 1000
----------------------------------
</font>
注:拖拉机拥有量系指编入抽样框的运输拖拉机总数,即为运管部门掌握的、已纳入运输管理的运输拖拉机辆数。
3.2.2 各层样本量的分配
1)地区层样本量的确定
当全省样本量确定后,每个地区的样本量系按各地区拖拉机拥有量的比例进行分配。即:若n为全省样本量,N、Nh为全省及地区h的拖拉机拥有量,则地区h的样本量为:
n =nNh/N
h
2)地区内各吨位层样本量的确定
每个地区各吨位层样本量系按各吨位层的拖拉机数及层内标准差的大小进行比例分配或最优分配。即:若地区h第1吨位层的拖拉机数为Nh1,调查指标相应的标准差为Sh1,则该吨位层的样本量(按最优分配)为:
n =n Nh1Sh1/∑Nh1Sh1 l=1,2,3,4
h1 h
若暂时没有标准差资料,则可采用比例分配:
n =n Nh1/Nh l=1,2,3,4
h1 h
3)每个子层的最低样本量要求
为保证精度,样本量在按以上原则分配后,要求每个子层(即一个地区中的每个吨位层),最低样本量为5。凡是达不到此标准者,则取n =5,以此确定
h1
每个吨位层、地区以及全省的实际样本量。
3.3 层内抽样方法
对每个地区按标识吨位分成子层后,对各吨位层建立相应的抽样框。抽样框中的拖拉机按自然登记顺序即可。每个吨位层按以下两种方法中的一种抽取所需样本(为简便起见,每个子层拖拉机总数Nh1及所需样本量n 中的足标省略,分
h1
别记为N与n)。
3.3.1 简单随机抽样
对于有条件的地区,建议采用简单随机抽样,具体步骤如下:
1)从1到N的N个整数中等概率地产生n个不同的随机数。
2)n个随机数对应编号的拖拉机即为样本。
3.3.2 等距抽样
采用随机起点等距抽样抽取样本拖拉机,具体步骤如下:
1)确定抽样距离K
K=N/n
若N/n不是整数,则取K为最接近于N/n的整数。
2)确定随机起点r,在1-K间产生一随机数r。
+
3)以r为起点,每间隔K确定一辆拖拉机为样本单位。即编号为r,r K
+
,…,r (n-1)K对应的拖拉机为样本。
在各子层抽出样本后,随即进行编码。方法如下:给每个样本一个五位数编码,前两位数为地区代码,第三位数为子层代码,最后两位数为子层内样本序号代码,图示为:
<font size=+1>
样本编码:□ □ □ □ □
| | | | |
--- | ---
| | |
地区代码-- | |
| |
子层代码-- |
|
子层内样本序号代码--
</font>
3.4 地区层内按吨位事后分层方法
对于因特殊情况,无法在要求时间内建立吨位层抽样框的地区,在征得省级抽样调查机构同意后,可对地区层内的所有拖拉机按3.3.1或3.3.2的方法一次抽取样本,其样本量应在分配给该地区的样本量的基础上增加10%。
4 调查方法
4.1 调查方式
调查方式以调查员访问业主直接填写调查表的访户调查为主。在个别样本的“调查半径”(调查员办公所在地与样本业主居住地间的距离)太长或因气候、自然灾害等特殊原因不便访户者,也可用发函调查的方式。发函调查样本数占样本总体的比例应尽量少一些。
4.2 调查时间的确定
将每个地区的样本随机(基本)均分为三组称为“样本组”,以A,B,C表示。把样本组分别安排到调查月的上、中、下旬(称为“时间段”),调查访问日(调查员访问业主的日期,由调查员在该时间段内任定)前10天内最近两个工作日的运输情况,如果这10天内样本拖拉机未工作,则调查表中有关指标为零;同时要调查访问日前10天内未工作的日数。
如果调查期为1个月以上,在以后各月中可依序变换三个样本组的调查时间段。变换方式如下(以调查期3个月为例):
<font size=+1>
上旬 中旬 下旬
---------------------------
1 | A B C
|
2 | C A B
|
3 | B C A
|
</font>
4.3 抽样总体的修正
对虽属抽样调查范围,但未能纳入运输管理而无法编入抽样框的拖拉机,可采用通过典型调查等形式取得未纳入管理部分占全部拖拉机的比重数,以修正运输拖拉机总体数量(具体组织方法见附录一)。
4.4 指标解释
有关指标的定义及计算方法,按有关规定执行。
5 数据处理程序与方法
5.1 调查表的审核与数据录入
样本拖拉机调查表收集齐全以后,应逐级进行审核,包括登记的内容是否完整,计算是否正确,对发现的问题要及时进行澄清与纠正。
经审核的调查表,以地区为单位按统一的数据库设计要求进行数据录入。为保证录入质量,应进行逻辑检查与统计检查,以便及时发现并纠正录入中的问题。经检查后的数据以软盘形式提交给省进行统一汇总与处理。原始调查表及有关数据资料(含软盘)保存五年。
5.2 全省数据汇总
全省按统一规定的公式对样本资料进行汇总,汇总内容主要是对每个调查指标的推总估计及相应的精度估计,后者以估计量的方差或标准差给出。
数据处理的顺序是先对每个样本拖拉机指标量进行计算,再按吨位层、地区层,最后对全省数据进行汇总。地区所需资料由省反馈。
5.3 数据处理公式
5.3.1 记号
h,h=1,2,…,L,地区层编号,其中L为省内地区数;
1,1=1,2…,m吨位层编号,其中m为吨位层数;
i,i=1,2,…,n ,吨位层内样本拖拉机编号,其中n 为h1
h1 h1
层实际样本量;
N,全省拖拉机总数(总体大小);
L
Nh,第h地区拖拉机总数, ∑ Nh=N;
h=1
m
Nh1,第h地区1吨位层拖拉机总数, ∑ Nh1=Nh;
l=1
y ,样本拖拉机特定指标值和,X ,样本拖拉机标记吨位;
hli hli
∧
Yh1,Yh1,h地区1吨位层指标总量及其估计量;
∧
Yh,第h地区指标总量的估计X ,h1层拖拉机总吨位;
h1
∧
Y,全省指标总量的估计;
v(·),估计量的方差估计;
-----
s(·)=√ v(·)
5.3.2 每个样本拖拉机调查月内指标总和y 的计算
hli
调查工作日 过去10天内
内的指标和 未工作日数 调查月内
y =----------×〔1-------〕× (1)
hli 调查工作日数 10 日历天数
5.3.3 地区吨位层内Yh1的估计及其精度估计
样本拖拉机平均指标量
n
_ 1 h1
y =--- ∑ y (2)
h1 n i=1 hli
h1
样本拖拉机平均吨位
n
_ 1 h1
X =--- ∑ X (3)
h1 n i=1 hli
h1
_
y
∧ h1 ∧
Yh1=---X =Rh1Xh1 (4)
_ h1
X
h1