2)等距PPS抽样
在对层内船舶吨(客)位累加后,计算抽样间距K,K是最接近X/n的整数。在1~K范围产生一个随机数r,则代码r,r+K,…,r+(n-1)K所对应的船为抽中的样本船。例如,在例3中,X/n=300/3=100。在1~100中产生一个随机数,不妨设为89,则代码为89,189,289的船,也即第4,7,10号船为抽中的样本船。
在各子层抽出样本船后,随即进行编码。方法如下:对每个样本给出一个七位数编码,前两位数为地区编码,第三位数为营业性代码,第四位数为船型代码,第五位数为部门分类代码,最后两位为子层内样本序号代码,图示为:
<font size=+1>
样本编码:□ □ □ □ □ □ □
| | | | | | |
--- | | | ---
| | | | |
地区代码-- | | | |
| | | |
营业性质代码---- | | |
| | |
船型代码---- | |
| |
部门分类代码---- |
|
子层内样本序号代码----
</font>
注:部门分类指交通部门、非交通部门和个体,仅作事后统计用,不作为分层标识,故子层内样本序号不需按部门分列。
4 样本调查方法
4.1 在规定的调查时间内,分发调查表。
1)对成建制单位,给被调查船舶的单位发调查表;
2)对非成建制单位的样本船舶,调查员上户访问登记;
3)对长期在外的样本船舶,亦可采用邮寄调查表方式调查样本。
4.2 调查时间的确定
对样本船舶调查两个航次。调查表分发到样本船舶后,样本船舶在此之前完成的最近两个航次(航次指船舶完成一个完整的运输生产过程;即以上一次货物卸空〈旅客下完〉开始,到本次货物卸空〈旅客下完〉为止的整个过程)为调查航次。
对从事短途运输的船只,若两天内完成的航次在两个以上时,则调查访问日前10天内最近两天完成的全部航次的运输情况,如果这10天中样本船未工作,则调查表中有关指标为零;同时调查访问日前10天内样本船未工作天数。
4.3 指标解释
有关指标的定义及计算方法,按有关规定执行。
5 数据处理程序与公式
5.1 调查表的审核与数据录入
样本船舶调查表收集齐全以后,应逐级进行审核,包括登记的内容是否完整,计算是否正确。对发现的问题要及时进行澄清与纠正。
经审核的调查表,以地区为单位按统一的数据库设计进行数据录入。为保证录入质量,应按数据库中规定的检查程序进行逻辑检查与统计检查,以便及时发现并纠正有关数据问题,经检查后的数据以软盘形式提交给省进行统一汇总与处理。有关数据资料(含软盘)保存5年。
5.2 全省调查月数据汇总
省内统一按规定的公式对样本资料进行汇总,汇总内容主要是:对每个调查指标的推总估计及相应的精度估计。后者以估计量的方差或标准差给出。
数据处理的顺序是:先对每条样本船指标量进行计算,再按子层、地区层,最后对全省进行汇总。地区推总数据资料由省反馈。
5.3 数据处理公式
5.3.1 记号
h,h=1,2,…L,地区层编号,其中L为省内地区数;
l,l=1,2,…,m,子层编号,其中m为子层数;
i,i=1,2,…,n ,子层内样本船编号,其中n 为h1层实际
h1 h1
样本量;
N,全省船舶总数(总体大小);
L
Nh,第h地区船舶总数, ∑ Nh=N
h=1
m
Nh1,第h地区1子层船舶总数, ∑ Nh1=Nh
l=1
y ,样本船舶特定指标值和,X ,样本船舶标记吨客位;
hli hli
∧
Yh1,Yh1,h地区1子层指标总量及其估计量;
∧
Yh,第h地区指标总量的估计Xh1,h1层船舶总吨客位;
∧
Y,全省指标总量的估计;
v(·),估计量的方差估计;
-----
s(·)=√ v(·),估计量的标准差估计。
5.3.2 每个样本船舶调查月内指标和yhli的计算
y =两个航次的指标和/两个航次日数×调查月内日历天数
hli (1)
对于专门从事短途运输,调查2天内全部航次的:
2天内所有 过去10天内
航次的指标和 未工作日数 调查月内
y =------×〔1-------〕× (1)′
hli 2 10 日历天数
5.3.3 地区子层内Yh1的估计及其精度估计
A对子层内抽样采用无关标识排队,随机起点等距抽样或简单随机抽样的情形:
样本船平均指标量
n
_ 1 h1
y =--- ∑ y (2)
h1 n i=1 hli
h1
样本船平均吨(客)位
n
_ 1 h1
x =--- ∑ X (3)
h1 n i=1 hli
h1
_
y
∧ h1 ∧
Yh1=---Xh1=Rh1Xh1 (4)
_
x
h1
n
_ h1
y ∑ y
∧ h1 i=1 hli
其中Rh1=---=------ (5)
_ n
x h1
h1 ∑ X
i=1 hli
f
∧ 2 1- h1 2 ∧2 2 ∧
v(Y h1)=N -----(S +R S -2Rh1
Syxh1) (6)
h1 n yh1 h1 xh1
h1
n
h1
其中f =---,(当f <2%时,1-f 可忽略) (7)
h1 Nh1 h1 h1
n
2 1 h1 _ 2
S =----- ∑ (y -y ) (8)
yh1 n -1i=1 hli h1
h1
2 1 nh1 _ 2
S =----- ∑ (X -X ) (9)
xh1 n -1i=1 hli h1
h1
n
1 h1 _ _
Syxh1=----- ∑ (y -y )(X -X )(10)
n -1i=1 hli h1 hli h1
h1
------
∧ / ∧
s(Yh1)=√ V(Yh1) (11)
B对子层内抽样采用PPS抽样情形:
n y
∧ Xh1 h1 hli
Yh1=---= ∑ ---- (2)′
n i=1x
h1 hli
n y
∧ 1 h1 Xh1 hli ∧ 2
v(Yh1)=--------∑ (--------Yh1) (6)′
n (n -1)i=1 x
h1 h1 hli
5.3.4 地区层Yh的估计及其精度估计
∧ m ∧
Yh= ∑ Yh1 (12)
l=1
∧ m ∧
v(Yh)= ∑ v(Yh1) (13)
l=1
-----
∧ / ∧
s(Yh)=√ v(Yh) (14)
注:若先按营业性或非营业性子层汇总,则可将地区内营业性和非营业性船舶的指标两者相加(包括估计量和方差),即得地区层相应指标。
5.3.5 全省Y的估计及其精度估计
∧ L ∧
Y= ∑ Yh (15)
h=1
∧ L ∧
v(Y)= ∑ v(Yh) (16)
h=1
----
∧ / ∧
s(Y)=√ v(Y) (17)
5.4 报告期指标的推算
报告期内并非每月都搞抽样调查时,用调查月资料推算报告期指标需结合波动系数,波动系数的求法有多种,常用的方法为:求当年交通部门相同指标的波动系数,公式为:
某指标未调查月份交通部门数
波动系数D=--------------
相同指标调查月份交通部门数
未调查月份指标值=D×调查月份指标值
报告期指标值=调查月份指标值+未调查月份指标值
各地区利用波动系数推算报告期指标,省对地区资料汇总。
5.5 软件
本方案对应的样本抽取方法和数据处理程序,配有微机上运行的软件(附使用说明书)。
附录:
附表1为简易抽样框格式,附表2为样本船简易台帐格式,附表3、4为调查表格式,供各地参考。各地可根据本地实际情况,制定调查员手册和调查表(可参见江苏省的资料);但总体登记台帐、样本船舶分类登记台帐、调查表的内容,不得少于本附录中的有关相应内容。