一、单项选择题(每题2分,共20分)
1.以下关于因变量与自变量的表述不正确的是( )
自变量的变化是以因变量的变化为前提
因变量是由于其他变量的变化而导致自身发生变化的变量
自变量是引起其他变量变化的变量
因变量的变化不以自变量的变化为前提
2.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为( )
5小时
6小时
5.5小时
6.5小时
3.以下关于条形图的表述,不正确的是( )
条形图中条形的宽度是固定的
条形图的矩形通常是紧密排列的
条形图中条形的长度(或高度)表示各类别频数的多少
条形图通常是适用于所有类型数
4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( )组
组别 |
按年龄分组(岁) |
工作人员数(人) |
1 |
20~24 |
6 |
2 |
25~29 |
14 |
3 |
30~34 |
24 |
4 |
35~39 |
18 |
5 |
40~44 |
12 |
6 |
45~49 |
18 |
7 |
50~54 |
14 |
8 |
55~59 |
6 |
|
合计 |
112 |
第3组
第4组
第5组
第6组
5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。
数学
语文
两门课程一样
无法判断散
6.在假设检验中,不拒绝虚无假设意味着( )
虚无假设是肯定正确的
虚无假设肯定是错误的
没有证据证明虚无假设是正确的
没有证据证明虚无假设是错误的
7.根据一个样本均值求出的90%的置信区间表明( )
总体均值一定落入该区间内
总体均值有90%的概率不会落入该区间内
总体均值有90%的概率会落入该区间内
总体均值有10%的概率会落入该区间内
8.在回归方程中,若回归系数等于0,这表明( )
因变量y对自变量x的影响是不显著的
自变量x对因变量y的影响是不显著的
因变量y对自变量x的影响是显著的
自变量x对因变量y的影响是显著的
9.中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为( )、方差为( )的正态分布。
μ,σ2
μ/n ,σ2/n
μ,σ2/n
μ/n,σ2
10.下列哪种情况不适合用方差分析( )
性别对收入的影响
年龄对收入的影响
专业对收入的影响
行业对收入的影响
二、名词解释(每题5分,共20分)
11.整群抽样
12. Z值
13.二维表
14.误差减少比例
三、简答题(每题10分,共30分)
15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的
(5)上月网购次数
16.简述什么是简单回归分析?其作用是什么?
17.如何对配对样本进行t检验。
四、计算题(共30分)
18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。
(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。
注: Z025=1.96
19.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表。请完成方差分析表。
变差来源 |
SS |
df |
MS |
F |
Sig. |
组间 |
A |
C |
320 |
F |
000 |
组内 |
6048 |
D |
E |
— |
— |
总计 |
B |
39 |
— |
— |
— |