高中数学必修3知识点总结:第二章 统计
归海木心QQ:634102564
高中数学必修3知识点总结
第二章统计
2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随
机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:
(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:
(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签
(3)对样本中的每一个个体进行测量或调查
例:请调查你所在的学校的学生做喜欢的体育活动情况。5.随机数表法:
例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
2.1.2系统抽样
1.系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)
前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
2.1.3分层抽样
1.分层抽样(类型抽样):归海木心QQ:6341025归海木心QQ:634102564
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:
1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
分层标准:
(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。
(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。(3)以那些有明显分层区分的变量作为分层变量。3.分层的比例问题:
(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。
2.2.2用样本的数字特征估计总体的数字特征
1、本均值:xx1x2xnn
2、.样本标准差:ss2(x1x)(x2x)(xnx)n222
3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估
计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍(3)一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用;“去掉一个最高分,去掉一个最低分”中的科学道理归海木心QQ:6341025归海木心QQ:634102564
2.3.2两个变量的线性相关
1、概念:
(1)回归直线方程(2)回归系数2.最小二乘法
3.直线回归方程的应用
(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系
(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到
个体Y值的容许区间。
(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中
NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。
4.应用直线回归的注意事项
(1)做回归分析要有实际意义;(2)回归分析前,最好先作出散点图;(3)回归直线不要外延。
归海木心QQ:6341025
扩展阅读:高中数学必修3_第二章_统计_总结学生版
第二章统计
一、随机抽样三种常用抽样方法:
1.简单随机抽样:
设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。(1)抽签法
制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;
抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。(2)随机数表法
编号:对总体进行编号,保证位数一致;
数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。
成样:对应号签就得到一个容量为n的样本。
结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;
②基于此,简单随机抽样体现了抽样的客观性与公平性;
③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。2.系统抽样:
当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。
系统抽样的步骤可概括为:
(1)将总体中的个体编号。采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。为将整个的编号进行分段,要确定分段的间隔k.当N/n是整数时,k=n/N;当N/n不是整数时,通过从总体中剔除一些个体使剩下的个体数N能被n整除,这时k=N’/n;
(3)确定起始的个体编号。在第1段用简单随机抽样确定起始的个体边号l;(4)抽取样本。按照先确定的规则(常将l加上间隔k)抽取样本:
l,lk,l2k,,l(n1)k。
3.分层抽样:
当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。
结论:
(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于n/N;
(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践的应用更为广泛。
例题:
【例1】某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20
人,用下列哪种方法最合适
A.系统抽样B.简单随机抽样C.分层抽样D.随机数表法【例2】为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为
A.40B.30C.20D.12
【例3】从N个编号中要抽取n个号码入样,若采用系统抽样方法抽取,则分段间隔应为
A.Nn④整个抽样过程中,每个个体被抽取的机率相等(有剔除时例外)A.1B.2C.3D.4
【例6】一批灯泡400只,其中20W、40W、60W的数目之比为4∶3∶1,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为______________.答案:20、15、5
【例7】从总体为.的一批零件中用分层抽样抽取一个容量为30的样本,若每个零件被抽取的机率为0.25,则N等于
B.nC.[
Nn]D.[
Nn]+1
A.150B.200C.120D.100
【例4】系统抽样适用的总体应是
A.容量较少的总体B.总体容量较多C.个体数较多但均衡的总体D.任何总体【例5】下列说法正确的个数是
①总体的个体数不多时宜用简单随机抽样法
②在总体均分后的每一部分进行抽样时,采用的是简单随机抽样③百货商场的抓奖活动是抽签法
【例8】一个总体的60个个体的编号为0,1,2,…,59,现要从中抽取一个容量为10的样本,请根据编号按被6除余3的方法,取足样本,则抽取的样本号码是______________
【例9】体育彩票000001~100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的是系统抽样法吗?为什么?
【例10】某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为1201*人,其中持各种态度的人数如下表所示.
很喜爱喜爱一般不喜爱2435456739261072体数据信息就被抹掉了。
〈三〉频率分布折线图、总体密度曲线1.频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2.总体密度曲线的定义:
电视台为了了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中各应抽选出多少人?
二、用样本估计总体
〈一〉频率分布的概念:
在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布
统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取
直方图反映样本的频率分布。其一般步骤为:
值的百分比,它能给我们提供更加精细的信息。
计算一组数据中最大值与最小值的差,即求极差
根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密
1、决定组距与组数2、将数据分组3、列频率分布表4、画频率分布直方图
〈二〉频率分布直方图的特征:
1、从频率分布直方图可以清楚的看出数据分布的总体趋势。
2、从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具
度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。
总体分布密度密度曲线函数y=f(x)的两条基本性质:①f(x)≥0(x∈R);②由曲线y=f(x)与x轴围成面积为1。茎叶图
茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则:书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点:图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点:同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。通过此操作,很容易求出各个数据段的频率分布或频率百分比。下面我们通过几个例子来阐述上述问题。
1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最
1平均数:一组数据的算术平均数,即x=
2从频率分布直方图中估计众数、中位数、平均数:
众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,(1)课本中调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如上图(较细的虚线)所示;
(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。此数据值为2.02t。
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。由图估计平均数为2.02t。(较粗的虚线);
3三种数字特征的优缺点:
(1)、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。
(2)、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响。
中间两个数据的平均数)叫做这组数据的中位数。n
(x1x2xn)(3)、平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大。
4:方差、标准差(1)方差的计算公式:(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(2)标准差的计算公式:
(3)方差和标准差的意义:用于考察样本数据的分散程度的大小,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。
例题:
频率0.036/组距【例1】为了了解高一学生的体0.032能情况,某校抽取部分学生进行0.0280.024一分钟跳绳次数次测试,将所得0.0200.016数据整理后,画出频率分布直方0.012图(如图),图中从左到右各小长方0.0080.004形面积之比为2:4:17:15:9:
次数
o901001101201*01401503,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
52】某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6hB.0.9hC.1.0hD.1.5h
【例3】把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.
【例4】某班学生在一次数学考试中成绩分布如下表:
【例分数段人数分数段人数分数段人数[0,80)2[100,110)8[130,140)4[80,90)5[90,100)6[120,130)6(3)估计电子元件寿命在100~400h以内的概率;(4)估计电子元件寿命在400h以上的概率.
)[110,1201*[140,150)2例38从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm)设计了如下茎叶图:甲7785539573543454102103122728293031323335424201*563237526乙54767898那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_____、_______(精确到0.01).
【例5】对某电子元件进行寿命追踪调查,情况如下:寿命(h)100~200个数20201*00~300~400400~500500~600根据以上茎叶图,对甲乙两品种棉花的纤维长度作比较,写出两个统计结论:
①_______________________________________________________________________________②________________________________________________________________________________
30804030
(1)列出频率分布表;
三、变量间的相关关系
(2)画出频率分布直方图和累积频率分布图;
1、相关关系的概念:
自变量取值一定时,因变量的取值带有一定的随机性,则两个变量之间的关系
数a、b叫做相关关系.
2、ATTENTION
数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定
的公式:bnni(xi1nx)(yiy)ixi1ni1iyinxy2i(xi1x)2xnx2,
aybx⊙求回归直线方程的步骤:
(1)将已知的数据列表,列出x,y,并求出x2,y2,xy.
性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是
n(2)利用公式b=xiyinxyi1,a=y-bx,计算回归系数b,a.
两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系,
(二)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.
(三)在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大
ni1xinx22(3)写出回归直线方程y=bx+a.例题:
【例1】有关线性回归的说法,不正确的是
A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程
量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.
【例2】下面哪些变量是相关关系
3、最小二乘法:
A.出租车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁的大小与质
回归直线的定义,使离差的平方和Q=(yiabxi)2最小的那条直线,这种使
i1n量
=1.5x-15,则【例3】回归方程y“离差的平方和为最小”的方法叫做最小二乘法,要掌握用最小二乘法求回归直线系
A.y=1.5x-15B.15是回归系数aC.1.5是回归系数aD.x=10时,y=0【例4】r是相关系数,则结论正确的个数为
①r∈[-1,-0.75]时,两变量负相关很强②r∈[0.75,1]时,两变量正相关很强
③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般④r=0.1时,两变量相关很弱
A.1B.2C.3D.4
=bx+a过定点________.【例5】线性回归方程y
【例8】某市近10年的煤气消耗量与使用煤气户数的历史资料如下:
年份1993199419951996199719981999201*201*201*x用户(万户)11.21.61.822.53.244.24.5y(百万立方米)679.81212.114.5202425.427.5(1)检验是否线性相关;(2)求回归方程;
(3)若市政府下一步再扩大5千煤气用户,试预测该市煤气消耗量将达到多少.
=4.4x+838.19,则可估计x与y的增长速度之比约为:【例6】已知回归方程y【例7】为研究某市家庭平均收入与月平均生活支出的关系,该市统计调查队随机调查10个家庭,得数据如下:家庭编号12345678910
【例9】有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过
xi(收入)千元0.81.11.31.51.51.82.02.22.42.8y(千元0.71.01.21.01.31.51.31.72.02.5i支出)求回归直线方程.
统计,得到一个卖出的饮料杯数与当天气温的对比表:
摄氏温-5度热饮杯15615013212813011610489数(1)画出散点图;
(2)从散点图中发现气温与热饮杯数之间关系的一般规律;(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数。
【例10】一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人.为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?
93765404712151923273136【例11】某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.按照分层抽样方法抽取样本,各种血型的人分别多少?写出抽样过程.
【例12】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下:
零件数x(个)加工时间y(分钟)(1)画出散点图;(2)求回归方程;
(3)关于加工零件的个数与加工时间,你能得出什么结论?
1062206830754081508960957080102108
《统计》单元测试题
一、选择题:(本题共14小题,每小题4分,共56分,在每小题给出的四个选项
中,只有一项是符合题目要求的)1、抽样调查在抽取调查对象时
A、按一定的方法抽取B、随意抽取
C、全部抽取D、根据个人的爱好抽取2、对于简单随机抽样,下列说法中正确的命题为
①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种方法抽样的公平性。
A、①②③B、①②④C、①③④D、①②③④3、某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。则完成(1)、(2)这两项调查宜采用的抽样方法依次是
A、分层抽样法,系统抽样法B、分层抽样法,简单随机抽样法C、系统抽样法,分层抽样法D、简单随机抽样法,分层抽样法4、某小礼堂有25排座位,每排有20个座位。一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下了座位号是15的所有的25名学生测试。这里运用的抽样方法是
A、抽签法B、随机数表法C、系统抽样法D、分层抽样法
5、我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为
A、45,75,15B、45,45,45C、30,90,15D、45,60,30
6、中央电视台动画城节目为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众。现采用系统抽样方法抽取,其组容量为A、10B、100C、1000D、100007、对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的可能
性为25%,则N为
A、150B、200C、100D、1208、某中学有高级教师28人,中级教师54人,初级教师81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是A、简单随机抽样B、系统抽样
C、分层抽样D、先从高级教师中随机剔除1人,再用分层抽样9、一个容量为35的样本数据,分组后,组距与频数如下:5,105个;10,1512个;则样本在区间20,15,207个;20,255个;25,304个;30,352个。上的频率为
A、20%B、69%C、31%D、27%10、在用样本估计总体分布的过程中,下列说法正确的是
A、总体容量越大,估计越精确B、总体容量越小,估计越精确C、样本容量越大,估计越精确D、样本容量越小,估计越精确11、下列对一组数据的分析,不正确的说法是A、数据极差越小,样本数据分布越集中、稳定B、数据平均数越小,样本数据分布越集中、稳定
C、数据标准差越小,样本数据分布越集中、稳定D、数据方差越小,样本数据分布越集中、稳定12、下列两个变量之间的关系是相关关系的是
A、正方体的棱长和体积B、单位圆中角的度数和所对弧长C、单产为常数时,土地面积和总产量D、日照时间与水稻的亩产量13、对于给定的两个变量的统计数据,下列说法正确的是
A、都可以分析出两个变量的关系B、都可以用一条直线近似地表示两者的关系C、都可以作出散点图D、都可以用确定的表达式表示两者的关系14、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在
2700,3000的频率为
频率/组距0.0010240027003000330036003900体重A、0.001B、0.1C、0.2D、0.3
二、填空题:(本题共6小题,每小题4分,共24分,请把答案填写在横线上)15、若总体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35
条鱼。
20、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,则时速在
60的样本,分段时应从总体中随机剔除个个体,编号后应均分为50,的汽车大约有辆。
段,每段有个个体。
16、某工厂生产的产品用传送带将其送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品检测,则这种抽样方法是。17、某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2:3:5。现用分层抽样的方法抽出一个容量为n的样本,样本中A种型号的产品共有16件,那么此样本的容量n件。
18、数据x1,x2,,x8平均数为6,标准差为2,则数据
2x16,2x26,,2x86的平均数为,方差为。
三、解答题:(本题20分,解答应写出文字说明或演算步骤.)
21、为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组数如下:
10.75,10.853;10.85,10.959;10.95,11.0513;11.05,11.1516;;11.25,11.3520;11.35,11.457;11.45,11.554;
11.15,11.252611.55,11.652;
(1)列出频率分布表(含累积频率);
(2)画出频率分布直方图以及频率分布折线图;
(3)据上述图表,估计数据落在10.95,11.35范围内的可能性是百分之几?(4)数据小于11.20的可能性是百分之几?
19、管理人员从一池塘内捞出30
0.4条鱼,做上标记后放回池塘。10
0.3天后,又从池塘内捞出50条鱼,其中有标记的有2条。根据以上
0.20.1频率
4050607080时速0数据可以估计该池塘内共有
高考真题体验:样本数字特征专项
一、选择题
1.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~
106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A.90B.75C.60D.45
3.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图2).从图2中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是()A.48米B.49米C.50米D.51米
4.一个容量100的样本,其数据的分组与各组的频数如下:组别(0,10]频数12
18岁的男生体重(kg),得到频率分布直方图如下:
频率
组距0.070.05
0.03(10,20](20,30](30,40](40,50](50,60](60,70]13241516137则样本数据落在(10,40]上的频率为()
A.0.13
B.0.39
C.0.52
D.0.64
体重(kg)
54.556.558.560.562.564.566.568.570.572.574.576.564.5的学生人数是()根据上图可得这100名学生中体重在56.5,A.20
B.30
C.40D.50
频率组距5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()
A.91.5和91.5B.91.5和92C.91和91.5D.92和92
897
9316402
频率/组距0.1500.1250.1000.0750.050O9698100102104106克
6.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()(A)
2某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品
65(B)
65(C)2(D)2
7.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为()
分数人数520410330230102%1%净重的范围是[96,0.5%30313233
图2
48495051
水位(米)
D.两个批次总体平均数与标准值接近程度不能确定
A.3B.
2105C.3D.
85二、填空题
12下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为,数据落在[2,10)内的概率约为
13.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95),由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量
8.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90899095939493
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()(A)92,2(B)92,2.8(C)93,2(D)93,2.8
9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3
10.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则xy的值为()A.1
B.2
C.3
D.4
频率/组距0.0400.035在[55,75)的人数是.
0.03014.某个容量为100的样本的频率分0.0255上的数0.020布直方图如下,则在区间4,0.015据的频数0.010..为.
0.0050455565758595图3
产品数量
11.设矩形的长为a,宽为b,其比满足b:a512≈0.618,这种矩形给人以美
感,称为黄金矩形.黄金矩形常用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()
B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同
频数123101A.甲批次的总体平均数与标准值更接近频率组距
15.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:
100分组90,0.090.08110110,1201*0,130100,140130,150140,0.030.022610141822样本数据
则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的%.16.某棉纺厂为了解一批棉花的质量,从中频率随机抽测了100根棉花纤维的长度(棉花
组距甲3755548733948557427282930313233342351021031424201*6乙0.060.05数据均在区间[5,40]中,其频率分布直方
0.04图如图所示,则在抽样的100根中,有0.03棉花纤维的长度小于20mm.0.0217.某校开展“爱我海西、爱我家乡”摄0.01纤维的长度是棉花质量的重要指标).所得影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的
563237556882479670510152025303540长度(mm)作品A89923x214甲乙9819710132021424115302089根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①;②20.某高校有甲、乙两个数学建模兴趣班,其中甲班40人,乙班50人,现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是分21从一堆苹果中任取5只,称得它们的质量如下(单位:克):125124121123127则该样本标准差s(克)(用数字作答).22.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是.23.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生甲班乙班1号662号772x)无法看清.若记分员计算无误,则数字x应该是
18.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数.则这10天甲、乙两和.
人日加工零件的平均数分别为19.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280285285287292294295301303303307308310314319323325325328331334337352乙品种:284292295304306307312313315315316318318320322322324327329331333336337343356由以上数据设计了如下茎叶图
3号764号875号79则以上两组数据的方差中较小的一个为s.三、解答题
24.(本小题满分12分)
某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示:分组频数频率[500,900)48[900,1100)121[1100,1300)208[1300,1500)223[1500,1700)193[1700,1900)165[1900,25.(本小题满分12分)
某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397397,400,401,401,403,406,407,410,412,415,416,422,430(I)完成所附的茎叶图;(II)用茎叶图处理现有的数据,有什么优点?
(III)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.12分
)42(I)将各组的频率填入表中;
(II)根据上述统计结果,计算灯管使用寿命不足1500小时的频率;
(III)该公司某办公室新安装了这种型号的灯管3支,若将上述频率作为概率,试求至少有2支灯管的使用寿命不足1500小时的概率.
26.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;
(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概甲班
2181
乙班
99101703689率.
883216258
8159
友情提示:本文中关于《高中数学必修3知识点总结:第二章 统计》给出的范例仅供您参考拓展思维使用,高中数学必修3知识点总结:第二章 统计:该篇文章建议您自主创作。
来源:网络整理 免责声明:本文仅限学习分享,如产生版权问题,请联系我们及时删除。