注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Bioinformatics home

 
 
 

日志

 
 

统计学习一  

2009-11-23 10:22:17|  分类: 生物统计 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

决定了,从今天开始每天开始学习统计。抓住有老师的机会,正确学会统计,恶补下数学方面的知识。一个积累正在开始,每天学习新得和些许内容记录于博客。

1.变数的次数分布

 概念

  连续性变数: 任两个变量之间都可能出现只有微量差异的第三个变量的一类变数,例如株高,穗长等

间断性变数:其变量只能取整数的一类变数。例如:每株蘖数

不论连续性变数或间断行变数,它们的出现都是有着一定的数量范围的,如果我们将其可能出现的整个范围分成若干个互斥的组区间,再来统计出现在各个组区间的变量个数(次数),则可发现,表面上杂乱无章的变数,都是有着一定的分布规律的。

不同区间变量出现的次数组成的分布,就叫变数的次数分布

极差:R=max(Y1,Y2, Y3, ... Yn) - min(Y1,y2,Y3, ... Yn)

组数: 指准备将变数出现的整个数量范围分成多少个组区间

组区间极差(组距)i:i 近似值为 R/(组数-1)

次数分布图:次数分布以图的表示叫做 次数分布图

通常以次数数列为横坐标,次数为为纵坐标。 有方柱图 和 折线图 两种。 用面积来表示各组区间内的变量的多少。

一般情况下,次数分布以方柱图表示较佳,但是如果在一副图上同时表示几个次数分布,则宜用折线图。但间断性变数的次数分布通常不用折线图,因为其组与组之间是不连续的。

 

一般应使 纵坐标长对横坐标长的比例为(4~5):(5~ 6)较为合适

 

频率分布和累积频率分布

  频率分布: 变量在各组区间内出现的频率所构成的分布,叫频率分布。==各组的次数 f 除以样本容量 n得出

累积频率:小于某一指定值的变量出现的频率。

累积频率分布:累计频率所构成的分布则叫累计频率分布或简称累积分布。

凡是累积分布呈"S"形的,其原始分布基本上都是有一中心而左右对称的,这种分布的一中理论模式叫正态分布

  评论这张
 
阅读(650)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017