线性相关性分析在测风数据处理上的应用论文_张伟,平新玮

新疆新能源研究院有限责任公司

引言

根据国标GB/T18709-2002,即“风电场风能资源测量方法”,风电场现场测风应连续进行,不应少于一年;并且现场采集的数据完整率应在98%以上。补充和调整的方式一般有两种,一种是用下一年同一时段的风资源实测数据来补充,另一种就是可以用线性相关性分析的方法来进行补充和调整。

一、线性相关性分析原理

下面举例说明线性相关性分析的原理,(表1)是两个变量的两组样本值。

可以作出其散点图观察其相关性,作其散点图如下(图1)

从散点图可看出这12个点基本在一条直线附近,说明这两个变量之间存在线性相关关系,此关系可以用函数表示为:

其中: 为因变量, 为自变量, 和 为待估参数;

由于样本点并不完全在这一条直线上,它们和估计值之间有一定的差距,记:

式子描述了当用函数 来模拟这些样本点的时候,实测值与用此方程估计值之间的差距,其中 为实测值, 为估计值,由于在此过程中 可正可负,不能认为 的总偏差 越小或等于零时,函数 就最好的反映了两个变量之间的关系,因为总偏差很小。需要对此参数进行改进,可以考虑用 来代替 ,但是由于绝对值不易于进行微分运算,因此改用 代替 来度量总的偏差,因为偏差的平方和最小可以保证每个偏差都不会很大,于是最终要解决的问题就变为确定 中的常数 和 ,使得: 最小,其中 和 的确定要用到最小二乘法。

二、最小二乘法

现在可以把 展开为:

,即 为关于 和 的函数,其极值点在 关于 和 的偏导数为零的时候取得,即当: , 成立时, 取得其极值,因根据第一部分的讨论 没有极大值或者说起极大值为无穷大,故 在其偏导数为零时的极值必为其最小值。

根据: 可以求得 和 ,

其中: ,根据此二式就可以估计出未知参数 和 ,在此例中 , ,即估计的线性方程为: ,而这种估计参数的方法就叫做最小二乘法。

三、检验

显著性检验也是假设检验的一种形式,在假设检验中需要构造统计量才能进行检验,在这里构造的统计量为样本相关系数:

,其中 , 分别为两组样本均值,并且 ,当 时,所有样本点在一条上升或下降的直线上;当 时,随 的增加 有线性增加的趋势,此时称正相关;当 时,随 的增加 有线性减少的趋势,此时称负相关; 时,样本点可能毫无规律,也可能成某种曲线趋势,此时称不相关。

参考文献

[1]概率与数理统计教程,茆诗松,程依明,濮小龙编著,高等教育出版社

[2]风电场工程技术手册,宫靖远主编,机械工业出版社

[3]新疆维吾尔自治区风能资源评价报告,新疆气象局

论文作者:张伟,平新玮

论文发表刊物:《建筑学研究前沿》2018年第16期

论文发表时间:2018/11/1

标签:;  ;  ;  ;  ;  ;  ;  ;  

线性相关性分析在测风数据处理上的应用论文_张伟,平新玮
下载Doc文档

猜你喜欢