LINEST
LINEST関数は、最小二乗法を使用して、指定されたデータに最もよく当てはまる直線に対する統計の配列を返します。
LINEST(既知のy範囲, 既知のx範囲, y切片(0以外), 補正項)
既知のy範囲: 既知のyの値を含む集合。 既知のy範囲は、数値または日付/時刻値のいずれかを含む必要があります。既知のxの値の集合が1つしかない場合、「既知のy範囲」は任意のサイズにすることができます。既知のxの値の集合が複数ある場合、「既知のy範囲」は、値を含む1つの列か値を含む1つの行のいずれかにすることができますが、両方にすることはできません。
既知のx範囲: 既知のxの値を含む集合(オプション)。 既知のx範囲は、数値または日付/時刻値のいずれかを含む必要があります。省略した場合、「既知のy範囲」と同じサイズの1から始まる集合とみなされます。例えば、「既知のy範囲」のサイズが3の場合は「1, 2, 3」とみなされます。既知のxの値の集合が1つしかない場合、指定されている場合は、「既知のx範囲」を「既知のy範囲」と同じサイズにする必要があります。既知のxの値の集合が複数ある場合、「既知のx範囲」のそれぞれの行や列は1つの集合とみなされ、それぞれの行や列のサイズは「既知のy範囲」の行や列のサイズと同じである必要があります。
y切片(0以外): y切片(定数b)の計算方法を指定するモード値(オプション)。
通常(1、TRUE、または省略): y切片(定数b)が通常通り計算される値。
強制的に0にする(0、FALSE): y切片(定数b)が強制的に0になる値。
補正項: 追加の統計情報を返すかどうかを指定するモード値(オプション)。
補正項なし(0、FALSE、または省略): 返される配列に追加の回帰統計を返しません。
補正項(1、TRUE): 返される配列に追加の回帰統計を返します。
参考
この関数によって返される値は、配列に入れられます。配列内の値を読む方法の1つは、INDEX関数を使用することです。次のように、LINEST関数をINDEX関数でラップすることができます: 「=INDEX(LINEST(既知のy範囲, 既知のx範囲, y切片, 補正項), y, x)」。ここで、yとxは、使用する値の列と行のインデックスです。
追加の統計が返されない(「補正項」がFALSEである)場合、返される配列は1つの行の深さです。列の数は、「既知のx範囲」の集合の数に1足した数に等しくなります。これには、線の傾き(x値の行や列ごとに1つの値)が逆順で含まれ(最初の値がx値の最後の行や列に関連します)、次にbの値、切片が含まれます。
追加の統計が返される(「補正項」がTRUEである)場合、配列には5つの行が含まれます。詳しくは、例のあとにある配列の追加情報を参照してください。
例 |
---|
「既知のy範囲」(セルA2:A6)および「既知のx範囲」(セルB2:B6)を含む、次のような表があるとします: |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
「=INDEX(LINEST(A2:A6, B2:B6, 1, 0), 1)」は、「y切片(0以外)」を通常の(1)値として、約0.752707581227437を返します。最適な直線の傾きです。INDEXが返す配列の最初の値が求められ、かつ「既知のx範囲」の集合が1つだけ指定されているためです。 「=INDEX(LINEST(A2:A6, B2:B6, 1, 0), 2)」は約0.0342960288808646を返します。これはb、つまり最適な直線の切片です。この切片が返されるのは、INDEXが返す配列の2番目の値が指定されていたためです。これが2番目の値になるのは、「既知のx範囲」の集合が1つだけ指定されているためです。 |
追加統計の配列の内容
LINESTには、この関数によって返される追加の統計情報を含めることができます。次の説明のために、既知のyの値のほか、既知のxの値の5つの集合があると仮定します。さらに、「既知のx範囲」は5つの表の行または5つの表の列にあると仮定します。これに基づいて、LINESTが返す配列には次の値が含まれます。
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | b |
2 | SE5 | SE4 | SE3 | SE2 | SE1 | SEb |
3 | C | SEy | ||||
4 | F | DF | ||||
5 | R1 | R2 |
行1、列1にはS5(「既知のx範囲」の5番目の集合の傾き)が含まれ、列5まで続きます。行1、列5にはS1(「既知のx範囲」の1番目の集合の傾き)が含まれます。「既知のx範囲」の各集合に関連する傾きが逆順で返されることに留意してください。
行1の最後のセルには、既知のx値の切片であるbが含まれます。この例では、これは行1列6になります。
行2、列1にはSE5(「既知のx範囲」の5番目の集合に関連付けられた係数の標準エラー)が含まれ、列5まで続きます。行2、列5にはSE1(「既知のx範囲」の1番目の集合に関連付けられた係数の標準エラー)が含まれます。値は逆順に返されます。つまり、既知のxの値の集合が5つある場合は、5番目の集合の値が配列内で最初に返されます。これは、傾きの値が返される順序と同じです。
行2の最後のセルには、y切片の値(b)に関連付けられた標準エラーであるSEbが含まれます。この例では、これは行2列6になります。
行3、列1には決定係数Cが含まれます。この統計は、予測されるyの値と実際のyの値を比較します。1の場合、予測されるyの値と実際のyの値に相違はありません。これは完全相関と呼ばれています。決定係数が0の場合、相関はなく、指定された回帰方程式は特定のyの値の予測には使用できません。
行3、列2にはSEy(y値の予測に関連付けられた標準エラー)が含まれます。
行4、列1にはF(F測定値)が含まれます。F測定値は、従属変数と独立変数の測定された関係が偶然発生するかどうかを調べるために使用できます。
行4、列2にはDF(自由度)が含まれます。自由度統計は、信頼水準の決定に使用します。
行5、列1にはR1(回帰平方和)が含まれます。
行5、列2にはR2(残差平方和)が含まれます。
追加統計の配列に関して留意する点がいくつかあります。
行または列に既知のxの値と既知のyの値があるかどうかは、問題ではありません。どちらの場合でも、返される配列は、表に示されているような順序になります。
この例では、既知のxの値の5つの集合があると仮定しました。5つより多いか少ない場合、返される配列の列の数はそれに応じて変わります(常に、既知のxの値の数に1足した数に等しくなります)。ただし、行の数は一定のままになります。
追加の統計をLINESTに対する引数に指定しない場合、返される配列は最初の行のみに等しくなります。