엑셀을 이용한 통계 분석...펌

컴퓨터관련

엑셀을 이용한 통계 분석...펌

맘편한넘 2010. 12. 16. 10:32

[엑셀] 엑셀을 활용한 통계분석 1/2

DB & 분석 2010/08/04 17:20 Posted by A 마트 P.C

엑셀에서 통계분석을 하시려면, '분석도구'가 설치 되어 있어야 합니다.
보통은 설치 되어 있지 않으니 아래 순서로 클릭해 주세요.

엑셀 – 도구 – 추가기능 – 분석도구 첵크- 확인

CD가 필요 하실 수 도 있습니다.

MS에서 도구분석에 이용되는 통계분석 개념을 정리 해 놓은 내용
----------------------------------------------------------------------------------------------------------

Microsoft Excel은분석도구라불리는데이터분석도구의집합을제공합니다. 복잡한통계또는공학분석을전개할때단계를절약하기위해사용할수있습니다. 각각의분석에대해데이터와매개변수를제공하면, 도구는적합한통계또는공학매크로함수를사용하여출력테이블에결과를나타냅니다. 일부도구는출력테이블과함께차트를생성합니다.

워크시트관련함수 Excel은기타통계, 재무및공학워크시트함수를여러개제공합니다. 일부통계함수는기본제공함수이며다른함수는분석도구를설치해야사용가능합니다.

데이터분석도구액세스분석도구는아래에설명된도구를포함합니다. 이도구에액세스하려면도구메뉴에서데이터분석을클릭합니다. 데이터분석명령을사용할수없으면분석도구추가기능 (추가기능: Microsoft Office에사용자지정명령또는사용자지정기능을추가하는보조프로그램입니다.)프로그램을로드해야합니다.

분산분석

분산분석도구는다양한유형의분산분석을제공합니다. 사용할도구는검사할모집단의표본집단수와배치수에따라다릅니다.

분산분석: 일원배치법 이도구는둘이상의표본에대해단순분산분석을수행합니다. 모든표본에대한기본확률분포가다르다는가설에반해기본확률분포가같은표본을추출했다는가설을검증하는분석입니다. 표본이두개뿐이면워크시트함수 TTEST를대신사용할수있습니다. 표본이세개이상일때는 TTEST가전혀도움이되지않으므로일원배치법모델을대신호출할수있습니다.

분산분석: 반복있는이원배치법 이분석도구는두가지다른차원을기준으로데이터를분류할수있을때유용한도구입니다. 예를들어식물의높이를측정하는실험에서서로다른상표(예: A, B, C)의비료와배양온도(예: 저온, 고온)를사용합니다. 그리고가능한 6가지 {비료, 온도} 쌍각각에대해동일한횟수로식물의높이를관측합니다. 이러한분산분석도구를사용하여다음을검정할수있습니다.

1. 다른상표의비료를사용한식물들의높이가동일한기본모집단에서추출되는지여부(이분석에서온도는무시함).

2. 다른온도로유지된식물들의높이가동일한기본모집단에서추출되는지여부(이분석에서비료상표는무시함).

3. 1단계에서관찰한비료의상표차이와 2단계에서관찰한온도차에따른영향을고려하여가능한모든 {비료, 온도} 값쌍을나타내는 6개의표본이동일한모집단에서추출되는지여부. 비료또는온도차만의영향을초월하여특정 {비료, 온도} 쌍으로인한영향이있다는가설도있습니다.

분산 분석 입력 범위 설정

분산분석: 반복없는이원배치법 이분석도구는반복있는이원배치법과같이두가지다른차원을기준으로데이터가분류될때유용한도구입니다. 그러나이도구에서는각쌍(위예의경우 {비료, 온도} 쌍)을 1회만관측한다고가정합니다. 이도구를사용하여 '분산분석: 반복있는이원배치법'의 1단계와 2단계에검정을적용할수있지만 3단계에는데이터가부족하여검정을적용할수없습니다.

상관관계

CORREL과 PEARSON 스프레드시트함수는모두 N개의대상각각에대해각변수에대한측정이조사될때두개의측정변수사이의상관계수를계산합니다. 조사에서빠뜨린대상은분석에서무시됩니다. 상관분석도구는 N개대상에대한측정변수가세개이상일때특히유용합니다. 분석결과테이블에는각측정변수쌍에적용된CORREL(또는 PEARSON)의값을보여주는상관행렬이출력됩니다.

상관계수가공분산과유사한점은두측정변수가 "상관되어변화하는" 정도의측정이라는점이고, 다른점은상관계수값이두측정변수의표시단위와무관하게결정된다는점입니다. 예를들어두측정변수가각각중량과높이인경우, 중량이파운드에서킬로그램으로변환되어도상관계수의값은변하지않습니다. 상관계수값은 -1에서 +1 사이여야합니다.

상관관계분석도구를사용하면각측정변수쌍을조사하여두측정변수가상관적으로변화하는지알수있습니다. 즉, 한변수의값이증가하면다른변수의값도증가하는지(양의상관관계), 한변수의값은감소하지만다른변수의값은증가하는지(음의상관관계) 또는두변수값이서로관계가없는지(상관관계가 0에가까움)를알수있습니다.

공분산

상관관계도구와공분산도구는하나의집합에서 N개의측정변수를관찰할때동일한설정에서사용됩니다. 상관관계와공분산도구는각각상관계수와공분산을보여주는행렬을테이블에출력합니다. 차이점은상관계수는 -1에서 +1 사이의값을갖지만그에해당하는공분산은눈금이지정되지않는다는것입니다. 상관계수와공분산은모두두개의변수가 "상관되어변화하는" 정도에대한측정입니다.

공분산도구는각측정변수쌍에대해 COVAR 워크시트함수의값을계산합니다. 측정변수가두개뿐이면(N=2) 공분산도구대신 COVAR 함수를직접사용하는것이좋습니다. 공분산도구의출력테이블에서대각선항목(i 행, i 열)은 i번째측정변수의공분산으로, VARP 워크시트함수를사용한계산과같이해당변수에대한모집단분산일뿐입니다.

공분산도구를사용하면각측정변수쌍을조사하여두측정변수가상관적으로변화하는지알수있습니다. 즉, 한변수의값이증가하면다른변수의값도증가하는지(양의상관관계), 한변수의값은감소하지만다른변수의값은증가하는지(음의상관관계) 또는두변수값이서로관계가없는지(상관관계가 0에가까움)를알수있습니다.

기술통계법

기술통계법분석도구는입력범위의데이터에대한일변량통계보고서를만들어데이터의중심경향성과변동성에대한정보를제공합니다.

지수평활법

지수평활법분석도구는이전예측값을기준으로오류를수정한새예측값을구합니다. 이도구는평활상수 a를사용하며, 이상수는값의크기에따라이전예측값의오류가새예측값에얼마나반영되었는지를나타냅니다.

참고 평활상수값은 0.2 - 0.3이적당합니다. 이값은이전예측값의오류에대해현재예측값을 20% - 30% 조정했다는것을나타냅니다. 상수값이크면반응은빠르지만다른결과를얻을수있습니다. 상수값이작으면예상값에대한반응이느려집니다.

F-검정: 분산에대한두표본

F-검정: 분산에대한두집단분석도구는두개의모집단분산을비교하기위해두표본에대한 F-검정을수행합니다.

예를들어두수영팀각각의수영기록에서시간표본에대해 F-검정도구를사용할수있습니다. 이도구는두표본이동일한분산을갖는분포에서추출된다는가정과분산이기본분포에서동일하지않다는반대적가정에대한검정결과를제공합니다.

이도구는 F 통계량(또는 F 비율) 값을계산합니다. 값이 1에가까우면기본모집단분산이동일하다는증거입니다. 출력테이블에서 f가 1보다작으면 “P(F <= f) one-tail”은모집단분산이동일할때 f 미만의 F 통계량값을관측할확률을제공하고, “F Critical one-tail”은선택된유의수준 Alpha에대해 1 미만의임계값을제공합니다. f가 1보다크면 “P(F <= f) one-tail”은모집단분산이동일할때 f보다큰 F 통계량값을관측할확률을제공하고, “F Critical one-tail”은 Alpha에대해 1보다큰임계값을제공합니다.

푸리에분석

푸리에분석도구는 FFT(고속푸리에변환) 메서드로선형시스템의문제를해결하고주기적인데이터를분석하여데이터를변환합니다. 또한변환된데이터를거꾸로변환하여원래의데이터로복원할수있는역변환을지원합니다.

푸리에 분석을 위한 입력과 출력 범위

히스토그램

히스토그램분석도구는셀범위의데이터와데이터저장소에대한개별및누적빈도를계산합니다. 데이터집합에서값이발생하는개수에대한데이터를생성합니다.

예를들면 20명의학생이있는학급에서, 알파벳학점구분의분포를정할수있습니다. 히스토그램테이블은알파벳학점경계와, 최소경계와현재경계사이에있는점수의개수를나타냅니다. 가장많이발생하는점수하나가데이터의최빈값입니다.

이동평균

이동평균분석도구는지정된지난기간동안변수의평균값을기준으로특정기간의값을예측합니다. 이동평균은모든누적데이터의단순평균에서는알수없는추세정보를제공합니다. 이도구를사용하여판매량, 재고량, 기타추세를예측할수있습니다. 다음수식을사용하여각예상값을구할수있습니다.

여기서

N은이동평균에추가할이전기간

A_j는 j 때의실제값

F_j는 j 때의예측값

난수생성

난수생성분석도구는여러개의분포중하나에서추출된독립난수로범위를채웁니다. 모집단구성원의특성을확률분포로나타낼수있습니다.

예를들어정규분포로개인의신장에대한모집단의특성을나타내거나, 두가지가능성에대한베르누이분포로동전의앞면과뒷면이나올확률에대한모집단의특성을나타낼수도있습니다.

순위와백분위수

순위와백분위수분석도구는데이터집합의각값에대한순위와백분율을나타내는테이블을만듭니다. 데이터집합에있는값의상대적위치를분석할수있습니다. 이도구는워크시트함수 RANK 및 PERCENTRANK를사용합니다. RANK는묶인값을계산에포함하지않습니다. 묶인값을계산에포함하려면 RANK의도움말파일에서제안하는수정인수와함께 RANK 워크시트함수를사용합니다.

회귀

회귀분석도구는배열또는범위에선을맞추는 "최소제곱법"을사용하여선형회귀분석을수행합니다. 단일종속변수가하나이상의독립변수들의값에의해어떻게영향을받는지를분석할수있습니다.

예를들어나이, 신장, 몸무게에의해영향을받는운동선수의성과를분석할수있습니다. 성과데이터의집합을기초로세가지요인들에대한성과측정의역할을배분할수있습니다. 결과를사용하여검정을하지않은새운동선수의성과를예측합니다.

회귀분석도구는 LINEST 워크시트함수를사용합니다.

표본

표본분석도구는입력범위를모집단으로하여모집단에서표본집단을추출합니다. 모집단이너무커서데이터를처리할수없거나차트를만들수없으면대표가되는표본집단을사용할수있습니다. 또한주기적으로데이터를입력할경우에는주기의특정부분의값만포함된표본집단을만들수도있습니다.

예를들어입력범위에분기별매출액이들어있고주기율이 4인표본집단을추출하면출력테이블에같은분기의값들이나타납니다.

t-검정

두표본 t-검정분석도구는각표본의모집단평균들의동일여부를검사합니다. 세개의도구에각각다른가정을사용하는데, 모집단분산이동일하다는가정, 모집단분산이동일하지않다는가정, 그리고두개의표본이동일한대상에대한처리전과처리후관측을나타낸다는가정입니다.

아래의세도구모두의경우, t 통계값인 t가계산되고출력테이블에 "t Stat"로표시됩니다. 데이터에따라, 이 t 값은음수나양수또는 0이됩니다. 기본모집단평균이동일하다는가정하에 t가 0미만이면 “P(T <= t) one-tail”은 t 통계값이 t보다음수일확률을제공하고, t가 0 이상이면 >=0, “P(T <= t) one-tail”은 t 통계값이 t보다큰수일확률을제공합니다. “t Critical one-tail”은기준값을제공하므로 “t Critical one-tail” 이상의 t 통계값이관측될확률은 Alpha가됩니다.

“P(T <= t) two-tail”은 t 통계값이 t 절대값보다클확률을제공합니다. “P Critical two-tail”은기준값을제공하므로 “P Critical two-tail”보다절대값이큰 t 통계값이관측될확률은 Alpha가됩니다.

t-검정: 등분산가정두표본 이분석도구는두표본집단에대해스튜던트 t-검정을합니다. 이 t-검정은두데이터집합이동일한분산을갖는분포에서추출된다고가정하며, 이를등분산적 t-검정이라고합니다. t-검정으로두표본집단이동일한모집단평균을갖는분포에서추출될가능성이높은지알수있습니다.

t-검정: 이분산가정두표본 이분석도구는두표본집단에대해스튜던트 t-검정을합니다. 이러한t-검정에서두데이터집합이동일하지않은분산을갖는분포에서추출되었다고할때이를이분산적 t-검정이라고합니다. 위의등분산 t-검정과마찬가지로이분산 t-검정을사용하여두표본집단이동일한모집단평균을갖는분포에서추출될가능성이높은지알수있습니다. 두표본집단에특이한대상이있을때이검정을사용합니다. 연구대상집단이하나이고두개의표본이각대상에대한측정을표시할때는아래설명된쌍체검정을사용하십시오.

다음은통계값 t를결정하는수식입니다.

t 값을 계산하는 수식

다음수식은자유도(df)를계산할때사용합니다. 계산결과는보통정수가아니므로 t 테이블에서임계값을구하기위해 df 값은가장가까운정수로반올림됩니다. Excel 워크시트함수인 TTEST는정수가아닌 df 값을사용하여 TTEST에대한값을계산할수있기때문에반올림하지않고 df 값을계산합니다. 자유도를결정하는방법의이러한차이로인해이분산의경우에 TTEST의계산결과와 t-검정도구의결과가다릅니다.

자유도의 근사값을 계산하는 수식

t-검정: 평균에대한쌍을이룬두표본 표본그룹에대해실험전과후에두번검사할때쌍을이룬쌍체검정을사용할수있습니다. 이분석도구와수식은쌍을이룬두표본집단에대해스튜던트 t-검정을하여실험전의관측과실험후의관측이동일한모집단평균을갖는분포에서추출될가능성이높은지알수있습니다. 이 t-검정양식은두모집단의분산이동일하다는가정을하지않습니다.

참고 이도구로산출되는결과중에는흩어진데이터를평균에대해누적측정한공동분산이있습니다. 산출식은다음과같습니다.

z-검정

[엑셀] 엑셀을 활용한 통계분석 2/2

DB & 분석 2010/08/06 12:34 Posted by A 마트 P.C

www.marketingtech.co.kr

엑셀기초 사용법

이 장에서는 윈도우즈 98(Windows98)과 엑셀2000(Excel 2000)의 기본적인 용어 및 기능들에 대해 설명하도록 한다.

데이터의 수치용약

이 장에서는 자료의 특징을 파악하기 위해서 도표나 그래프 또는 몇가지의 통계 수치등을 통해서 정리, 요약하는 것을 설명하도록 하겠다.

엑셀사용법과 함수들

이 장에서는 엑셀 함수의 사용법과 함수들의 종류등을 설명하도록 하겠다.

그래프를 이용한 자료정리

이 장에서는 수집된 통계자료가 가지고 있는 정보를 그래프를 사용하여 요약하는 방법에 대해서 공부한다. 수집된 데이터를 효과적으로 정리, 요약하기 위해서는 자료의 종류에 적합한 그래프를 사용해야 한다. 이 장에서는 자료의 종류에 따른 적절한 그래프의 종류에 대해서 공부하도록 한다.