컴퓨터관련

엑셀을 이용한 통계 분석...펌

맘편한넘 2010. 12. 16. 10:32

[엑셀] 엑셀을 활용한 통계분석 1/2

DB & 분석 2010/08/04 17:20 Posted by A 마트 P.C
엑셀에서 통계분석을 하시려면, '분석도구'가 설치 되어 있어야 합니다.
보통은 설치 되어 있지 않으니 아래 순서로 클릭해 주세요.

엑셀
도구 추가기능 분석도구 첵크- 확인

CD가 필요 하실 수 도 있습니다.


MS에서 도구분석에 이용되는 통계분석 개념을 정리 해 놓은 내용
----------------------------------------------------------------------------------------------------------


Microsoft Excel분석도구라불리는데이터분석도구의집합을제공합니다. 복잡한통계또는공학분석을전개할단계를절약하기위해사용할있습니다. 각각의분석에대해데이터와매개변수를제공하면, 도구는적합한통계또는공학매크로함수를사용하여출력테이블에결과를나타냅니다. 일부도구는출력테이블과함께차트를생성합니다.

워크시트관련함수   Excel기타통계, 재무공학워크시트함수를여러제공합니다. 일부통계함수는기본제공함수이며다른함수는분석도구를설치해야사용가능합니다.

데이터분석도구액세스분석도구는아래에설명된도구를포함합니다. 도구에액세스하려면도구메뉴에서데이터분석클릭합니다. 데이터분석명령을사용할없으면분석도구추가기능 (추가기능: Microsoft Office사용자지정명령또는사용자지정기능을추가하는보조프로그램입니다.)프로그램을로드해야합니다.

<!--[if !vml]-->표시<!--[endif]-->분산분석

분산분석도구는다양한유형의분산분석을제공합니다. 사용할도구는검사할모집단의표본집단수와배치수에따라다릅니다.

분산분석: 일원배치법   도구는이상의표본에대해단순분산분석을수행합니다. 모든표본에대한기본확률분포가다르다는가설에반해기본확률분포가같은표본을추출했다는가설을검증하는분석입니다. 표본이개뿐이면워크시트함수 TTEST대신사용할있습니다. 표본이이상일때는 TTEST전혀도움이되지않으므로일원배치법모델을대신호출할있습니다.

분산분석: 반복있는이원배치법   분석도구는가지다른차원을기준으로데이터를분류할있을유용한도구입니다. 예를들어식물의높이를측정하는실험에서서로다른상표(: A, B, C)비료와배양온도(: 저온, 고온)사용합니다. 그리고가능한 6가지 {비료, 온도} 각각에대해동일한횟수로식물의높이를관측합니다. 이러한분산분석도구를사용하여다음을검정할있습니다.

<!--[if !supportLists]-->1.       <!--[endif]-->다른상표의비료를사용한식물들의높이가동일한기본모집단에서추출되는지여부(분석에서온도는무시함).

<!--[if !supportLists]-->2.       <!--[endif]-->다른온도로유지된식물들의높이가동일한기본모집단에서추출되는지여부(분석에서비료상표는무시함).

<!--[if !supportLists]-->3.       <!--[endif]-->1단계에서관찰한비료의상표차이와 2단계에서관찰한온도차에따른영향을고려하여가능한모든 {비료, 온도} 쌍을나타내는 6개의표본이동일한모집단에서추출되는지여부. 비료또는온도차만의영향을초월하여특정 {비료, 온도} 쌍으로인한영향이있다는가설도있습니다.

<!--[if !vml]-->분산 분석 입력 범위 설정<!--[endif]-->

분산분석: 반복없는이원배치법   분석도구는반복있는이원배치법과같이가지다른차원을기준으로데이터가분류될유용한도구입니다. 그러나도구에서는(예의경우 {비료, 온도} ) 1회만관측한다고가정합니다. 도구를사용하여 '분산분석: 반복있는이원배치법' 1단계와 2단계에검정을적용할있지만 3단계에는데이터가부족하여검정을적용할없습니다.

<!--[if !vml]-->표시<!--[endif]-->상관관계

CORREL PEARSON 스프레드시트함수는모두 N개의대상각각에대해변수에대한측정이조사될개의측정변수사이의상관계수를계산합니다. 조사에서빠뜨린대상은분석에서무시됩니다. 상관분석도구는 N대상에대한측정변수가이상일특히유용합니다. 분석결과테이블에는측정변수쌍에적용된CORREL(또는 PEARSON)값을보여주는상관행렬이출력됩니다.

상관계수가공분산과유사한점은측정변수가 "상관되어변화하는" 정도의측정이라는점이고, 다른점은상관계수값이측정변수의표시단위와무관하게결정된다는점입니다. 예를들어측정변수가각각중량과높이인경우, 중량이파운드에서킬로그램으로변환되어도상관계수의값은변하지않습니다. 상관계수값은 -1에서 +1 사이여야합니다.

상관관계분석도구를사용하면측정변수쌍을조사하여측정변수가상관적으로변화하는지있습니다. , 변수의값이증가하면다른변수의값도증가하는지(양의상관관계), 변수의값은감소하지만다른변수의값은증가하는지(음의상관관계) 또는변수값이서로관계가없는지(상관관계가 0가까움)있습니다.

<!--[if !vml]-->표시<!--[endif]-->공분산

상관관계도구와공분산도구는하나의집합에서 N개의측정변수를관찰할동일한설정에서사용됩니다. 상관관계와공분산도구는각각상관계수와공분산을보여주는행렬을테이블에출력합니다. 차이점은상관계수는 -1에서 +1 사이의값을갖지만그에해당하는공분산은눈금이지정되지않는다는것입니다. 상관계수와공분산은모두개의변수가 "상관되어변화하는" 정도에대한측정입니다.

공분산도구는측정변수쌍에대해 COVAR 워크시트함수의값을계산합니다. 측정변수가개뿐이면(N=2) 공분산도구대신 COVAR 함수를직접사용하는것이좋습니다. 공분산도구의출력테이블에서대각선항목(i , i ) i번째측정변수의공분산으로, VARP 워크시트함수를사용한계산과같이해당변수에대한모집단분산일뿐입니다.

공분산도구를사용하면측정변수쌍을조사하여측정변수가상관적으로변화하는지있습니다. , 변수의값이증가하면다른변수의값도증가하는지(양의상관관계), 변수의값은감소하지만다른변수의값은증가하는지(음의상관관계) 또는변수값이서로관계가없는지(상관관계가 0가까움)있습니다.

<!--[if !vml]-->표시<!--[endif]-->기술통계법

기술통계법분석도구는입력범위의데이터에대한일변량통계보고서를만들어데이터의중심경향성과변동성에대한정보를제공합니다.

<!--[if !vml]-->표시<!--[endif]-->지수평활법

지수평활법분석도구는이전예측값을기준으로오류를수정한예측값을구합니다. 도구는평활상수 a사용하며, 상수는값의크기에따라이전예측값의오류가예측값에얼마나반영되었는지를나타냅니다.

 참고   평활상수값은 0.2 - 0.3적당합니다. 값은이전예측값의오류에대해현재예측값을 20% - 30% 조정했다는것을나타냅니다. 상수값이크면반응은빠르지만다른결과를얻을있습니다. 상수값이작으면예상값에대한반응이느려집니다.

<!--[if !vml]-->표시<!--[endif]-->F-검정: 분산에대한표본

F-검정: 분산에대한집단분석도구는개의모집단분산을비교하기위해표본에대한 F-검정을수행합니다.

예를들어수영팀각각의수영기록에서시간표본에대해 F-검정도구를사용할있습니다. 도구는표본이동일한분산을갖는분포에서추출된다는가정과분산이기본분포에서동일하지않다는반대적가정에대한검정결과를제공합니다.

도구는 F 통계량(또는 F 비율) 값을계산합니다. 값이 1가까우면기본모집단분산이동일하다는증거입니다. 출력테이블에서 f 1보다작으면 “P(F <= f) one-tail”모집단분산이동일할 f 미만의 F 통계량값을관측할확률을제공하고, “F Critical one-tail”선택된유의수준 Alpha대해 1 미만의임계값을제공합니다. f 1보다크면 “P(F <= f) one-tail”모집단분산이동일할 f보다 F 통계량값을관측할확률을제공하고, “F Critical one-tail” Alpha대해 1보다임계값을제공합니다.

<!--[if !vml]-->표시<!--[endif]-->푸리에분석

푸리에분석도구는 FFT(고속푸리에변환) 메서드로선형시스템의문제를해결하고주기적인데이터를분석하여데이터를변환합니다. 또한변환된데이터를거꾸로변환하여원래의데이터로복원할있는역변환을지원합니다.

<!--[if !vml]-->푸리에 분석을 위한 입력과 출력 범위<!--[endif]-->

<!--[if !vml]-->표시<!--[endif]-->히스토그램

히스토그램분석도구는범위의데이터와데이터저장소에대한개별누적빈도를계산합니다. 데이터집합에서값이발생하는개수에대한데이터를생성합니다.

예를들면 20명의학생이있는학급에서, 알파벳학점구분의분포를정할있습니다. 히스토그램테이블은알파벳학점경계와, 최소경계와현재경계사이에있는점수의개수를나타냅니다. 가장많이발생하는점수하나가데이터의최빈값입니다.

<!--[if !vml]-->표시<!--[endif]-->이동평균

이동평균분석도구는지정된지난기간동안변수의평균값을기준으로특정기간의값을예측합니다. 이동평균은모든누적데이터의단순평균에서는없는추세정보를제공합니다. 도구를사용하여판매량, 재고량, 기타추세를예측할있습니다. 다음수식을사용하여예상값을구할있습니다.

<!--[if !vml]-->이동 평균을 계산하는 수식<!--[endif]-->

여기서

<!--[if !supportLists]-->*      <!--[endif]-->N이동평균에추가할이전기간

<!--[if !supportLists]-->*      <!--[endif]-->Aj j 때의실제

<!--[if !supportLists]-->*      <!--[endif]-->Fj j 때의예측

<!--[if !vml]-->표시<!--[endif]-->난수생성

난수생성분석도구는여러개의분포하나에서추출된독립난수로범위를채웁니다. 모집단구성원의특성을확률분포로나타낼있습니다.

예를들어정규분포로개인의신장에대한모집단의특성을나타내거나, 가지가능성에대한베르누이분포로동전의앞면과뒷면이나올확률에대한모집단의특성을나타낼수도있습니다.

<!--[if !vml]-->표시<!--[endif]-->순위와백분위수

순위와백분위수분석도구는데이터집합의값에대한순위와백분율을나타내는테이블을만듭니다. 데이터집합에있는값의상대적위치를분석할있습니다. 도구는워크시트함수 RANK PERCENTRANK사용합니다. RANK묶인값을계산에포함하지않습니다. 묶인값을계산에포함하려면 RANK도움말파일에서제안하는수정인수와함께 RANK 워크시트함수를사용합니다.

<!--[if !vml]-->표시<!--[endif]-->회귀

회귀분석도구는배열또는범위에선을맞추는 "최소제곱법"사용하여선형회귀분석을수행합니다. 단일종속변수가하나이상의독립변수들의값에의해어떻게영향을받는지를분석할있습니다.

예를들어나이, 신장, 몸무게에의해영향을받는운동선수의성과를분석할있습니다. 성과데이터의집합을기초로세가지요인들에대한성과측정의역할을배분할있습니다. 결과를사용하여검정을하지않은운동선수의성과를예측합니다.

회귀분석도구는 LINEST 워크시트함수를사용합니다.

<!--[if !vml]-->표시<!--[endif]-->표본

표본분석도구는입력범위를모집단으로하여모집단에서표본집단을추출합니다. 모집단이너무커서데이터를처리할없거나차트를만들없으면대표가되는표본집단을사용할있습니다. 또한주기적으로데이터를입력할경우에는주기의특정부분의값만포함된표본집단을만들수도있습니다.

예를들어입력범위에분기별매출액이들어있고주기율이 4표본집단을추출하면출력테이블에같은분기의값들이나타납니다.

<!--[if !vml]-->표시<!--[endif]-->t-검정

표본 t-검정분석도구는표본의모집단평균들의동일여부를검사합니다. 개의도구에각각다른가정을사용하는데, 모집단분산이동일하다는가정, 모집단분산이동일하지않다는가정, 그리고개의표본이동일한대상에대한처리전과처리관측을나타낸다는가정입니다.

아래의도구모두의경우, t 통계값인 t계산되고출력테이블에 "t Stat"표시됩니다. 데이터에따라, t 값은음수나양수또는 0됩니다. 기본모집단평균이동일하다는가정하에 t 0미만이면 “P(T <= t) one-tail” t 통계값이 t보다음수일확률을제공하고, t 0 이상이면 >=0, “P(T <= t) one-tail” t 통계값이 t보다수일확률을제공합니다. “t Critical one-tail”기준값을제공하므로 “t Critical one-tail” 이상의 t 통계값이관측될확률은 Alpha됩니다.

“P(T <= t) two-tail” t 통계값이 t 절대값보다확률을제공합니다. “P Critical two-tail”기준값을제공하므로 “P Critical two-tail”보다절대값이 t 통계값이관측될확률은 Alpha됩니다.

t-검정: 등분산가정표본    분석도구는표본집단에대해스튜던트 t-검정을합니다. t-검정은데이터집합이동일한분산을갖는분포에서추출된다고가정하며, 이를등분산적 t-검정이라고합니다. t-검정으로표본집단이동일한모집단평균을갖는분포에서추출될가능성이높은지있습니다.

t-검정: 이분산가정표본   분석도구는표본집단에대해스튜던트 t-검정을합니다. 이러한t-검정에서데이터집합이동일하지않은분산을갖는분포에서추출되었다고이를이분산적 t-검정이라고합니다. 위의등분산 t-검정과마찬가지로이분산 t-검정을사용하여표본집단이동일한모집단평균을갖는분포에서추출될가능성이높은지있습니다. 표본집단에특이한대상이있을검정을사용합니다. 연구대상집단이하나이고개의표본이대상에대한측정을표시할때는아래설명된쌍체검정을사용하십시오.

다음은통계값 t결정하는수식입니다.

<!--[if !vml]-->t 값을 계산하는 수식<!--[endif]-->

다음수식은자유도(df)계산할사용합니다. 계산결과는보통정수가아니므로 t 테이블에서임계값을구하기위해 df 값은가장가까운정수로반올림됩니다. Excel 워크시트함수인 TTEST정수가아닌 df 값을사용하여 TTEST대한값을계산할있기때문에반올림하지않고 df 값을계산합니다. 자유도를결정하는방법의이러한차이로인해이분산의경우에 TTEST계산결과와 t-검정도구의결과가다릅니다.

<!--[if !vml]-->자유도의 근사값을 계산하는 수식<!--[endif]-->

t-검정: 평균에대한쌍을이룬표본   표본그룹에대해실험전과후에검사할쌍을이룬쌍체검정을사용할있습니다. 분석도구와수식은쌍을이룬표본집단에대해스튜던트 t-검정을하여실험전의관측과실험후의관측이동일한모집단평균을갖는분포에서추출될가능성이높은지있습니다. t-검정양식은모집단의분산이동일하다는가정을하지않습니다.

 참고   도구로산출되는결과중에는흩어진데이터를평균에대해누적측정한공동분산이있습니다. 산출식은다음과같습니다.

<!--[if !vml]-->공동 분산을 계산하는 수식<!--[endif]-->

<!--[if !vml]-->표시<!--[endif]-->z-검정

 


 


저작자 표시 비영리 동일 조건 변경 허락

[엑셀] 엑셀을 활용한 통계분석 2/2

DB & 분석 2010/08/06 12:34 Posted by A 마트 P.C

www.marketingtech.co.kr

엑셀기초 사용법

이 장에서는 윈도우즈 98(Windows98)과 엑셀2000(Excel 2000)의 기본적인 용어 및 기능들에 대해 설명하도록 한다.

데이터의 수치용약

이 장에서는 자료의 특징을 파악하기 위해서 도표나 그래프 또는 몇가지의 통계 수치등을 통해서 정리, 요약하는 것을 설명하도록 하겠다.

엑셀사용법과 함수들

이 장에서는 엑셀 함수의 사용법과 함수들의 종류등을 설명하도록 하겠다.

그래프를 이용한 자료정리

이 장에서는 수집된 통계자료가 가지고 있는 정보를 그래프를 사용하여 요약하는 방법에 대해서 공부한다. 수집된 데이터를 효과적으로 정리, 요약하기 위해서는 자료의 종류에 적합한 그래프를 사용해야 한다. 이 장에서는 자료의 종류에 따른 적절한 그래프의 종류에 대해서 공부하도록 한다.

이산형 확률분포

본 장에서는 분포와 관련한 자료의 특징과 여러 가지 분포, 그리고 자료의 형태에 따른 분석기법에 대해서 살펴보도록 한다.

연속형 확률분포

본 장에서는 분포와 관련한 자료의 특징과 여러 가지 분포, 그리고 자료의 형태에 따른 분석기법에 대해서 살펴보도록 한다.

표본분포

앞장에서 설명한 확률분포는 모집단(population)의 분포에 관한 설명이었다. 여기서는 모집단에서 추출한 표본(sample)들의 분포에 관해 설명하겠다.

추정

본 장에서는 분포와 관련한 자료의 특징과 여러 가지 분포, 그리고 자료의 형태에 따른 분석기법에 대해서 살펴보도록 한다.

샘플1: http://www.leespr.co.kr/data/excel/lecture9/sample1.xls

샘플2: http://www.leespr.co.kr/data/excel/lecture9/sample2.xls

상관분석

본 장에서는 변수와 변수 사이의 관계가 있는지를 알아보는 상관분석에 대해서 살펴보도록 한다.

샘플1: http://www.leespr.co.kr/data/excel/lecture11/sample1.xls

샘플2: http://www.leespr.co.kr/data/excel/lecture11/sample2.xls

회귀분석

회귀분석은 여러 변수들 간의 함수 관계를 규명하고자 할 때 이용하는 통계적 분석방법이다. 이 장에서는 엑셀을 이용하여 회귀분석하는 방법을 설명하겠다.

샘플1: http://www.leespr.co.kr/data/excel/lecture12/sample1.xls

샘플2: http://www.leespr.co.kr/data/excel/lecture12/sample2.xls

샘플3: http://www.leespr.co.kr/data/excel/lecture12/sample3.xls

분산분석

본 장에서는 두 모평균의 차에 대한 검정의 확장인 분산분석에 대하여 알아보도록 한다.

샘플1: http://www.leespr.co.kr/data/excel/lecture13/sample1.xls

샘플2: http://www.leespr.co.kr/data/excel/lecture13/sample2.xls

시계열분석

이 장에서는 엑셀에서 제공하고 있는 통계분석 기법들 중에서 시계열  자료의 분석과 관련하여 이동평균법과 지수평활법에 대하여 공부한다.

샘플1: http://www.leespr.co.kr/data/excel/lecture14/13.xls



 

www.marketingtech.co.kr