SAS통계프로그래밍

SAS _프로시저[MEANS/UNIVARIATE/PROC SORT/PLOT/CHART]

jinijinhee 2022. 6. 7. 20:31

MEANS 프로시저

PROC MEANS DATA=mysas.htwt MAXDEC=2 MEAN STD CV RANGE;
	CLASS gender;
	VAR age height weight;
	TITLE '>>> 성별 기초통계량 <<<';
RUN;

var : 변수

 

 

옵션

noprint : 출력 안함

MAXDEC=n : 출력결과의 소수점 이하의 자리 수를 지정. (디폴트 8)

FM=n : 계산된 통계량의 출력칸수를 지정.

Missing : CLASS 명령어의 결측치도 부집단의 한 값으로 이용.

DECENDING : 출력자료가 내림차순으로 정리.

ORDER : 변수값이 순서가 되는 기준

출력되는 통계량 지정가능.

 

 

UNIVARIATE 프로시저

PROC SORT DATA=mysas.htwt;
	BY gender;
RUN;

PROC UNIVARIATE DATA=mysas.htwt NORMAL PLOTS;
	BY gender;
	VAR age height weight;
	HISTOGRAM age / NORMAL;
	PROBPLOT height weight / NORMAL;
	QQPLOT age / EXPONENTIAL;
RUN;

BY 사용하려면 앞에 PROC SORT 해줘야 함.

VAR : 변수

HISTOGRAM : 막대그래프와 모수적 또는 비모수적 밀도곡선을 출력.(옵션:NOMAL,EXPONTIAL, GAMMA)

PROBPLOT : 확률그림.

QQPLOT : 분위수-분위수그림.

옵션

PLOTS : 줄기 잎 그림, 상자그림, 정규확률 그림.

FREQ : 도수분포표

NOMAL : 정규분포 가정을 검정, 특이값 찾아줌.

ROUND : 자료를 반올림하여 통계량 계산할 경우.

PROC SORT 프로시저

BY : 오름차순으로 정렬, DECENDING하면 내림차순

OUT : SORT 절차에의해 순서화 된 자료를 OUT 문장에서 지정한 새로운 SAS데이터 셋으로 저장.

BOXPLOT 프로시저

PROC BOXPLOT DATA=mysas.htwt;
	PLOT height*gender ;
RUN;

PLOT에 Y*X축 설정

BY : BY문장에 기술한 변수에 의해 나누어진 각각의 집단에 대해 출력.

옵션

BOXSTYLE=SKELETAL : 이상치 표시하지 않음.

BOXSTYLE=SCHEMATIC : 이상치 표시.

 

FREQ 프로시저

PROC FREQ DATA=mysas.drink;
	WEIGHT count;
	TABLES age drink age*drink / NOCOL NOPERCENT;
RUN;

WEIGHT : 가중치부여

TABLES : Y축*X축 분할표 나타냄

옵션

 

PLOT 프로시저

: 두 변수 사이 관계를 플롯형식으로 표현

PROC PLOT DATA=mysas.htwt;
	PLOT height*age='H' weight*age=gender
			/ HPOS=50 VPOS=15 OVERLAY;
RUN;

PLOT : Y축 *X축

PLOT옵션

HPOS=수평축 길이, VPOS=수직축 길이.

OVERLAY : 모든 플롯을 하나의 그림에 겹쳐 그리기

 

CHART 프로시저

PROC CHART DATA=mysas.htwt;
	HBAR dept gender / SUMVAR=age TYPE=MEAN;
RUN;

HBAR :수평 막대도표

VBAR : 수직 막대도표

PIE : 파이도표

STAR : 별도표

BLOCK : 블록 도표

옵션

DISCRETE : 숫자변수에 대해 모든 자료 값을 각각의 막대 또는 파이로 표현

SUMBAR : TYPE : 각 막대 도는 파이에 대해 다른변수의 통계량 표현

++

  1. OPTIONS 명령문
  2. TITLE, FOOTNOTE 명령문
  3. WHERE 명령문
  4. FORMAT, LABEL 명령문