SAS _프로시저[MEANS/UNIVARIATE/PROC SORT/PLOT/CHART]
MEANS 프로시저
PROC MEANS DATA=mysas.htwt MAXDEC=2 MEAN STD CV RANGE;
CLASS gender;
VAR age height weight;
TITLE '>>> 성별 기초통계량 <<<';
RUN;
var : 변수
옵션
noprint : 출력 안함
MAXDEC=n : 출력결과의 소수점 이하의 자리 수를 지정. (디폴트 8)
FM=n : 계산된 통계량의 출력칸수를 지정.
Missing : CLASS 명령어의 결측치도 부집단의 한 값으로 이용.
DECENDING : 출력자료가 내림차순으로 정리.
ORDER : 변수값이 순서가 되는 기준
출력되는 통계량 지정가능.
UNIVARIATE 프로시저
PROC SORT DATA=mysas.htwt;
BY gender;
RUN;
PROC UNIVARIATE DATA=mysas.htwt NORMAL PLOTS;
BY gender;
VAR age height weight;
HISTOGRAM age / NORMAL;
PROBPLOT height weight / NORMAL;
QQPLOT age / EXPONENTIAL;
RUN;
BY 사용하려면 앞에 PROC SORT 해줘야 함.
VAR : 변수
HISTOGRAM : 막대그래프와 모수적 또는 비모수적 밀도곡선을 출력.(옵션:NOMAL,EXPONTIAL, GAMMA)
PROBPLOT : 확률그림.
QQPLOT : 분위수-분위수그림.
옵션
PLOTS : 줄기 잎 그림, 상자그림, 정규확률 그림.
FREQ : 도수분포표
NOMAL : 정규분포 가정을 검정, 특이값 찾아줌.
ROUND : 자료를 반올림하여 통계량 계산할 경우.
PROC SORT 프로시저
BY : 오름차순으로 정렬, DECENDING하면 내림차순
OUT : SORT 절차에의해 순서화 된 자료를 OUT 문장에서 지정한 새로운 SAS데이터 셋으로 저장.
BOXPLOT 프로시저
PROC BOXPLOT DATA=mysas.htwt;
PLOT height*gender ;
RUN;
PLOT에 Y*X축 설정
BY : BY문장에 기술한 변수에 의해 나누어진 각각의 집단에 대해 출력.
옵션
BOXSTYLE=SKELETAL : 이상치 표시하지 않음.
BOXSTYLE=SCHEMATIC : 이상치 표시.
FREQ 프로시저
PROC FREQ DATA=mysas.drink;
WEIGHT count;
TABLES age drink age*drink / NOCOL NOPERCENT;
RUN;
WEIGHT : 가중치부여
TABLES : Y축*X축 분할표 나타냄
옵션
PLOT 프로시저
: 두 변수 사이 관계를 플롯형식으로 표현
PROC PLOT DATA=mysas.htwt;
PLOT height*age='H' weight*age=gender
/ HPOS=50 VPOS=15 OVERLAY;
RUN;
PLOT : Y축 *X축
PLOT옵션
HPOS=수평축 길이, VPOS=수직축 길이.
OVERLAY : 모든 플롯을 하나의 그림에 겹쳐 그리기
CHART 프로시저
PROC CHART DATA=mysas.htwt;
HBAR dept gender / SUMVAR=age TYPE=MEAN;
RUN;
HBAR :수평 막대도표
VBAR : 수직 막대도표
PIE : 파이도표
STAR : 별도표
BLOCK : 블록 도표
옵션
DISCRETE : 숫자변수에 대해 모든 자료 값을 각각의 막대 또는 파이로 표현
SUMBAR : TYPE : 각 막대 도는 파이에 대해 다른변수의 통계량 표현
++
- OPTIONS 명령문
- TITLE, FOOTNOTE 명령문
- WHERE 명령문
- FORMAT, LABEL 명령문