今回はSUMMARYについて解説します。
/*正常形*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; var 請求金額; by 契約番号; output out=data3; run;



- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
/*out=*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2 out=data3; var 請求金額; by 契約番号; run;

- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
- out=だとエラーになる。
/*語順入れ替え1*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; output out=data3; by 契約番号; var 請求金額; run;

- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
- by; var; output out=;は語順入れ替えても動作する。
/*N=*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=; run;

- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
- 集計関数のうちNを実行する。
/*N=ロット数*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=ロット数; run;

- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
- 集計関数のうちNを実行する。
- Nの列名を指定する。
/*by複数指定*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号 会社コード; run;
proc summary data=data2; var 請求金額; by 契約番号 会社コード; output out=data3 MAX=; run;

- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
- 集計関数のうちMAXを実行する。
- byには複数指定できる。
/*varなし*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; by 契約番号; output out=data3; run;

- by 契約番号を1グループとして集計する
- 出力はoutput out=
- varが無ければ_TYPE_, _FREQ_のみ。
/*byなし*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; var 請求金額; output out=data3; run;

- byが無ければ、表全体を1グループとしてvar 請求金額について集計。
- 出力はoutput out=
/*drop=_TYPE_ _FREQ_*/
data data1;
契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
output;
契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
output;
契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
output;
契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
output;
契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
output;
契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
output;
run;
proc sort data=data1 out=data2; by 契約番号; run;
proc summary data=data2; var 請求金額; by 契約番号; output out=data3(drop=_TYPE_ _FREQ_) N=ロット数; run;

- by 契約番号を1グループとしてvar 請求金額について集計する
- 出力はoutput out=
- 集計関数のうちNを実行する。
- Nの列名を指定する。
- _TYPE_, _FREQ_もdropできる。