SAS SUMMARY

【SAS】SUMMARYは集計に便利

投稿日:2021年9月19日 更新日:

今回はSUMMARYについて解説します。


/*正常形*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=

/*out=*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2 out=data3; var 請求金額; by 契約番号; run;


  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • out=だとエラーになる。

/*語順入れ替え1*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; output out=data3; by 契約番号; var 請求金額; run;
  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • by; var; output out=;は語順入れ替えても動作する。

/*N=*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=; run;
  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。

/*N=ロット数*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=ロット数; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。
  • Nの列名を指定する。

/*by複数指定*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号 会社コード; run;

proc summary data=data2; var 請求金額; by 契約番号 会社コード; output out=data3 MAX=; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちMAXを実行する。
  • byには複数指定できる。

/*varなし*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; by 契約番号; output out=data3; run;

  • by 契約番号を1グループとして集計する
  • 出力はoutput out=
  • varが無ければ_TYPE_, _FREQ_のみ。

/*byなし*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; output out=data3; run;
  • byが無ければ、表全体を1グループとしてvar 請求金額について集計。
  • 出力はoutput out=

/*drop=_TYPE_ _FREQ_*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3(drop=_TYPE_ _FREQ_) N=ロット数; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。
  • Nの列名を指定する。
  • _TYPE_, _FREQ_もdropできる。

-SAS, SUMMARY

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】||(!!)は文字列の連結ができる。【結合】

今回は||(!!)について解説します。 /* || */ data data1; Id1=1111; Char1=”AA AA”; output; Id1=2222; Char1=” BBBB”; o …

【SAS】CONTENTSプロシージャはデータセットに関する情報を表示する。

今回はCONTENTSプロシージャについて解説します。  /* data1 */ data data1; Id1=1111; Id2=1111; Id3=1111; output; Id1= …

【SAS】TODAY()とDATE()はどちらもSAS日付値を取得する。

以下の2記事でtoday()を使ってきました。 【SAS】PUT+DATE,YYMMDDはSAS日付値をフォーマットを変換して表示する 【SAS】YYMMDDの可能性を考える(表示できる日付形式はどこ …

【SAS】SORTプロシージャはBYで指定した変数で並べ替える その1 昇順

今回はSORTプロシージャについて解説します。 /*sort1*/ data data1; id1=”1111″; id2=”1111″; output; id1=”1111″; id2=”2222″ …

【SAS】%PUTステートメントは文字列をログに出力する。その1

今回は%PUTについて解説します。 /* %put */ %put CHAR; %putにより、文字列をログに出力できる。 /* %let */ %let CHAR = aaaa ; %put &am …