SAS SUMMARY

【SAS】SUMMARYは集計に便利

投稿日:2021年9月19日 更新日:

今回はSUMMARYについて解説します。


/*正常形*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=

/*out=*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2 out=data3; var 請求金額; by 契約番号; run;


  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • out=だとエラーになる。

/*語順入れ替え1*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; output out=data3; by 契約番号; var 請求金額; run;
  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • by; var; output out=;は語順入れ替えても動作する。

/*N=*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=; run;
  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。

/*N=ロット数*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=ロット数; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。
  • Nの列名を指定する。

/*by複数指定*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号 会社コード; run;

proc summary data=data2; var 請求金額; by 契約番号 会社コード; output out=data3 MAX=; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちMAXを実行する。
  • byには複数指定できる。

/*varなし*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; by 契約番号; output out=data3; run;

  • by 契約番号を1グループとして集計する
  • 出力はoutput out=
  • varが無ければ_TYPE_, _FREQ_のみ。

/*byなし*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; output out=data3; run;
  • byが無ければ、表全体を1グループとしてvar 請求金額について集計。
  • 出力はoutput out=

/*drop=_TYPE_ _FREQ_*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3(drop=_TYPE_ _FREQ_) N=ロット数; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。
  • Nの列名を指定する。
  • _TYPE_, _FREQ_もdropできる。

-SAS, SUMMARY

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】SUMは足し算をする。その1【SQL】

今回はSQLのSUMについて解説します。 /* SUM_1 */ data data1; Id1=1111; Id2=1111; Id3=1111; output; Id1=2222; Id2=222 …

【SAS】SAS日時値からSAS日付値に変換する方法【DATEPART】【DATETIME】【DATE】

今回はDATETIMEでSAS日時値を取得した後、SAS日付値に変換する方法について解説していきます。 (つまり、DATETIMEの値からDATEの値に変換する) (DATETIME:【SAS】DAT …

【SAS】INTCK関数は指定された区間に指定された単位を何回跨ぐか数える。

data data1; Id1 =intck(“YEAR”, ’31Dec2019’d, ‘1Jan2020’d); run; 2019/12/31~2020/1/1の間に年を何回跨ぐか数える。 /* …

【SAS】SASで良く使うテクニック。その4 「参照元のトレース」~データセットの差分がある箇所を探すのに便利~【Excel】

今回はSASで良く使うテクニックということで、データセットの差分がある箇所を探すときは「参照元のトレース」が役に立つ理由を解説していきます。 (参考:【SAS】SASで良く使うテクニック。その1 Ex …

【SAS】FORMATプロシージャはフォーマットルールを定義し、値を書き換える。その2

今回もFORMATプロシージャについて解説します。 前回は値の範囲によって、定義されたフォーマットルールに従い、値を書き換えるという内容でした。 【SAS】FORMATプロシージャはフォーマットルール …