SAS SUMMARY

【SAS】SUMMARYは集計に便利

投稿日:2021年9月19日 更新日:

今回はSUMMARYについて解説します。


/*正常形*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=

/*out=*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2 out=data3; var 請求金額; by 契約番号; run;


  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • out=だとエラーになる。

/*語順入れ替え1*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; output out=data3; by 契約番号; var 請求金額; run;
  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • by; var; output out=;は語順入れ替えても動作する。

/*N=*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=; run;
  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。

/*N=ロット数*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3 N=ロット数; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。
  • Nの列名を指定する。

/*by複数指定*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号 会社コード; run;

proc summary data=data2; var 請求金額; by 契約番号 会社コード; output out=data3 MAX=; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちMAXを実行する。
  • byには複数指定できる。

/*varなし*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; by 契約番号; output out=data3; run;

  • by 契約番号を1グループとして集計する
  • 出力はoutput out=
  • varが無ければ_TYPE_, _FREQ_のみ。

/*byなし*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; output out=data3; run;
  • byが無ければ、表全体を1グループとしてvar 請求金額について集計。
  • 出力はoutput out=

/*drop=_TYPE_ _FREQ_*/
data data1;
  契約番号="AAAAAA"; 会社コード="02"; 請求金額=4999;
    output;
  契約番号="AAAAAA"; 会社コード="03"; 請求金額=2000;
    output;
  契約番号="BBBBBB"; 会社コード="06"; 請求金額=2300;
    output;
  契約番号="BBBBBB"; 会社コード="04"; 請求金額=1200;
    output;
  契約番号="BBBBBB"; 会社コード="03"; 請求金額=4000;
    output;
  契約番号="CCCCCC"; 会社コード="03"; 請求金額=7777;
    output;
run;

proc sort data=data1 out=data2; by 契約番号; run;

proc summary data=data2; var 請求金額; by 契約番号; output out=data3(drop=_TYPE_ _FREQ_) N=ロット数; run;

  • by 契約番号を1グループとしてvar 請求金額について集計する
  • 出力はoutput out=
  • 集計関数のうちNを実行する。
  • Nの列名を指定する。
  • _TYPE_, _FREQ_もdropできる。

-SAS, SUMMARY

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】SASで日付を扱う(年月日)【”d】 【YEAR()】【MONTH()】【DAY()】【MDY()】

今回は日付を用いた様々な操作について解説します。  /*”d*/ data data1; Id1 = ’03jan2022’d; run; ’03jan2022’d …

【SAS】「引用符で囲まれた文字列の後の識別子の意味は、将来のSASリリースで変わる可能性があります。」の対処法【NOTE】

今回は、 「引用符で囲まれた文字列の後の識別子の意味は、将来のSASリリースで変わる可能性があります。」 とログメッセージが出た時の対処法について解説します。 /* メッセージ_1 */ data d …

【SAS】オブザベーションを跨いだ計算【RETAIN】【SAS Base Programming対策4】

/* retain */ data data1; Id1=1111; Id2=1111; Id3=1111; output; Id1=2222; Id2=2222; Id3=2222; output; …

【SAS】COALESCEはNULLを数字に置き換える

今回はCOALESCEについて解説します。 /*coalesce 正常形*/ data data1; id=”A”; chiku=1111; output; id=”B”; chiku=2222; o …

【SAS】INPUTは文字型を数値型に変換する

今回はINPUTについて解説します。 /*8桁*/ data work.a; a = input(“20061228”, 8.); run; 文字型⇒数値型への変換はinputを使う。文字型&#822 …