FIRST, LAST NODUPKEY SAS SORT

【SAS】FIRST, LAST↔SORT NODUPKEYの変換

投稿日:

今回はfirst, last↔SORT NODUPKEYの変換について解説します。

結論を先に書くと、変換できる場合、変換できない場合とがあります。


/*sort1*/
data data1;
  id1="1111"; id2="1111";
    output;
  id1="1111"; id2="2222";
    output;
  id1="1111"; id2="3333";
    output;
  id1="2222"; id2="3333";
    output;
  id1="2222"; id2="2222";
    output;
  id1="2222"; id2="1111";
    output;
  id1="3333"; id2="2222";
    output;
  id1="3333"; id2="1111";
    output;
  id1="3333"; id2="3333";
    output;
run;



proc sort data=data1 out=data2 ; by id1 id2 ; run;


data data3; set data2; by id1 id2;
  if first.id2 = 1;
run;

ソート⇒ユニークをnodupkeyで表すと、


/* nodupkey1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;


このようにソート⇒ユニークの流れはnodupkeyで書き表すことができます。

続いて、sort2


/*sort2*/
data data1;
  id1="1111"; id2="1111";
    output;
  id1="1111"; id2="2222";
    output;
  id1="1111"; id2="3333";
    output;
  id1="2222"; id2="3333";
    output;
  id1="2222"; id2="2222";
    output;
  id1="2222"; id2="1111";
    output;
  id1="3333"; id2="2222";
    output;
  id1="3333"; id2="1111";
    output;
  id1="3333"; id2="3333";
    output;
run;



proc sort data=data1 out=data2 ; by id1 id2 ; run;


data data3; set data2; by id1 id2;
  if first.id1 = 1;
run;

このソート⇒ユニークの流れをnodupkeyで書き表そうとすると、


/* nodupkey2_1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;


上記のnodupkey2_1では不適切なことが分かります。


/* nodupkey2_2 */
proc sort nodupkey data=data1 out=data3 ; by id1  ; run;

nodupkey2_2でも無いことが分かります。


/* nodupkey2_3 */
proc sort nodupkey data=data1 out=data3 ; by id2  ; run;

nodupkey2_3でも無いことが分かります。


/* nodupkey2_4 */
proc sort nodupkey data=data1 out=data3 ; by descending id1  ; run;

nodupkey2_4でも無いことが分かります。


/* nodupkey2_5 */
proc sort nodupkey data=data1 out=data3 ; by descending id2  ; run;

nodupkey2_5でも無いことが分かります。

まとめると、ソートキーとユニークキーが同一の場合は変換できます。

異なる場合は変換できない場合があります。

-FIRST, LAST, NODUPKEY, SAS, SORT

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】SAS Studio上でカラムの順番を変える方法

今回はSAS Studio上でカラムの順番を変える操作について解説します。 ちなみにカラムの出力順をプログラムで制御する方法は過去の記事で解説しています。(参考:【SAS】FORMATはカラムの出力順 …

【SAS】DROPはデータセットから変数を削除する

今回はDROPについて解説します。 (対比:KEEP 【SAS】KEEPはカラムの選択に使える。 | ビジネスイッチ (how-to-business.com)) /* drop_1 */ data …

【SAS】LABELオプションは変数名ではなく、ラベル名を出力する。【PRINTプロシージャ】【SAS Base Programming対策2】

今回はLABELオプションについて解説します。 SAS Base Programmingの四択問題でも出されそうな感じです。 /* label */ data data1; attrib Id1 le …

【SAS】CALL SYMPUTは関数を用いてマクロ変数の代入ができる。

今回はCALL SYMPUTについて解説します。 /*その1*/ data data1; kyo = today(); run; today()は本日の日付をSAS日付で取得する。 /*その2*/ d …

【SAS】YYMMDDの可能性を考える(表示できる日付形式はどこまでなのか)区切り文字の解説も

今回はYYMMDDにフォーカスして解説します。 前回、PUT+DATE,YYMMDDにより、SAS日付値を日付形式に変換表示する方法を解説しました。 【SAS】PUT+DATE,YYMMDDはSAS日 …