FIRST, LAST NODUPKEY SAS SORT

【SAS】FIRST, LAST↔SORT NODUPKEYの変換

投稿日:

今回はfirst, last↔SORT NODUPKEYの変換について解説します。

結論を先に書くと、変換できる場合、変換できない場合とがあります。


/*sort1*/
data data1;
  id1="1111"; id2="1111";
    output;
  id1="1111"; id2="2222";
    output;
  id1="1111"; id2="3333";
    output;
  id1="2222"; id2="3333";
    output;
  id1="2222"; id2="2222";
    output;
  id1="2222"; id2="1111";
    output;
  id1="3333"; id2="2222";
    output;
  id1="3333"; id2="1111";
    output;
  id1="3333"; id2="3333";
    output;
run;



proc sort data=data1 out=data2 ; by id1 id2 ; run;


data data3; set data2; by id1 id2;
  if first.id2 = 1;
run;

ソート⇒ユニークをnodupkeyで表すと、


/* nodupkey1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;


このようにソート⇒ユニークの流れはnodupkeyで書き表すことができます。

続いて、sort2


/*sort2*/
data data1;
  id1="1111"; id2="1111";
    output;
  id1="1111"; id2="2222";
    output;
  id1="1111"; id2="3333";
    output;
  id1="2222"; id2="3333";
    output;
  id1="2222"; id2="2222";
    output;
  id1="2222"; id2="1111";
    output;
  id1="3333"; id2="2222";
    output;
  id1="3333"; id2="1111";
    output;
  id1="3333"; id2="3333";
    output;
run;



proc sort data=data1 out=data2 ; by id1 id2 ; run;


data data3; set data2; by id1 id2;
  if first.id1 = 1;
run;

このソート⇒ユニークの流れをnodupkeyで書き表そうとすると、


/* nodupkey2_1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;


上記のnodupkey2_1では不適切なことが分かります。


/* nodupkey2_2 */
proc sort nodupkey data=data1 out=data3 ; by id1  ; run;

nodupkey2_2でも無いことが分かります。


/* nodupkey2_3 */
proc sort nodupkey data=data1 out=data3 ; by id2  ; run;

nodupkey2_3でも無いことが分かります。


/* nodupkey2_4 */
proc sort nodupkey data=data1 out=data3 ; by descending id1  ; run;

nodupkey2_4でも無いことが分かります。


/* nodupkey2_5 */
proc sort nodupkey data=data1 out=data3 ; by descending id2  ; run;

nodupkey2_5でも無いことが分かります。

まとめると、ソートキーとユニークキーが同一の場合は変換できます。

異なる場合は変換できない場合があります。

-FIRST, LAST, NODUPKEY, SAS, SORT

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】FORMATステートメントは文字列の出力形式を変換する。

今回はFORMATステートメントについて解説します。 /* format */ data data1; Id1=111111; output; run; data data2; set data1; …

【SAS】YYYY-MM表記にする方法【SUBSTR】【||】

今回はYYYYMMDD表記の年月日をYYYY-MM表記にしたいと思います。 結論:SUBSTRと||を使います。 (SUBSTR:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | …

【SAS】IFステートメントは処理を分岐できる。その1

今回はSASのif文について解説していきたいと思います。 【IF文の関連記事】 (明示的、暗黙的OUTPUT:【SAS】OUTPUTとDELETEの「明示的な使い方」「暗黙的な使い方」 | ビジネスイ …

【SAS】^=(ノットイコール)

今回は^=について解説します。 /* ^=”” */ data data1; id=”A”; chiku=”SHINJUKU”; output; id=”B”; chiku=”ICHIGAYA”; o …

【SAS】ORDER BY句無しで抽出した際の出力順【SQL】

この記事の要約:「ORDER BYを使わない場合、SQLで抽出した際の並び順は保証されない」 SQL文で抽出を行った際に、困ったことが起きました。 同じPG文なのに1回目と2回目で出力結果に違いがある …