FIRST, LAST NODUPKEY SAS SORT

【SAS】FIRST, LAST↔SORT NODUPKEYの変換

投稿日:

今回はfirst, last↔SORT NODUPKEYの変換について解説します。

結論を先に書くと、変換できる場合、変換できない場合とがあります。


/*sort1*/
data data1;
  id1="1111"; id2="1111";
    output;
  id1="1111"; id2="2222";
    output;
  id1="1111"; id2="3333";
    output;
  id1="2222"; id2="3333";
    output;
  id1="2222"; id2="2222";
    output;
  id1="2222"; id2="1111";
    output;
  id1="3333"; id2="2222";
    output;
  id1="3333"; id2="1111";
    output;
  id1="3333"; id2="3333";
    output;
run;



proc sort data=data1 out=data2 ; by id1 id2 ; run;


data data3; set data2; by id1 id2;
  if first.id2 = 1;
run;

ソート⇒ユニークをnodupkeyで表すと、


/* nodupkey1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;


このようにソート⇒ユニークの流れはnodupkeyで書き表すことができます。

続いて、sort2


/*sort2*/
data data1;
  id1="1111"; id2="1111";
    output;
  id1="1111"; id2="2222";
    output;
  id1="1111"; id2="3333";
    output;
  id1="2222"; id2="3333";
    output;
  id1="2222"; id2="2222";
    output;
  id1="2222"; id2="1111";
    output;
  id1="3333"; id2="2222";
    output;
  id1="3333"; id2="1111";
    output;
  id1="3333"; id2="3333";
    output;
run;



proc sort data=data1 out=data2 ; by id1 id2 ; run;


data data3; set data2; by id1 id2;
  if first.id1 = 1;
run;

このソート⇒ユニークの流れをnodupkeyで書き表そうとすると、


/* nodupkey2_1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;


上記のnodupkey2_1では不適切なことが分かります。


/* nodupkey2_2 */
proc sort nodupkey data=data1 out=data3 ; by id1  ; run;

nodupkey2_2でも無いことが分かります。


/* nodupkey2_3 */
proc sort nodupkey data=data1 out=data3 ; by id2  ; run;

nodupkey2_3でも無いことが分かります。


/* nodupkey2_4 */
proc sort nodupkey data=data1 out=data3 ; by descending id1  ; run;

nodupkey2_4でも無いことが分かります。


/* nodupkey2_5 */
proc sort nodupkey data=data1 out=data3 ; by descending id2  ; run;

nodupkey2_5でも無いことが分かります。

まとめると、ソートキーとユニークキーが同一の場合は変換できます。

異なる場合は変換できない場合があります。

-FIRST, LAST, NODUPKEY, SAS, SORT

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】PUTはSAS日付値をフォーマットを変換して表示する【DATE】【YYMMDD】【DATETIME】【TIME】【TOD】

今回もPUTについて解説します。  前回、PUTは数値型⇒文字型への変換ができると解説しました。(参考:【SAS】PUTは数値型を文字型に変換する | ビジネスイッチ (how-to-bus …

【SAS】SASで良く使うテクニック。その3 「Ctrl+D」~データセットのオブザベーション数が多いとき~【Excel】

今回はSASで良く使うテクニックということで、データセットのオブザベーション数(行数)が多いときは「Ctrl+D」が役に立つ理由を解説していきます。 (参考:【SAS】SASで良く使うテクニック。その …

【SAS】SASで良く使うテクニック。その11「Ctrl+/」~範囲指定でコメントを入れたい時~【SAS Studio】

今回はSASで良く使うテクニックということで、範囲指定でコメントを入れたい時は、「Ctrl+/」が役に立つ理由を解説していきます。 以下のようにソースコードを準備します。(ソースコードの内容は何でも良 …

【SAS】INDEXC関数は文字列から特定の文字を探して位置を返す。

今回はINDEXC関数について解説します。 data data1; Id1=”1111″; Id2=”1111″; Id3=”1111″; output; Id1=”2111″; Id2=”2111″ …

【SAS】_NULL_は出力しないデータセット文を作るのに便利。

今回は_NULL_について解説します。 実は前回の記事で使用していた文法です。 【SAS】CALL SYMPUTは関数を用いてマクロ変数の代入ができる。 単元は分けた方が良いと思ったので、別記事として …