今回はfirst, last↔SORT NODUPKEYの変換について解説します。
結論を先に書くと、変換できる場合、変換できない場合とがあります。
/*sort1*/
data data1;
id1="1111"; id2="1111";
output;
id1="1111"; id2="2222";
output;
id1="1111"; id2="3333";
output;
id1="2222"; id2="3333";
output;
id1="2222"; id2="2222";
output;
id1="2222"; id2="1111";
output;
id1="3333"; id2="2222";
output;
id1="3333"; id2="1111";
output;
id1="3333"; id2="3333";
output;
run;
proc sort data=data1 out=data2 ; by id1 id2 ; run;
data data3; set data2; by id1 id2;
if first.id2 = 1;
run;
data:image/s3,"s3://crabby-images/af479/af4794f62be1b419f597f30969317794c90da3b4" alt=""
data:image/s3,"s3://crabby-images/c8182/c818204f34e6b30e47015633c1049289c5914fdf" alt=""
data:image/s3,"s3://crabby-images/466df/466dfb68d90ae8ea83360f8638c8257e51576210" alt=""
ソート⇒ユニークをnodupkeyで表すと、
/* nodupkey1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;
data:image/s3,"s3://crabby-images/83d44/83d440b7d7657bacef5b305ae44c52a454fbc37a" alt=""
このようにソート⇒ユニークの流れはnodupkeyで書き表すことができます。
続いて、sort2
/*sort2*/
data data1;
id1="1111"; id2="1111";
output;
id1="1111"; id2="2222";
output;
id1="1111"; id2="3333";
output;
id1="2222"; id2="3333";
output;
id1="2222"; id2="2222";
output;
id1="2222"; id2="1111";
output;
id1="3333"; id2="2222";
output;
id1="3333"; id2="1111";
output;
id1="3333"; id2="3333";
output;
run;
proc sort data=data1 out=data2 ; by id1 id2 ; run;
data data3; set data2; by id1 id2;
if first.id1 = 1;
run;
data:image/s3,"s3://crabby-images/9bab9/9bab986eb2c7555be11e8659a70abf9a38336b7e" alt=""
data:image/s3,"s3://crabby-images/f5852/f5852baa146e3eb30ff59718cbcfec8b5873ec21" alt=""
data:image/s3,"s3://crabby-images/b8fd4/b8fd488e33f4fc612bd3d29699a421f2c571e6a6" alt=""
このソート⇒ユニークの流れをnodupkeyで書き表そうとすると、
/* nodupkey2_1 */
proc sort nodupkey data=data1 out=data3 ; by id1 id2 ; run;
data:image/s3,"s3://crabby-images/b3ac4/b3ac45c7909af22d48c643e1c20309f71602ba40" alt=""
上記のnodupkey2_1では不適切なことが分かります。
/* nodupkey2_2 */
proc sort nodupkey data=data1 out=data3 ; by id1 ; run;
data:image/s3,"s3://crabby-images/df88e/df88ee8a1b824b58863b2d84b8e25d785da453b2" alt=""
nodupkey2_2でも無いことが分かります。
/* nodupkey2_3 */
proc sort nodupkey data=data1 out=data3 ; by id2 ; run;
data:image/s3,"s3://crabby-images/402f4/402f4ce8efa8f74e2b1dd0aec629d10224850ce5" alt=""
nodupkey2_3でも無いことが分かります。
/* nodupkey2_4 */
proc sort nodupkey data=data1 out=data3 ; by descending id1 ; run;
data:image/s3,"s3://crabby-images/65d39/65d39e7e5da391f9325091a0d976a4bc4d594033" alt=""
nodupkey2_4でも無いことが分かります。
/* nodupkey2_5 */
proc sort nodupkey data=data1 out=data3 ; by descending id2 ; run;
data:image/s3,"s3://crabby-images/7e28e/7e28eb16c3d31f2189c0fbfd256502a8e796dcc5" alt=""
nodupkey2_5でも無いことが分かります。
まとめると、ソートキーとユニークキーが同一の場合は変換できます。
異なる場合は変換できない場合があります。