FIRST, LAST SAS

【SAS】FIRST, LASTは重複を削除しユニーク化する

投稿日:2021年10月23日 更新日:

今回はfirst, lastについて解説します。



/*first last1*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if first.番号 = 1;
run;


  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last2*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if last.番号 = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。


/*first last3*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if first.日付 = 1;
run;


  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last4*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if last.日付 = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last5*/
data data1;
  id="A"; chiku="SHINJUKU1"; 数字=1;
    output;
  id="A"; chiku="SHINJUKU1"; 数字=2;
    output;
  id="A"; chiku="SHINJUKU2"; 数字=3;
    output;
  id="B"; chiku="ICHIGAYA1"; 数字=4;
    output;
  id="B"; chiku="ICHIGAYA1"; 数字=5;
    output;
  id="B"; chiku="ICHIGAYA2"; 数字=6;
    output;
  id="C"; chiku="SHIBUYA"; 数字=7;
    output;
run;



proc sort data=data1 out=data2 ; by id chiku; run;


data data3; set data2; by id chiku;
  if first.chiku = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • idで昇順に並び替え、同順位ならchikuでさらに並べ替える。

実はこれ、以前紹介したNODUPKEYと同じ挙動になります。

-FIRST, LAST, SAS

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】SASで良く使うテクニック。その4 「参照元のトレース」~データセットの差分がある箇所を探すのに便利~【Excel】

今回はSASで良く使うテクニックということで、データセットの差分がある箇所を探すときは「参照元のトレース」が役に立つ理由を解説していきます。 (参考:【SAS】SASで良く使うテクニック。その1 Ex …

【SAS】SASで良く使うテクニック。その5 「SUM関数」~データセットの差分がいくつあるのか数えたい時~【Excel】

今回はSASで良く使うテクニックということで、データセットの差分がいくつあるのか数えたいときは「SUM関数」が役に立つ理由を解説していきます。 (参考:【SAS】SASで良く使うテクニック。その1 E …

【SAS】OUTPUTとDELETEの「明示的な使い方」「暗黙的な使い方」

今回はOUTPUTとDELETEにスポットを当てていきたいと思います。 /* output, delete無し */ data data1; Id1=1111; Char1=”AAAA”; outpu …

【SAS】SASで良く使うテクニック。その6 「名前ボックス」~指定したセルに飛びたい時~【Excel】

今回はSASで良く使うテクニックということで、指定したセルに飛びたい時は「名前ボックス」が役に立つ理由を解説していきます。 以前の記事で「Ctrl+R」や「Ctrl+D」を用いた例を紹介してきました。 …

【SAS】INTCK関数は指定された区間に指定された単位を何回跨ぐか数える。

data data1; Id1 =intck(“YEAR”, ’31Dec2019’d, ‘1Jan2020’d); run; 2019/12/31~2020/1/1の間に年を何回跨ぐか数える。 /* …