FIRST, LAST SAS

【SAS】FIRST, LASTは重複を削除しユニーク化する

投稿日:2021年10月23日 更新日:

今回はfirst, lastについて解説します。



/*first last1*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if first.番号 = 1;
run;


  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last2*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if last.番号 = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。


/*first last3*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if first.日付 = 1;
run;


  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last4*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if last.日付 = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last5*/
data data1;
  id="A"; chiku="SHINJUKU1"; 数字=1;
    output;
  id="A"; chiku="SHINJUKU1"; 数字=2;
    output;
  id="A"; chiku="SHINJUKU2"; 数字=3;
    output;
  id="B"; chiku="ICHIGAYA1"; 数字=4;
    output;
  id="B"; chiku="ICHIGAYA1"; 数字=5;
    output;
  id="B"; chiku="ICHIGAYA2"; 数字=6;
    output;
  id="C"; chiku="SHIBUYA"; 数字=7;
    output;
run;



proc sort data=data1 out=data2 ; by id chiku; run;


data data3; set data2; by id chiku;
  if first.chiku = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • idで昇順に並び替え、同順位ならchikuでさらに並べ替える。

実はこれ、以前紹介したNODUPKEYと同じ挙動になります。

-FIRST, LAST, SAS

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】NODUPKEYはソート時に重複を削除する

今回はNODUPKEYについて解説します。 data data1; id=”A”; chiku=”SHINJUKU1″; 数字=1; output; id=”A”; chiku=”SHINJUKU2″ …

【SAS】CONTENTSプロシージャはデータセットに関する情報を表示する。

今回はCONTENTSプロシージャについて解説します。  /* data1 */ data data1; Id1=1111; Id2=1111; Id3=1111; output; Id1= …

【SAS】%MACROはマクロを定義することができる。その2 同名マクロによる再定義【%MEND】

今回は同名マクロによる再定義について解説していきたいと思います。(前回の記事:【SAS】%MACROはマクロを定義することができる。【%MEND】 | ビジネスイッチ (how-to-business …

【SAS】SASで日付を扱う(年月日)【”d】 【YEAR()】【MONTH()】【DAY()】【MDY()】

今回は日付を用いた様々な操作について解説します。  /*”d*/ data data1; Id1 = ’03jan2022’d; run; ’03jan2022’d …

【SAS】ROUNDは四捨五入して数値を丸める

今回はROUNDについて解説します。 /* 正常形 */ data work.data1; _100 = round(1234.56789, 100); _10 = round(1234.56789, …