FIRST, LAST SAS

【SAS】FIRST, LASTは重複を削除しユニーク化する

投稿日:2021年10月23日 更新日:

今回はfirst, lastについて解説します。



/*first last1*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if first.番号 = 1;
run;


  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last2*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if last.番号 = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。


/*first last3*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if first.日付 = 1;
run;


  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last4*/
data data1;
  番号="1111"; 日付="20210331";
    output;
  番号="1111"; 日付="20210401";
    output;
  番号="1111"; 日付="20210402";
    output;
  番号="2222"; 日付="20210331";
    output;
  番号="2222"; 日付="20210401";
    output;
  番号="2222"; 日付="20210402";
    output;
  番号="3333"; 日付="20210331";
    output;
  番号="3333"; 日付="20210401";
    output;
  番号="3333"; 日付="20210402";
    output;
  番号="4444"; 日付="20210331";
    output;
  番号="4444"; 日付="20210401";
    output;
  番号="4444"; 日付="20210402";
    output;

run;



proc sort data=data1 out=data2 ; by 番号 日付; run;


data data3; set data2; by 番号 日付;
  if last.日付 = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • 番号で昇順に並び替え、同順位なら日付でさらに並べ替える。

/*first last5*/
data data1;
  id="A"; chiku="SHINJUKU1"; 数字=1;
    output;
  id="A"; chiku="SHINJUKU1"; 数字=2;
    output;
  id="A"; chiku="SHINJUKU2"; 数字=3;
    output;
  id="B"; chiku="ICHIGAYA1"; 数字=4;
    output;
  id="B"; chiku="ICHIGAYA1"; 数字=5;
    output;
  id="B"; chiku="ICHIGAYA2"; 数字=6;
    output;
  id="C"; chiku="SHIBUYA"; 数字=7;
    output;
run;



proc sort data=data1 out=data2 ; by id chiku; run;


data data3; set data2; by id chiku;
  if first.chiku = 1;
run;

  • sort におけるby~とfirst, lastにおける by~は基本的に同じである必要がある。
  • idで昇順に並び替え、同順位ならchikuでさらに並べ替える。

実はこれ、以前紹介したNODUPKEYと同じ挙動になります。

-FIRST, LAST, SAS

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】PRINTプロシージャは入力データセットの中身を結果に表示する【obs=】

今回はPRINTプロシージャについて解説します。 /* print */ data data1; 番号=”AAAAAA”; コード=”02″; 金額=1999; output; 番号=”AAAAAA” …

【SAS】%MACROはマクロを定義することができる。その5 =を使うと数を渡す引数,数を受け取る引数を指定できる。【%MEND】

今回はマクロ引数に「=」を用いる方法について解説していきたいと思います。(事前に読んでおきたい記事:【SAS】%MACROはマクロを定義することができる。その3 マクロには引数を設定できる。【%MEN …

【SAS】サブクエリについて解説

今回はSQLのfrom句にサブクエリを使用した場合の動きについて、解説します。 [from句] まずは通常のSQLプロシージャから。 /* サブクエリ(from句_1) */ data data1; …

【SAS】SQLプロシージャはSQLを実行できる。

今回はSQLプロシージャについて解説します。 /* sql_1 */ data data1; Id1=1111; Id2=1111; Id3=1111; output; Id1=2222; Id2=2 …

【SAS】SASで良く使うテクニック。その7 「条件付き書式」~差分があるセルに色を付けたい時~【Excel】

今回はSASで良く使うテクニックということで、データセットのコンペアにおいて、差分があるセルに色を付けたい時ときは「条件付き書式」が役に立つ理由を解説していきます。 (参考:【SAS】SASで良く使う …