LENGTHN SAS SUBSTR

【SAS】SUBSTR関数を使って右から文字列を切り取る方法について解説【LENGTHN】

投稿日:

今回はSUBSTR関数を使って右から文字列を切り取る方法について解説します。

(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)

何故、こんなことをしようと思ったか、についてですが、

当ブログの検索クエリで「substr 右から」の流入が一定数あったので、

扱うことにしました。

SUBSTRは左から「開始位置」と「切り取る文字数」を指定する動きしかできないため、

通常では右から読み取ることはできないです。

そのため、計算式によって読み替えを行います。

(人間的には「右から」ですが、SUBSTR関数が解釈できるように「左から」読み取っても結果が同じになるように、計算式を立てます。)

右から読み取って「cde」になるのを、左から読み取って「cde」になっても結果は同じという理屈です。


/* 1 */
data data1;
 id1="abcde"; id2="abcde"; id3="abcde";
   output;
run;

data data2; set data1;
 n1 = 1;  /*末尾から何文字目を開始位置にするか*/
 n2 = 3;  /*何文字分取りたいか(先頭に向かって)*/
 id4 = lengthn(id1);
 id5 = id4-(n1+n2-1)+1;
 id6 = n2;
 id7 = substr(id1,id5,id6);
run;
  • substr(カラム, 開始位置, 文字数)(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)
  • id5 = id4-(n1+n2-1)+1;・・・id4-(n1+n2)によって、文字列の長さから右からの開始位置、切り取る長さを間引くことで左から何文字目なのか表現(-1や+1は植木算の調整用)
  • id6 = n2;・・・右から3文字なのか、左から3文字なのかはいずれにしろ3文字のため、ここは通常の使い方と変わらず。
  • 右から開始位置1、3文字分の「cde」が取れた。(実際には、左から開始位置3、3文字分切り取った。)

/* 2 */
data data1;
 id1="abcde"; id2="abcde"; id3="abcde";
   output;
run;

data data2; set data1;
 n1 = 2;  /*末尾から何文字目を開始位置にするか*/
 n2 = 4;  /*何文字分取りたいか(先頭に向かって)*/
 id4 = lengthn(id1);
 id5 = id4-(n1+n2-1)+1;
 id6 = n2;
 id7 = substr(id1,id5,id6);
run;

  • substr(カラム, 開始位置, 文字数)(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)
  • id5 = id4-(n1+n2-1)+1;・・・id4-(n1+n2)によって、文字列の長さから右からの開始位置、切り取る長さを間引くことで左から何文字目なのか表現(-1や+1は植木算の調整用)
  • id6 = n2;・・・右から4文字なのか、左から4文字なのかはいずれにしろ4文字のため、ここは通常の使い方と変わらず。
  • 右から開始位置2、4文字分の「abcd」が取れた。(実際には、左から開始位置1、4文字分切り取った。)

/* 3 */
data data1;
 id1="abcde"; id2="abcde"; id3="abcde";
   output;
run;

data data2; set data1;
 n1 = 3;  /*末尾から何文字目を開始位置にするか*/
 n2 = 2;  /*何文字分取りたいか(先頭に向かって)*/
 id4 = lengthn(id1);
 id5 = id4-(n1+n2-1)+1;
 id6 = n2;
 id7 = substr(id1,id5,id6);
run;
  • substr(カラム, 開始位置, 文字数)(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)
  • id5 = id4-(n1+n2-1)+1;・・・id4-(n1+n2)によって、文字列の長さから右からの開始位置、切り取る長さを間引くことで左から何文字目なのか表現(-1や+1は植木算の調整用)
  • id6 = n2;・・・右から2文字なのか、左から2文字なのかはいずれにしろ2文字のため、ここは通常の使い方と変わらず。
  • 右から開始位置3、2文字分の「bc」が取れた。(実際には、左から開始位置2、2文字分切り取った。)

-LENGTHN, SAS, SUBSTR

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。その2 再帰的使用

今回はSUBSTR関数の再帰的使用について解説していきます。 /* 再帰的 */ data data1; id1=”123456789″; output; run; data data2; set d …

【SAS】INPUTは日付表記をSAS日付に変換できる

今回はINPUT関数を使って日付表記をSAS日付に変換する方法について解説します。  /* “2022/01/04” */ data data1; a = “2022/01/04”; b = …

【SAS】SASで良く使うテクニック。その12「Ctrl+F」「Ctrl+R」~特定の文字列を検索、置換~【サクラエディタ】

今回はSASで良く使うテクニックということで、特定の文字列を検索、置換したい時は、「Ctrl+F」「Ctrl+R」が役に立つ理由を解説していきます。 以下のようにテーブルがあったとします。(参考:【S …

【SAS】%SYSFUNC関数はデータステップの外でも関数を使えるようにする。

今回は%SYSFUNC関数について解説します。 /* sysfunc_1 */ %put %sysfunc(substr(123456789, 2, 4)); %sysfuncにより、関数をデータステ …

【SAS】ORDER BY句無しで抽出した際の出力順【SQL】

この記事の要約:「ORDER BYを使わない場合、SQLで抽出した際の並び順は保証されない」 SQL文で抽出を行った際に、困ったことが起きました。 同じPG文なのに1回目と2回目で出力結果に違いがある …