LENGTHN SAS SUBSTR

【SAS】SUBSTR関数を使って右から文字列を切り取る方法について解説【LENGTHN】

投稿日:

今回はSUBSTR関数を使って右から文字列を切り取る方法について解説します。

(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)

何故、こんなことをしようと思ったか、についてですが、

当ブログの検索クエリで「substr 右から」の流入が一定数あったので、

扱うことにしました。

SUBSTRは左から「開始位置」と「切り取る文字数」を指定する動きしかできないため、

通常では右から読み取ることはできないです。

そのため、計算式によって読み替えを行います。

(人間的には「右から」ですが、SUBSTR関数が解釈できるように「左から」読み取っても結果が同じになるように、計算式を立てます。)

右から読み取って「cde」になるのを、左から読み取って「cde」になっても結果は同じという理屈です。


/* 1 */
data data1;
 id1="abcde"; id2="abcde"; id3="abcde";
   output;
run;

data data2; set data1;
 n1 = 1;  /*末尾から何文字目を開始位置にするか*/
 n2 = 3;  /*何文字分取りたいか(先頭に向かって)*/
 id4 = lengthn(id1);
 id5 = id4-(n1+n2-1)+1;
 id6 = n2;
 id7 = substr(id1,id5,id6);
run;
  • substr(カラム, 開始位置, 文字数)(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)
  • id5 = id4-(n1+n2-1)+1;・・・id4-(n1+n2)によって、文字列の長さから右からの開始位置、切り取る長さを間引くことで左から何文字目なのか表現(-1や+1は植木算の調整用)
  • id6 = n2;・・・右から3文字なのか、左から3文字なのかはいずれにしろ3文字のため、ここは通常の使い方と変わらず。
  • 右から開始位置1、3文字分の「cde」が取れた。(実際には、左から開始位置3、3文字分切り取った。)

/* 2 */
data data1;
 id1="abcde"; id2="abcde"; id3="abcde";
   output;
run;

data data2; set data1;
 n1 = 2;  /*末尾から何文字目を開始位置にするか*/
 n2 = 4;  /*何文字分取りたいか(先頭に向かって)*/
 id4 = lengthn(id1);
 id5 = id4-(n1+n2-1)+1;
 id6 = n2;
 id7 = substr(id1,id5,id6);
run;

  • substr(カラム, 開始位置, 文字数)(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)
  • id5 = id4-(n1+n2-1)+1;・・・id4-(n1+n2)によって、文字列の長さから右からの開始位置、切り取る長さを間引くことで左から何文字目なのか表現(-1や+1は植木算の調整用)
  • id6 = n2;・・・右から4文字なのか、左から4文字なのかはいずれにしろ4文字のため、ここは通常の使い方と変わらず。
  • 右から開始位置2、4文字分の「abcd」が取れた。(実際には、左から開始位置1、4文字分切り取った。)

/* 3 */
data data1;
 id1="abcde"; id2="abcde"; id3="abcde";
   output;
run;

data data2; set data1;
 n1 = 3;  /*末尾から何文字目を開始位置にするか*/
 n2 = 2;  /*何文字分取りたいか(先頭に向かって)*/
 id4 = lengthn(id1);
 id5 = id4-(n1+n2-1)+1;
 id6 = n2;
 id7 = substr(id1,id5,id6);
run;
  • substr(カラム, 開始位置, 文字数)(参考:【SAS】SUBSTR関数は文字列から指定した文字数分切り取る。 | ビジネスイッチ (how-to-business.com)
  • id5 = id4-(n1+n2-1)+1;・・・id4-(n1+n2)によって、文字列の長さから右からの開始位置、切り取る長さを間引くことで左から何文字目なのか表現(-1や+1は植木算の調整用)
  • id6 = n2;・・・右から2文字なのか、左から2文字なのかはいずれにしろ2文字のため、ここは通常の使い方と変わらず。
  • 右から開始位置3、2文字分の「bc」が取れた。(実際には、左から開始位置2、2文字分切り取った。)

-LENGTHN, SAS, SUBSTR

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【SAS】SASで良く使うテクニック。その3 「Ctrl+D」~データセットのオブザベーション数が多いとき~【Excel】

今回はSASで良く使うテクニックということで、データセットのオブザベーション数(行数)が多いときは「Ctrl+D」が役に立つ理由を解説していきます。 (参考:【SAS】SASで良く使うテクニック。その …

【SAS】DROPはデータセットから変数を削除する

今回はDROPについて解説します。 (対比:KEEP 【SAS】KEEPはカラムの選択に使える。 | ビジネスイッチ (how-to-business.com)) /* drop_1 */ data …

【SAS】「NOTE: PROC SQLはNOEXECオプションを設定し、ステートメントの構文をチェックします。」の対処法

今回はSQLプロシージャを実行した際に、NOEXECオプションを使用していないにも関わらず、 勝手にNOEXECオプションが有効になってしまう場合の対処法について解説します。 結論:構文エラーを正す。 …

【SAS】ORDER BYは指定した項目の順番でレコードを並び替える。【SQL】

今回はORDER BYについて解説します。 /* order by_1 */ data data1; Id1=1111; Id2=1111; Id3=1111; output; Id1=2222; I …

【SAS】”nは本来使用できない文字を使用可能にする。

今回は”nについて解説します。(参考:Solved: what the ”  ‘n ” means? – SAS Support Commu …