正規表現で、「先頭にある」文字列ではなく、「先頭にはない」文字列だけにマッチさせたい場合

2013年2月27日(水) 11時24分31秒 [Perl/CGI]

正規表現で、「先頭にある」文字列ではなく、「先頭にはない」文字列だけにマッチさせたい場合

正規表現で「 ^ABC 」と書くと「先頭にあるABC」がマッチします。
が、その逆で「先頭にはないABC」（＝文の途中にあるABC）だけにマッチさせたい場合もあります。
その場合、どう書けばいいでしょうか？(^_^;)

単純に、以下のように正規表現を書くと、先頭だろうが途中だろうが、ありとあらゆる「ABC」にマッチします。（※正規表現なのはABCの部分だけで、他はPerlっぽい記述方法ですが。mは検索の演算子で、gは繰り返すオプション。）

m/ABC/g

で、「先頭にあるABC」だけにマッチさせたいのであれば、正規表現で「先頭」という意味の「 ^ 」記号を加えて以下のように書けば良いことになります。

m/^ABC/g

問題は、この逆パターンです。(^_^;)
先頭以外のABCにマッチさせたいとき。

すべての「ABC」にマッチさせる
ただし、「文頭にあるABC」にはマッチしないようにする

こんな指定って、正規表現でスマートに書けるもんなんですかね？
とりあえず、以下のように「 .ABC 」とすることで（私のしたかった用途では）解決しました。

m/.ABC/g

「 . 」記号は、正規表現で「任意の1文字」を表します。
文字列「ABC」の直前に何か1文字あれば、それは（文頭ではなく）文の途中なわけですから。

ただ、この正規表現だと、直前にある余分な1文字も含めてマッチしてしまいます。
私の用途は、文字列の変換だったので、以下のように「 (.)ABC 」としておいて、置換後の文字列で後方参照を使って同文字を入れる形で解決しました。

s/(.)ABC/\1いろは/g

「\1」は後方参照です。マッチした文字列のうち ( ) 内にある文字列がそのまま入ります。（sは置換の演算子です。）
上記のような正規表現で文字列を置換処理すると、以下のような結果になります。
（先頭以外にある「ABC」を「いろは」に変換）

元の文字列：　ABCDEFABCDEF

置換処理後：　ABCDEFいろはDEF

先頭にある「ABC」は、（直前に何も文字がないため）正規表現「 (.)ABC 」にはマッチしないので対象になりません。
次にある「ABC」は、（直前に文字「F」があるため）正規表現「 (.)ABC 」にマッチするので対象になります。
1行ずつ正規表現での置換処理が実行されるのであれば、これでうまくいきそうです。

複数行を一気に処理する場合で、正規表現の「.」（＝任意の1文字）が「改行」記号にもマッチする場合は、もうちょっと何か面倒そうですが。(^_^;)
その場合は、「.」（任意の1文字）ではなく、「『改行コード以外の何か』が直前にある場合」という感じの指定を前に付ける必要があるかな……。

複数行を一括処理しないことが前提であれば「.」記号でいけそうです。
ま、そんな感じで。

なお、Perlでの正規表現に関しては、以下のサイトにも詳しい解説があります。
■正規表現 | Smart -Web Magazine
Perlに限定しない正規表現の解説としては、以下のサイトも詳しいです。
■Regular Expression(Riue ちゃんの正規表現講座)

ツイート facebookシェア LINEで送るはてなブックマーク Pocket URLとタイトルをコピー ☕ コーヒーをおごる

この日記へのコメントはお気軽に！コメント数:0件

著者紹介

にしし(西村文宏)

にししでございます。本書いたり記事書いたりしてます。あと萌えたり。著書5冊発売中です(Web製作系4冊＋小説1冊)。著書や記事は「西村文宏(にしむらふみひろ)」名義。本の最新刊は2011年3月に発売されたライトノベルでございますよ。

にしし(西村文宏)連絡先

☕ コーヒーをおごる

製作ツール

以下のようなツールを作って配布しています。

CGIてがろぐお手軽マイクロブログ的フリーCGI

➡ 備忘録・メモ帳・日記・チャットツールなどとしてのほか、「自分専用Twitter」などとしても活用可能な、お手軽メモ掲示板フリーCGIです。
CGIさんごよみスキン式のカレンダー表示フリーCGI

➡ カレンダー形式でスケジュールを表示できる予定表掲示板フリーCGIです。日本の祝日規則や移動祝日にも対応するほか、独自記念日の登録や、RSS配信も可能。