2006年3月13日(月) 17時58分38秒  [C++ Builder ] 
							
							何で今まで気づかなかったんだ…。
C++ Builderで正規表現を使うには、次の2つの方法があります。
TRegexpクラスを使う(regexp.h) 
POSIX互換関数を使う(pcreposi.h) 
 
pcreposi.hをインクルードして実現できるPOSIX互換関数を使った方が、高機能な正規表現の解釈が可能っぽいです。ただし、日本語はダメなようですが。正規表現でのマッチの判断に日本語も使いたいなら、TRegexpクラスを使えばよいです。ただ、TRegexpクラスの場合は、使える正規表現の表現内容がちょっと乏しい感じがしますが。
マッチの判断に日本語を使わないんなら、もうpcreposi.hを使うのがいいと思います。
以下、C++Builder ML に流れてたサンプルそのまんまですが、メモしときます。
#include <pcreposi.h>
Memo1に対象文字列が入ります。Edit1に正規表現が入ってて、その結果がMemo2に入ります。
次に、TRegexpクラスを使う場合。
#include <regexp.h>
基本的に、TRegexpクラスを使っても、POSIX互換関数を使っても、同じ処理ができます。ただ、HTMLを解析する場合などで、次のような正規表現を書いた場合、TRegexpクラスではうまくマッチできません。
<div.*>[\W\w]*?</div>
上記の正規表現では、「[\W\w]*」に一致する長さを最小限にするため、「*」の後に「?」を加えています。この「量指定子の一致部分を最小限にする」という意味での「?」がTRegexpクラスでは扱えないようです。POSIX互換関数の方だとうまくいきます。
「.*?」と書かずに「[\W\w]*?」と書いているのは、改行も含めるためです。正規表現で「.」(ドット)は、「改行以外の1文字」に該当するので、改行を含めるためには、「\w\W」みたいにする必要があります。(\wは単語構成文字、\Wは単語構成文字以外に一致。)
※日本語を扱って、「 萌[えへ] 」みたいな正規表現を使いたい場合は、TRegexpクラスでないとダメなようですが。
というわけで、C++Builderでも、ずいぶん楽に正規表現が扱えるという事実に気づいたというお話でした…。
参考・元ネタ: