13時58分12秒 [Web関連]
CMSツールが普及したためか何なのかよくは分かりませんけども、URLの末尾に余計なカッコ「 ) 」や引用符「 " 」が付いた状態でリンクされていることが原因で、Not Foundエラーがなっていることが時々あります。
https://www.example.com/
にリンクしないといけないところを、https://www.example.com/)
や https://www.example.com/"
などにリンクしてしまっている……というようなケースです。
書いた本人がリンクを確認していればすぐに分かることですが。
リンクされる側がそれを(=リンク元の記述を)どうにかすることはできないわけですけども、URLの末尾に余計な記号が付加されていても正しくページを閲覧できるようにする方法はあります。
URLの末尾に余計な「 ) 」や「 " 」などの記号があっても、その記号を除外したURLにリダイレクトすれば良いだけです。
【目次:】
方法はとても簡単で、.htaccessファイルを用意して以下の1行を書くだけです。
RedirectMatch ^(.*/)[)"']$ $1
これで「/」記号で終わるURLの後に存在する閉じ丸カッコ「 ) 」と引用符「 " 」と「 ' 」が除外されます。
その結果、「 https://example.com/) 」や「 https://example.com/" 」のようなURLでリンクされていても問題なく表示できるようになります。
それ以外の記号を対象にしたい場合は、角括弧の内側に列挙すれば良いだけです。
角括弧そのものを含みたい場合や、正規表現で特別な扱いがなされる記号を含めたい場合は \
記号を使ってエスケープする必要があります。
例えば、閉じ角括弧 ]
やドット記号 .
も除外対象に含めたいなら、[)"'\]\.]
のように書けば良いでしょう。
(※特にドット記号「 . 」をそのまま書いてしまうと、「任意の1文字」にマッチしてしまうので、最後の「/」以降のあらゆる文字を除外してしまって困ったことになると思います。)
ただ、先程の.htaccessソースだと「 https://example.com/index.html) 」のようにに、「/」で終わっていないURLの末尾に余計な記号がある場合には使えません。
何でもかんでもURLの末尾に存在する記号を無条件で削除してしまうと、本当にその記号がURLの末尾に存在するような状況で不都合が起きますから、「/」で終わるURLの場合だけに限定しておく方が良いかな、と思ったのでそうしておきました。(そのような状況があるかどうかよく分かりませんけども、CGIに渡すパラメータとしてなど、可能性としてないとは言えない気がします。hoge.cgi?key="sakura"
みたいな感じで……。あまりURL内で引用符を使うケースはなさそうな気もしないでもありませんが。)
しかし、URLの末尾に存在するあらゆる余分な記号を排除したい場合には、以下のように書けば済みます。(単に先程の正規表現の中から「/」を削除しただけです。)
RedirectMatch ^(.*)[)"']$ $1
これで、あらゆるURLの末尾に存在する閉じ丸カッコ「 ) 」と引用符「 " 」や「 ' 」が除外されます。
その結果、「 https://example.com/sample.shtml) 」や「 https://example.com/sample.shtml" 」みたいなURLでリンクされていても問題なく表示できるようになります。
よほどページ数が限られていて全URLを自分で認識できている場合は良いと思うのですが、そうでない場合には「あらゆるURL」を対象にするとちょっと不安もあります。
.html や .shtml のように「動的に生成されるページではなさそうなURLの末尾」だけに限定して余計な記号がある場合を判定すれば良さそうな気もします。
下記の記述だと、URLの末尾が .html か .htm か .shtml の場合だけに限定した上で、URL末尾の「 ) 」や「 " 」や「 ' 」を除外します。
RedirectMatch ^(.*\.s?html?)[)"']$ $1
もしくは、「URLが『?』記号以外で構成されている際のURLの末尾」に限定すれば良いかもしれません。URLにクエリ文字列を付加する場合は「?」記号が使われますから。(URLの構造を自力で変換していない限りは。)
その場合は、以下のような記述になるでしょうかね。
正規表現[^\?]
で「?記号以外の文字」になりますから、「URLの中に?記号が含まれていない場合」だけを対象にできます。
RedirectMatch ^([^\?]*)[)"']$ $1
上記の2つを合体させて、
URLの末尾が .html か .htm か .shtml の場合だけに限定した上で、URLの構成文字中に「?」記号が含まれていない場合だけを対象にするなら、以下のような記述でしょうかね。
RedirectMatch ^([^\?]*\.s?html?)[)"']$ $1
これと、冒頭の『URLが「/」記号で終わる場合』とを合体させると良い感じになりそうな気がしました。
というわけで、以下のような.htaccessソースでどうでしょうか。
RedirectMatch ^([^\?]*(/|\.s?html?))[)"']$ $1
これだと、以下の条件を満たす際にだけ、
[^\?]*
)
/
)|
)\.s?html?
)URL末尾に余分な記号「 ) 」または「 " 」または「 ' 」があれば、それらを除外したURLにリダイレクトされます。
今回の動機は「他サイトからリンクされる際に、URLの末尾に余計なカッコや引用符が付いた状態でリンクされてしまっている場合にNot Foundになるのを避けたい」というだけですから、上記の対処で十分な気がします。
※RedirectMatch
とだけ書くとHTTPステータスコード302でリダイレクトされるので、問題なくリダイレクトされると確認できたらRedirectMatch permanent
と書き直して301でリダイレクトさせた方が良いかもしれません。
なお、正規表現のリファレンスは、正規表現辞典 改訂新版 (DESKTOP REFERENCE)がお勧めです。
この日記へのコメントはお気軽に! コメント数:0件
コメント数: 0件