にしし ふぁくとりー:西村文宏 個人サイト

Presented by Nishishi via Movable Type. Last Updated: 2020/11/15. 12:52:54.

URLの末尾に余分な記号 ) や " 等があっても正しいページにリダイレクトする.htaccessの書き方

URLの末尾に不要な記号が付加された状態でリンクされていても Not Foundにせず意図通りのページを表示させたい

CMSツールが普及したためか何なのかよくは分かりませんけども、URLの末尾に余計なカッコ「 ) 」や引用符「 " 」が付いた状態でリンクされていることが原因で、Not Foundエラーがなっていることが時々あります。

  • 本来なら https://www.example.com/ にリンクしないといけないところを、
  • なぜか https://www.example.com/)https://www.example.com/" などにリンクしてしまっている

……というようなケースです。
書いた本人がリンクを確認していればすぐに分かることですが。

リンクされる側がそれを(=リンク元の記述を)どうにかすることはできないわけですけども、URLの末尾に余計な記号が付加されていても正しくページを閲覧できるようにする方法はあります。
URLの末尾に余計な「 ) 」や「 " 」などの記号があっても、その記号を除外したURLにリダイレクトすれば良いだけです。

【目次:】

URLの末尾に不要な記号があっても無視して(記号なしURLにリダイレクトして)正しいページを表示させる.htaccessソース

方法はとても簡単で、.htaccessファイルを用意して以下の1行を書くだけです。

RedirectMatch ^(.*/)[)"']$ $1

これで「/」記号で終わるURLの後に存在する閉じ丸カッコ「 ) 」と引用符「 " 」と「 ' 」が除外されます。
その結果、「 https://example.com/) 」や「 https://example.com/" 」のようなURLでリンクされていても問題なく表示できるようになります。

それ以外の記号を対象にしたい場合は、角括弧の内側に列挙すれば良いだけです。
角括弧そのものを含みたい場合や、正規表現で特別な扱いがなされる記号を含めたい場合は \ 記号を使ってエスケープする必要があります。
例えば、閉じ角括弧 ] やドット記号 . も除外対象に含めたいなら、[)"'\]\.]のように書けば良いでしょう。
(※特にドット記号「 . 」をそのまま書いてしまうと、「任意の1文字」にマッチしてしまうので、最後の「/」以降のあらゆる文字を除外してしまって困ったことになると思います。)

終わりが「/」ではないURLでも、末尾の余分な記号を無視する.htaccessソース

ただ、先程の.htaccessソースだと「 https://example.com/index.html) 」のようにに、「/」で終わっていないURLの末尾に余計な記号がある場合には使えません。

何でもかんでもURLの末尾に存在する記号を無条件で削除してしまうと、本当にその記号がURLの末尾に存在するような状況で不都合が起きますから、「/」で終わるURLの場合だけに限定しておく方が良いかな、と思ったのでそうしておきました。(そのような状況があるかどうかよく分かりませんけども、CGIに渡すパラメータとしてなど、可能性としてないとは言えない気がします。hoge.cgi?key="sakura"みたいな感じで……。あまりURL内で引用符を使うケースはなさそうな気もしないでもありませんが。)

しかし、URLの末尾に存在するあらゆる余分な記号を排除したい場合には、以下のように書けば済みます。(単に先程の正規表現の中から「/」を削除しただけです。)

RedirectMatch ^(.*)[)"']$ $1

これで、あらゆるURLの末尾に存在する閉じ丸カッコ「 ) 」と引用符「 " 」や「 ' 」が除外されます。
その結果、「 https://example.com/sample.shtml) 」や「 https://example.com/sample.shtml" 」みたいなURLでリンクされていても問題なく表示できるようになります。

▼もうちょっと何か限定したい

よほどページ数が限られていて全URLを自分で認識できている場合は良いと思うのですが、そうでない場合には「あらゆるURL」を対象にするとちょっと不安もあります。

▽除外1

.html や .shtml のように「動的に生成されるページではなさそうなURLの末尾」だけに限定して余計な記号がある場合を判定すれば良さそうな気もします。
下記の記述だと、URLの末尾が .html か .htm か .shtml の場合だけに限定した上で、URL末尾の「 ) 」や「 " 」や「 ' 」を除外します。

RedirectMatch ^(.*\.s?html?)[)"']$ $1
▽除外2

もしくは、「URLが『?』記号以外で構成されている際のURLの末尾」に限定すれば良いかもしれません。URLにクエリ文字列を付加する場合は「?」記号が使われますから。(URLの構造を自力で変換していない限りは。)
その場合は、以下のような記述になるでしょうかね。
正規表現[^\?]で「?記号以外の文字」になりますから、「URLの中に?記号が含まれていない場合」だけを対象にできます。

RedirectMatch ^([^\?]*)[)"']$ $1
▽除外1+2

上記の2つを合体させて、
URLの末尾が .html か .htm か .shtml の場合だけに限定した上で、URLの構成文字中に「?」記号が含まれていない場合だけを対象にするなら、以下のような記述でしょうかね。

RedirectMatch ^([^\?]*\.s?html?)[)"']$ $1

これと、冒頭の『URLが「/」記号で終わる場合』とを合体させると良い感じになりそうな気がしました。

URL内に「?」記号が含まれておらず、URLが「/」か「.htm .html .shtml」のいずれかで終わる場合に、末尾の余分な記号を無視するようリダイレクトする.htaccessソース

というわけで、以下のような.htaccessソースでどうでしょうか。

RedirectMatch ^([^\?]*(/|\.s?html?))[)"']$ $1

これだと、以下の条件を満たす際にだけ、

  • URL内に「?」記号が1つも含まれていない場合で、 ([^\?]*
    • URLが「/」記号で終わっているか、 (/
    • または (|
    • URLが「.htm」または「.html」または「.shtml」で終わっているとき (\.s?html?

URL末尾に余分な記号「 ) 」または「 " 」または「 ' 」があれば、それらを除外したURLにリダイレクトされます。

今回の動機は「他サイトからリンクされる際に、URLの末尾に余計なカッコや引用符が付いた状態でリンクされてしまっている場合にNot Foundになるのを避けたい」というだけですから、上記の対処で十分な気がします。

RedirectMatchとだけ書くとHTTPステータスコード302でリダイレクトされるので、問題なくリダイレクトされると確認できたらRedirectMatch permanentと書き直して301でリダイレクトさせた方が良いかもしれません。

なお、正規表現のリファレンスは、正規表現辞典 改訂新版 (DESKTOP REFERENCE)がお勧めです。

コメント

コメント数: 0件

コメント投稿欄 この日記に対するコメント投稿を歓迎します。



※本文中にURLは書けません。(書くと投稿が拒否されますのでご注意下さい。)

※ご投稿頂いた内容は、掲載前に管理者が確認する設定にしている場合があります。たいていは数日以内には表示されるはずですので、気長にお待ち願います。m(_ _)m

著者紹介


にしし(西村文宏)

にししでございます。本書いたり記事書いたりしてます。あと萌えたり。著書5冊発売中です(Web製作系4冊+小説1冊)。著書や記事は「西村文宏」名義。記事は主にAll Aboutで連載。本の最新刊は2011年3月に発売されたライトノベルでございますよ。

Twitter:にしし/西村文宏
にしし/西村文宏 on facebook にしし/西村文宏 on mixi フォローはお気軽に!

にしし(西村文宏)連絡先
☕ コーヒーをおごる

著書一覧と詳細

関連する記事など

※下記には、本サイト内外の関連記事などが8本くらい自動で表示されています。

にししふぁくとりー Sakura scope内限定での主要なカテゴリ

--- 当サイト内を検索 ---