にしし ふぁくとりー:西村文宏 個人サイト

Presented by Nishishi via Movable Type. Last Updated: 2022/03/25. 10:40:06.

Word文書のHTML化に、Wordを使うかGMailを使うか?

Microsoft Word文書をHTML形式に変換したい場合、Wordに付属しているHTML化機能を使うよりも、GMailに転送してGMailにある「HTML形式で表示」というメニューを使うことで表示されるHTMLのソースを保存する方が、いいHTMLソースが得られるんじゃないか、という話が、O'Reilly Mac DevCenter Blogに書かれてます。

Use Gmail to Convert Word Docs to HTML(@O'Reilly Mac DevCenter Blog)
via MSワード をHTMLにするならGMailで(@Goodpic)

そこで、どんな感じのHTMLソースになるのか、私も実験してみました。
適当なWordファイルを用意して、それをWordの機能でHTML化したものと、GMailのメールアドレスにWordファイルを添付したメールを送ってみて、添付ファイルの中身をHTML表示させたもののソースとを比べてみました。

GMail上では、下図のような感じ。「HTMLで表示」(英語版だと「View as HTML」)というところをクリックすると、メールに添付されてるWordファイルの中身がHTMLに変換されて表示されます。そのソースを保存すれば、WordファイルのHTML化ができることになります。

GMailでWordファイルをHTML化

Wordでは、私が持ってるMicrosoft Wordが「Office XP」に付属の「Word 2002」なので、1バージョンほど古いんですけど(^^;)、「名前を付けて保存」ダイアログで、「Webページ(フィルタ後)」という形式を選択してみました。フィルタなし版だと、Word独自の書体情報とかを延々と出力するので、それと比較しても仕方ないと思って。

Wordの機能でHTML化

…で、この両者でHTML化されたソースを比較してみました。
………。
ええと。(^^;;;

個人的には、「どっちもどっち」という感じがするんですけどね。^^;;;

GMailのHTML化は、予想に反して、スタイルシートをほとんど使ってませんね。まあ、元になるWordファイルがあんまり装飾されてないものだったというのもあるのかも知れませんが。「下線を引く」という装飾でも、u要素(<u>~</u>)が使われてます。

WordのHTML化は、装飾にスタイルシートが使われてます。本文の一部分に対してダイレクトに施した装飾とか、和文・英文のフォント指定に関しては、span要素にstyle属性を使う形でのスタイルシートなので、データ量は多くなってしまってますが。でも、「見出し」機能などを使って装飾した箇所に関しては、ちゃんとクラス名(aクラス、a0クラス、a1クラス…とかだけど)を振って、head要素内でちゃんとスタイルを定義してくれてます。
もっとも、それでもやはりHTML的にはおかしなところも多いわけですが。

ただ、じゃあ、GMailでのHTML化と、WordでのHTML化とどっちがいいのか?と言われると、どっちもどっち…という気が私はしましたけどねー。どちらかというと、まだ、あとからWordに再取り込みして活用できる可能性のある、「WordによるHTML化」の方がいいんじゃないかな?と思ったり。装飾も基本的にはスタイルシートだし。

まあ、さっきのBlogでは、当然英語版が使われてたんだろうし、私が使ってるWord2002とはいろいろ異なってる可能性もあるのですけど。

個人的には、わざわざGMailに送るくらいなら、別にWordでHTML化したらいいんじゃないか?と思います。^^;;;
スタイルシートをほとんど解釈できないような、いにしえのブラウザでしか閲覧できない環境に送る必要があって、そこにWordがインストールされていないのなら仕方ないかも知れませんけど。^^;;;

ただ、文法的におかしいのはおかしいです。どっちも。

だから、HTML化したソースをそのまま活用するのではなく、自分で手を加えて、まともなHTMLに書き換えるんだということを前提にするなら、Goodpicで指摘されているように、スタイルシートを使わずに規則性のあるHTMLタグでマークアップされるGMail版HTMLの方が、テキストエディタの一括変換機能とかをうまく活用して、楽に修正ができるかも知れません。

コメント

コメント数: 0件

コメント投稿欄 この日記に対するコメント投稿を歓迎します。



※本文中にURLは書けません。(書くと投稿が拒否されますのでご注意下さい。)

※ご投稿頂いた内容は、掲載前に管理者が確認する設定にしている場合があります。たいていは数日以内には表示されるはずですので、気長にお待ち願います。m(_ _)m

著者紹介


にしし(西村文宏)

にししでございます。本書いたり記事書いたりしてます。あと萌えたり。著書5冊発売中です(Web製作系4冊+小説1冊)。著書や記事は「西村文宏」名義。記事は主にAll Aboutで連載。本の最新刊は2011年3月に発売されたライトノベルでございますよ。

Twitter:にしし/西村文宏
にしし/西村文宏 on facebook にしし/西村文宏 on mixi フォローはお気軽に!

にしし(西村文宏)連絡先
☕ コーヒーをおごる

著書一覧と詳細

にししふぁくとりー Sakura scope内限定での主要なカテゴリ

--- 当サイト内を検索 ---