にしし ふぁくとりー(西村文宏 個人サイト)

Presented by Nishishi via Movable Type. Last Updated: 2017/06/21. 12:30:06.

2006年のブログ検索とテキストマイニング

CNET Japanでは、2006年のネット業界の展望について語った記事が数本UPされてました。2006年の検索業界について語られてた記事では、ブログ検索について言及されてました。
展望2006:SEMと検索技術で見る2006年のサーチ業界

記事曰く、これまでのブログ検索は、単に対象をブログに限定しただけで検索手法や検索結果の提供方法に関しては、従来の検索機能をそのまま活用しただけだったと。今後は、ブログならではの検索手法や結果の表示方法が出てきて、もっと活用されるようになるんじゃないかとのこと。

ブログって、1つの話題で1つのエントリ(=ページ)が構成されることが多いですよね。だから、ブログが生成するページってのは、「そこで何が語られているのか?」が比較的解釈し易いページになると思います。で、現在、国内だけに限定しても相当数のブログが存在するわけで。これは、テキストマイニングの材料としてはかなりおいしいんじゃないかと思うのですよね。

例えば、あるキーワードについて語られているブログ(のエントリ)について、そのキーワードについて、肯定的な意見を述べているのか、それとも否定的な意見を述べているのかを判別することができれば、それで、なんか製品の反応チェックとか、流行チェックとかできそうな気がするのですよね。
…ああ、まあそれは形態素解析してから肯定的・否定的な表現を見つけるみたいな作業だから、テキストマイニングとは言わんのだろうか?…言ってもいいのかな?(^^;)

まあ、テキストマイニングってのは、大量のデータを調べてみたら何か有用な情報が見つかる(抽出できる)んじゃないか?みたいな話だから、「膨大な量の解析しやすいデータ」がたくさんある(環境がある)という点で、何かいろいろできそうな気がします。

こういうのって、ジャストシステムが強そうだなあ。ジャストシステムのConcept Base(コンセプトベース)をブログに活用したら相当いろんな情報が抽出できそうな気がするんだけど。
以前、大学の某研究会でデモを見たとき、「こりゃすげえ!」と思ったもんね。さすが、日本語処理を相手にしてでかくなった企業だけのことあるなと思ったですよ。ちょっと感動しました。(同時に、この分野での太刀打ちは可能なんだろうか?とも激しく疑問に思いました。:笑)

実は、今から2年前、まだ「ブログ」という言葉が今ほど流行ってなかった頃、うちの先生が学内ベンチャーを立ち上げるという話をしてまして、そこで、テキストマイニングを使った検索機能のあるブログシステムの構築について提案したことがあったんですよね。そういえば。(笑)

ブログ検索って、ほんとに最近の話だから(もっともそれらの開発自体はもっと前から行われてただろうけど)、2年前にホントにスタートしてれば、なんか結構いいことできてたかもなあ(笑)…と思ったり。(まあ結局、ベンチャー立ち上げる気はさらさら無かったようなので、話も無かったことになってますが。)

今後は、単純にブログに書かれてる内容を検索するってだけじゃない活用方法もたくさん出てきそうです。さっきも言ったけど、「1ページ1話題」である可能性が高いブログってのは、「何が書かれてんのか?」とか「何を言ってんのか?」ってのが、(他の一般的なウェブページと比べると)解析し易いと思うし。(多くのブログはXHTMLで、比較的いい感じのマークアップ(^^;)がされてるという点も。)

このネタはかなりおもしろそうなんですけどねー。できあがったサービスには需要もありそうだし。どんなものでも。(^^;)
ただ、このネタを独力でするには限界がありそうな気もしますが。テキストマイニングって、とっかかりの掴み所がないというか、形態素解析から始めないといけないのが面倒くさいというか(笑)、全体的に取りかかりにくいイメージがあるよーな気もしないでもないです。

「2006年にはおもしろいサービスがでてきそうです。」とか言えば綺麗にまとまりそうな気もするんだけど、開発側にいる人間としてはそんなまとめ方じゃダメなんですよねえ。^^;
「でてきそう」じゃなくて「作る!」と言わなくちゃダメなわけで。

「流行キーワード」みたいなのは、ブログ検索サイトとか(でなくても)でよくあるけど、そこから1歩進んで、そのキーワードに対して肯定的意見が何件、否定的意見が何件、…とか出るとかなりおもしろいよね。

まあ、具体的にどうすれば作れるか、今すぐに思いつけたりはしないのだけど。(笑)

コメント

コメント数: 0件

コメント投稿欄 この日記に対するコメント投稿を歓迎します。



※本文中にURLは書けません。(書くと投稿が拒否されますのでご注意下さい。)

※ご投稿頂いた内容は、掲載前に管理者が確認する設定にしている場合があります。たいていは数日以内には表示されるはずですので、気長にお待ち願います。m(_ _)m

著者紹介


にしし(西村文宏)

にししでございます。本書いたり記事書いたりしてます。あと萌えたり。著書5冊発売中です(Web製作系4冊+小説1冊)。著書や記事は「西村文宏」名義。記事は主にAll Aboutで連載。本の最新刊は2011年3月に発売されたライトノベルでございますよ。

Twitter:にしし/西村文宏
にしし/西村文宏 on facebook にしし/西村文宏 on mixi にしし/西村文宏 on Google+ フォローはお気軽に!

にしし(西村文宏)連絡先
☕ コーヒーをおごる

著書一覧と詳細

関連する記事など

※下記には、本サイト内外の関連記事などが8本くらい自動で表示されています。

にししふぁくとりー Sakura scope内限定での主要なカテゴリ

--- 当サイト内を検索 ---