更新ファイルから情報を自動抽出し、RSSやAtomフィードを自動作成する「Fumy RSS&Atom Maker」に関するご要望はこちらからどうぞ。
にしし ふぁくとりー
にししふぁくとりーフリーソフトFumy RSS&Atom Maker → サポートフォーラム

Fumy RSS & Atom Maker

Produced by Fumihiro Nishimura.(Nishishi) Since 2005/10/31.

トップページ > 記事閲覧
サイト設定時の情報抽出方法の設定について
日時: 2007/09/26 10:58
名前: I-Zack   <c25.highwaystar@gmail.com>
参照: http://www.geocities.jp/yk030223/

初心者です>_<
オンラインマニュアルを見ると情報抽出方法を設定する際に、「主に普段記述されているHTMLのスタイルに合わせて、設定を変更して下さい」とありますが、具体的にどのように設定して良いのか全く分かりません>_<

デフォルトのままRSSを生成したら、タイトル、カテゴリ、概要までは適切に表示されているようですが、内容のところにはHTMLソースの一部(bodyタグでくくられた範囲)がそのまま表示されていました。これで問題ないでしょうか?

メンテ

Page: 1 |

Re: サイト設定時の情報抽出方法の設定について ( No.1 )
日時: 2007/10/11 01:17
名前: にしし

I-Zackさん、どうもです。

抽出方法の設定に関しては、「ここを抽出したいんだ!」という要望に合致するように設定するのが良い、というだけであって、デフォルトのままでも(何か文字列が抽出されているなら)そんなに問題にはならないと思います。

> 内容のところにはHTMLソースの一部(bodyタグで
> くくられた範囲)がそのまま表示されていました。

まあ、大きな問題にはならないと思いますが、無駄にファイルサイズが大きくなってしまいますね。ページをまるごと含めてしまっているわけですから。
内容の抽出方法の設定で「body要素」から抽出するよう設定されているのが原因ですので、気に入らない場合は他の要素名「p要素」とかに変更してみて下さい。

最も望ましいのは、I-Zackさんが「ここを抽出させたい」と思う箇所の要素名(など)を設定されることです。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.2 )
日時: 2007/10/21 00:32
名前: Dancing Men

はじめまして、こんにちは。
先日ダウンロードして、使ってみました。大きな問題も無く、動作しています。
ただ、情報抽出方法について、少々疑問がありますので、質問させてください。

「エントリー内容」の取得先ですが、
わたしのサイトの場合、ページごとのデザインが何種類かあるため、
単一の要素名などでは、うまく対応できません。
RSSファイル内を確認してみると、
RSSファイル内にそもそも、「エントリー内容」が抽出されているわけではないようですし、
また、このスレッドを見ますと、以下のように記述されています。

>(何か文字列が抽出されているなら)
> そんなに問題にはならないと思います。

そこで、質問なのですが、
そもそも、「エントリー内容」とは、何のために抽出しているのでしょうか?
要するに、何に使われているのでしょうか?
また、うまく抽出できなかった場合、とりたてて不都合はないという理解でよいのでしょうか?

お忙しいとは思いますが、よろしければ、ご回答をお願いいたします。
よろしくお願いいたします。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.3 )
日時: 2007/10/25 03:12
名前: にしし

Dancing Menさん、どうもです。

> RSSファイル内を確認してみると、
> RSSファイル内にそもそも、「エントリー内容」が抽出されているわけではない

出力形式が「RSS1.0」か「RSS2.0」の場合、デフォルトの設定のままでは「エントリー内容」はRSS内に含まれません。
出力形式が「Atom0.3」の場合は、デフォルトの設定でも「エントリー内容」はAtom内に含まれます。

RSS1.0/2.0で「エントリー内容」を含めたい場合は、出力設定で「モジュール設定」項目にある「Contentを使う」にチェックを入れて下さい。
なお、HTMLを含めるか除外するかは「Content」タブで設定できます。

> そもそも、「エントリー内容」とは、何のために抽出しているのでしょうか?
> 要するに、何に使われているのでしょうか?

というわけで、「エントリー内容」も設定さえすればRSSフィード内に含められます。

> また、うまく抽出できなかった場合、とりたてて不都合は
> ないという理解でよいのでしょうか?

その通りです。
エントリー内容を含めなかった場合、RSSリーダー上にエントリー内容がまったく表示されないとかも知れませんが、その場合でも「更新した」という情報は伝わるので、RSSの機能としてそれほど問題はないと思います。

> 単一の要素名などでは、うまく対応できません。

確かに、ページによって内容は様々でしょうから単一の要素名で対応するのは難しいですね。私もそうです。(^_^;;;

HTMLのコメントを使って、「 <!-- ここから更新部分 --> 」と「 <!-- ここまで更新部分 --> 」みたいなのをHTML中に含ませておいて、この範囲を抽出させる方法が今のところ現実的な気がしています。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.4 )
日時: 2007/10/25 23:58
名前: Dancing Men

にししさん、こんにちは。
回答していただき、ありがとうございます。

> エントリー内容を含めなかった場合、RSSリーダー上に
> エントリー内容がまったく表示されないとかも知れませんが、
> その場合でも「更新した」という情報は伝わるので、
> RSSの機能としてそれほど問題はないと思います。

特に、問題ないとのことで、安心しました。
参考になりました。

> HTMLのコメントを使って、「 <!-- ここから更新部分 --> 」と
> 「 <!-- ここまで更新部分 --> 」みたいなのをHTML中に含ませておいて、
> この範囲を抽出させる方法が今のところ現実的な気がしています。

この方法も、参考になりました。
どうしても内容抽出させたい場合に、使ってみます。

お忙しい中、丁寧に回答していただき、本当にありがとうございます。
あらためて、お礼申し上げます。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.5 )
日時: 2008/01/10 01:08
名前: フォッシュ

はじめまして。
数時間前にこのソフトを知り、サイトに設置しようと色々試しています。
自己流の変なタグの組み方が見に染み付いてしまっていることを確認させられます_| ̄|○

質問させてください。

・抽出した情報にhtmlタグが含まれている場合、その部分を削るオプションはないでしょうか?
 変なタグの組み方をしているせいか_| ̄|○

・抽出した情報から特定の文字列を削るオプションは無いでしょうか?
 同上_| ̄|○

・ジャンルですが、htmを置いているページの各ディレクトリ名を使いたいのですが、出来ますか?

機能として無いものは、要望として問題なさそうなら、投票の方に投稿させていただきます_| ̄|○

では、失礼します。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.6 )
日時: 2008/01/10 22:11
名前: にしし

フォッシュさん、どうもです。

> 抽出した情報にhtmlタグが含まれている場合、
> その部分を削るオプションはないでしょうか?

HTMLタグを取り除く設定は可能です。
メイン画面のツールバーで「出力設定」ボタンをクリックして「出力設定ウインドウ」を表示させた後、「Content」タブをクリックして下さい。

そこに「内容設定」という項目があり、標準では『マークアップをそのまま含める』という項目が選択されています。
ここを『プレーンテキストにする(HTMLタグを除外する』に変更すれば、抽出情報からHTMLタグを取り除くことができます。

> 抽出した情報から特定の文字列を削るオプションは無いでしょうか?

残念ながら、抽出した情報の中から特定の文字列を取り除くような設定はないですね……。抽出の方法そのものをいろいろ工夫していただくしかないです。

> ジャンルですが、htmを置いているページの各ディレクトリ名を使いたいのですが

なるほど。ジャンルはディレクトリで区切られている可能性もありますから、そういう指定ができれば便利そうですね。
現状ではそのような設定はできませんが、今後のバージョンで対応したいと思います。

> 要望として問題なさそうなら、投票の方に投稿させていただきます

お気軽にご投稿下さい。
同様の要望を持たれている方々がどれくらい居るのかを知る指標にもなりますので、今後の開発の参考になりますので。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.7 )
日時: 2008/01/12 18:34
名前: フォッシュ

ご回答ありがとうございます。
タグ除外の件、もうちょっと注意して探すべきでした。お手数をおかけしました。
後ろの二つは要望の方へ投稿させていただきます。
ありがとうございました。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.8 )
日時: 2008/02/07 09:07
名前: A

はじめまして。
初心者ですので、言っていることをご理解いただけるかわからないのですが・・・。
要素の中でアラインなどを指定している場合(例えば<div class="title" align="left">)、情報抽出時に<div class="title">だけ指定しても機能しないようなのですが(<div class="title" align="left">とアラインも含めてすべて書かないとそこから情報を抽出してくれない)、ページによってアラインを指定していないものもあり、困っています。
何か対処方法はありますでしょうか。
よろしくおねがいします。
メンテ
Re: サイト設定時の情報抽出方法の設定について ( No.9 )
日時: 2008/02/18 21:44
名前: にしし

Aさん、こんにちは。

抽出範囲を文字列で指定する場合は「全文一致」で該当する場所を検索することになるので、ご指摘の方法では残念ながら無理ですね。
範囲の開始文字列に『 <div class="title" 』とだけ記述(=閉じるタグを書かない)して、HTMLタグをフィードに含めない設定にすれば、もしかしたらなんとかなるかも知れません……。

が、現在のところ、明確に解決できる方法はないです。
それが先頭のdiv要素なのであれば、要素名を指定することで抽出もできますが……。

今後のバージョンで解決策を検討したいと思います。
メンテ

Page: 1 |

題名 スレッドをトップへソート
名前
E-Mail
URL
パスワード (記事メンテ時に使用)
コメント

※スパム対策のため、全角の句読点が1つも含まれない本文は投稿できませんのでご注意下さい。
※URLは自動でリンクになります。HTMLタグは書けません。

   クッキー保存