2004-12-25 [長年日記]

[Q3] RSSの重複チェック

RSSエントリの重複チェックはアイテムのすべての値のハッシュを取って比較しているので、ちょっとした誤字の修正や、サーバ側の不具合によって同じエントリが何度も取得されてしまうことがあります。見逃さないという意味では良いのですがちょっとわずらわしいのも事実です。

変えるならば、

  • URLだけで比較
  • URL+日時だけで比較
  • 比較方法は同じままで、同じURLの場合にはエントリをまとめる(古いやつを消す)

あたりが考えられそうです。フィードごとに設定できると良いのかもしれません。なんとなく見ているものはURLだけで比較だけれど、変更があったら必ず気づきたいところはすべての値を比較とか。

[]