2005-01-21 [長年日記]

[Q3] スパムフィルタ (7)

いくつか改善をしました。

スパム判定をしている間中アカウント全体がロックされてしまっていたので、ロックされる期間をなるべく短くするようにしました。

DBのハッシュのバケット数がデフォルト値のまま固定だったのを、適当に最適化をするようにしました。デフォルトのバケット数ももっと増やしても良いかもしれません。

後者の変更によってDBのサイズがだいぶ大きくなるかもしれません。私のところでは、元々tokenが5MB程度でバケット数が8191、レコード数が123101だったのですが*1、最適化したところバケット数が524287になってサイズも10MB程度になりました。

*1  しかもすべてのバケットが埋まっていました。ハッシュの意味なしかも。

[Q3] スパムフィルタ (8)

NNTPで使うことを考えるとフォルダごとにフィルタするかどうかを指定できたほうが良いのかもしれません。moderatedなグループではフィルタする必要はありませんし。

RSS 1.1

RSS 1.1のドラフトが出ています。RSS 2.0とは違ってこちらはRSS 1.0からの発展という形でRDFモデルに基づくという方向のようです。でも、RSS 1.0ともRDFモデルが変わってしまっていてそれはそれで困ったものです。


トップ «前の日記(2005-01-20) 最新 次の日記(2005-01-22)»