2005-03-27 [長年日記]

[Q3] スパムフィルタ再び (2)

試しに以下を変えてみました。

  1. いわゆる全角カタカナと全角英数字は2gramで分割せずに連続しているところまででひとつのトークンとするようにしました
  2. ひらがなや句読点などを含むトークンは無視するようにしました
  3. 同じスパム度・クリーン度を持つトークンをランダムに入れ替えて、判定対象となる15トークンに適切に入るようにしました

そのままでもそれほど問題にならないとは思いますが、(1)の変更でトークンの扱いが変わっているので、データベースを作り直したほうが良いかもしれません。

[HG] 久しぶりに飛べるはず

だったのですが、テイクオフの風が弱いうちはランディングが荒れていて、ランディングが多少収まってきたころにはテイクオフが強風という感じで、機体を組み立てただけでした。もう二ヶ月ほど飛べていません;_;。今年くらい飛べないのはかなり珍しいらしく、大外れ年なようです。

本日のツッコミ(全5件) [ツッコミを入れる]
# シンいち (2005-03-27 21:13)

はじめまして。2.9.12.1743を使わせていただいています。
junkフォルダからTrashにメールをMOVEした場合は、cleanにならない方が嬉しいのですがいかがでしょうか。

# snak (2005-03-27 21:40)

気持ちはわかるのですが、そもそもどちらもゴミ箱みたいなものだと思うのですが、JunkからTrashに移動したい理由はなんでしょう?

# trr (2005-03-28 12:16)

スパムフィルタのデータベースの作り直しは、Junk フォルダのメールを出してJunkに再度入れれば完了しますか?
クリーンの学習(Junkに入れてからほかのフォルダに戻す)もやっぱり必要ですよね?

それともエクスプローラでの何らかのファイルの削除も必要ですか?

# snak (2005-03-29 21:05)

エクスプローラでjunkディレクトリの下のファイルを削除してから学習しなおしてください。クリーンとスパムと両方学習させる必要があります。学習はJunkに一回入れてから出す(クリーンの場合)、Junkから一回出して入れなおす(スパムの場合)で行えます。それが面倒な場合、MessageAddClean, MessageAddJunkというアクションが定義されていますので、menus.xmlに手を入れてこれらのアクションをメニューから使えるようにすると直接学習させることができます。

# シンいち (2005-03-30 02:26)

返信遅くなってすみません。
スパムメールがむやみに多く、Junkの中は毎回ざっと確認してTrashに移してしまい、その後Trashの中で一定期間保存しておくような形で使っていました。
確かに言われてみるとJunkフォルダはごみ箱扱いですよね。私の使い方の問題かもしれません。

[]