トップ 最新

#3 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 6801 パム WITH 4127 ムフ WITH 2430 スパ WITH 2215 gmail WITH 1117 ィル WITH 1069 ルタ WITH 1066 判定 WITH 767 定さ WITH 635 フィ WITH 334 設定 WITH 308 のス WITH 298 結構 WITH 194 メー WITH 109 ール WITH 1 ( WITH 1 4 WITH 1 ) WITH 1 タに WITH 1 につ WITH 1 つい WITH 1 いて WITH 1 て。 WITH 1 。gm WITH 1 タは WITH 1 は甘 WITH 1 甘め WITH 1 めに WITH 1 に設 WITH 1 され WITH 1 れて WITH 1 てい WITH 1 いる の検索結果 305 件中 1 - 10 件目 (0.324383111 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ

2004-08-07 [類似検索]

Gmail (4)

パムィルタについて。 Gmailのスパムィルタは甘めに設定されているのか、結構な数のスパムが通り抜けてしまいます。スパムじゃないメールがスパム判定されるのを避けるためなのだと思いますが、もう少し厳しくして欲しいところです。 ...

#  (スコア:10000)

2008-01-08 [類似検索]

[Q3] スパムィルタのトークン分割

最近、英語の文章をCamelCase化してSubjectや本文を書いたスパムが多くなりました。今のトークン分割方法だとまとめて一つのトークンになってしまうために初出のトークンと見なされて、スパム判定されないことが多かったので、このような場合には、CamelとCaseにトークンを分割するようにしました。 ...

#  (スコア:9555)

2005-07-05 [類似検索]

[Q3] スパムィルタのDBのサイズ

そういえば、ひらがなをトークン化の対象からはずしてからクリーン8000通、スパム4000通くらい学習させていますが、トークンDBのサイズは12MB程度で成長が止まったようです。おおよそありそうなトークンは出尽くしたということでしょうか。これくらいのサイズだとそこそこ実用的な速度で動くのではないかと思い ...

#  (スコア:9496)

2008-01-10 [類似検索]

[Q3] サーバ側のスパムィルタと組み合わせ

サーバ側にもスパムィルタがあった場合、そこでスパム判定されメールは即座にスパム扱いしてしまいたいところです。そんな場合には、以下のようにします。ここではサーバ側のスパムィルタでスパム判定されメールには、 X-Spam-Flag: YES というヘッダが付くものとします。 アカウントの設定でスパム ...

#  (スコア:9482)

2007-08-06 [類似検索]

[Q3] スパムィルタで添付ファイルのスキャン

PDFスパムが多くなってスパムィルタをすり抜けてくるので、xdoc2txtを使って添付ファイルの中のテキストもスキャンできるようにしてみました。PDFとMSオフィス系のドキュメントをスキャンします。 設定方法などは、ドキュメントのスパムィルタの項に書いてあります。 私のところでは、これでPDFスパムはほと ...

#  (スコア:9435)

2005-03-27 [類似検索]

[Q3] スパムィルタ再び (2)

試しに以下を変えてみました。 いわゆる全角カタカナと全角英数字は2gramで分割せずに連続しているところまででひとつのトークンとするようにしました ひらがなや句読点などを含むトークンは無視するようにしました 同じスパム度・クリーン度を持つトークンをランダムに入れ替えて、判定対象となる15トークンに ...

#  (スコア:9424)

2005-06-29 [類似検索]

ツッコミ!! (snak)

振り分けルールの適用は上から順番です。 ホワイトリストの処理を今のやり方でやろうとするとこんな感じでしょうか。もはやほとんどの人には書けない気もしますけど… white.macroというファイルで@Whiteという関数を定義します。 --- white.macro --- @Defun('White', @Contain(From, '@example.com'), @Contai ...

#  (スコア:9395)

2005-01-29 [類似検索]

[Q3] スパムィル(10)

しばらく使っていますが、英語のスパムはほぼ完全に弾いてくれますが、日本語のスパムは通してしまうものがあります。特に最近多い友達からのメールを装ったものとか。日本語のスパムは学習した数も少ないし、トークンの取りうる範囲も広いのでもっと学習させないとだめなのかもしれません。 ...

#  (スコア:9394)

2005-04-06 [類似検索]

[Q3] スパムィル

学習させなおして使っているスパムィルタですが、まだ時々通り抜けてしまうときもありますが、以前よりはかなり日本語スパム判定精度が良くなりました。 ...

#  (スコア:9329)

2005-01-12 [類似検索]

[Q3] スパムィル(2)

Invalid TextIMAP4でもスパムィルタを使えるようにして、スパム1000通程度、クリーンなメールを2000通程度学習させてから普段使っていメールアカウントで試してみたところ結構正しく判定してびっくりです。 ...

#  (スコア:9328)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ