トップ 最新

#3 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 7055 語ス WITH 6466 定精 WITH 4127 ムフ WITH 4081 パム WITH 2349 精度 WITH 1458 スパ WITH 1192 学習 WITH 1117 ィル WITH 1069 ルタ WITH 1066 判定 WITH 635 フィ WITH 482 本語 WITH 342 以前 WITH 183 日本 WITH 1 [ WITH 1 q3 WITH 1 ] WITH 1 習さ WITH 1 させ WITH 1 せな WITH 1 なお WITH 1 おし WITH 1 して WITH 1 て使 WITH 1 使っ WITH 1 って WITH 1 てい WITH 1 いる WITH 1 るス WITH 1 タで WITH 1 です WITH 1 すが の検索結果 369 件中 1 - 10 件目 (1.047019564 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ

2005-04-06 [類似検索]

[Q3] スパムフィル

学習させなおして使っていスパムフィルタですが、まだ時々通り抜けてしまうときもありますが以前よりはかなり日本語スパムの判定精度が良くなりました。 ...

#  (スコア:10000)

2005-03-26 [類似検索]

[Q3] スパムフィルタ再び

日本語スパムの判定精度があまり上がってこないので(半分くらいすり抜けてしまいます)、ここ数日どういう風に判定しているのかをログを取って調べてみました。すると、 日本語は2gramで処理しているので英語に比べてトークンの取りうる範囲が広い 日本語のメールはクリーンなメールに対してパム学習量が少 ...

#  (スコア:7756)

2005-01-29 [類似検索]

ツッコミ!! (snak)

どこかの論文(出所がわからなくなってしまいました)を読んだときに形態素解析するとコーパスが小さいときには判定精度が上がるが、コーパスが大きくなったときには2gramの方が判定精度が上がるという実験結果があったので形態素解析するほうは試していなかったのですが、試して見る価値はあるかも知れませんね ...

#  (スコア:5912)

2005-01-12 [類似検索]

[Q3] スパムフィルタ (2)

Invalid TextIMAP4でもスパムフィルタを使えるようにして、スパム1000通程度、クリーンなメールを2000通程度学習させてから普段使っているメールアカウントで試してみたところ結構正しく判定してびっくりです。 ...

#  (スコア:5448)

2008-01-10 [類似検索]

[Q3] サーバ側のスパムフィルタと組み合わせ

サーバ側にもスパムフィルタがあった場合、そこでスパム判定されたメールは即座にスパム扱いしてしまいたいところです。そんな場合には、以下のようにします。ここではサーバ側のスパムフィルタでパム判定されたメールには、 X-Spam-Flag: YES というヘッダが付くものとします。 アカウントの設定でスパム ...

#  (スコア:5338)

2005-07-05 [類似検索]

[Q3] スパムフィルタと振り分けルール (6)

Invalid TextIMAP4のスパムフィルタはスパムだと判定するとサーバ上でメッセージを移動させようとするため、Junkフォルダをローカルフォルダにするとうまく動かないのですが、振り分けルールと統合するとこの問題も解決できそうです学習周りがなんとかなれば良いのですが、@Junk以外でクリーンと判定されたメ ...

#  (スコア:5313)

2005-06-29 [類似検索]

[Q3] スパムフィルタと振り分けルール

受信時に振り分けを実行することができるようになったので、スパムフィルタを使用してパムかどうか判定する@Junk()というマクロの関数を用意して、 <rule match="@Junk()"> <move folder="Junk"/> </rule> をスパムフィルタだと考えると、スパムフィルタと振り分けルールを一体化できそうな気がします。そうす ...

#  (スコア:5283)

2005-07-05 [類似検索]

[Q3] スパムフィルタのDBのサイズ

そういえば、ひらがなをトークン化の対象からはずしてからクリーン8000通、スパム4000通くらい学習させていすが、トークンDBのサイズは12MB程度で成長が止まったようです。おおよそありそうなトークンは出尽くしたということでしょうか。これくらいのサイズだとそこそこ実用的な速度で動くのではないかと思い ...

#  (スコア:5279)

2006-05-19 [類似検索]

[Q3] スパムフィルタでブロックする

Invalid Text複数のIMAP4でスパムフィルタを使っていてパラレルで同期すると、スパムフィルタのDBの排他制御やアカウントの排他制御が絡み合ってスパムフィルタがちゃんと動き出すまでUIがブロックしてしまうことがあります(POP3やNNTPでも程度の差はあっても同じようなことが起きます)。 スパムフィルタと ...

#  (スコア:5250)

2005-03-27 [類似検索]

[Q3] スパムフィルタ再び (2)

試しに以下を変えてみました。 いわゆる全角カタカナと全角英数字は2gramで分割せずに連続しているところまででひとつのトークンとするようにしました ひらがなや句読点などを含むトークンは無視するようにしました 同じスパム度・クリーン度を持つトークンをランダムに入れ替えて、判定対象となる15トークンに ...

#  (スコア:5240)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ