トップ 最新

#3 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 8246 xdoc2txt WITH 8162 パム WITH 6191 ムフ WITH 4186 付フ WITH 2975 ス系 WITH 2930 定方 WITH 2916 スパ WITH 2656 添付 WITH 2234 ィル WITH 2138 ルタ WITH 1964 スキ WITH 1811 ュメ WITH 1588 フィ WITH 1240 始末 WITH 1100 ャン WITH 1080 pdf WITH 1067 ドキ WITH 972 ァイ WITH 957 キャ WITH 769 てス WITH 767 キュ WITH 708 イル WITH 690 タで WITH 581 ファ WITH 579 展開 WITH 550 テキ WITH 548 キス WITH 525 ムが WITH 443 オフ WITH 430 ィス WITH 416 メン WITH 415 方法 の検索結果 225 件中 1 - 10 件目 (0.257705537 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ

2007-08-06 [類似検索]

[Q3] スパムィルタで付ファイルのスキャン

PDFパムが多くなってスパムィルタをすり抜けてくるので、xdoc2txtを使って添付ファイルの中のテキストもスキャンできるようにしてみました。PDFとMSオフィス系ドキュメントをスキャンします。 設定方法などは、ドキュメントのスパムィルタの項に書いてあります。 私のところでは、これでPDFパムはほと ...

#  (スコア:10000)

2007-07-17 [類似検索]

PDFパム

最近PDFを使ったスパムが多いなと思っていたら、台頭するPDFパム--画像スパムに代わリ新たな脅威に、大半のスパム・フィルタは検知できずなんていう記事も出ていました。 QMAIL3のスパムィルタでxdoc2txtを使ってPDFの中の文字列も判定条件に含めるようにすれば防げるかもしれません。 ...

#  (スコア:8305)

2005-07-05 [類似検索]

[Q3] スパムィルタのDBのサイズ

そういえば、ひらがなをトークン化の対象からはずしてからクリーン8000通、スパム4000通くらい学習させていますが、トークンDBのサイズは12MB程度で成長が止まったようです。おおよそありそうなトークンは出尽くしたということでしょうか。これくらいのサイズだとそこそこ実用的な速度で動くのではないかと思い ...

#  (スコア:7002)

2008-01-10 [類似検索]

[Q3] サーバ側のスパムィルタと組み合わせ

サーバ側にもスパムィルタがあった場合、そこでスパムと判定されたメールは即座にスパム扱いしてしまいたいところです。そんな場合には、以下のようにします。ここではサーバ側のスパムィルタでパムと判定されたメールには、 X-Spam-Flag: YES というヘッダが付くものとします。 アカウントの設定でスパム ...

#  (スコア:6999)

2005-04-06 [類似検索]

[Q3] スパムィル

学習させなおして使っているスパムィルタですが、まだ時々通り抜けてしまうときもありますが、以前よりはかなり日本語スパムの判定精度が良くなりました。 ...

#  (スコア:6957)

2005-01-12 [類似検索]

[Q3] スパムィルタ (2)

Invalid TextIMAP4でもスパムィルタを使えるようにして、スパムを1000通程度、クリーンなメールを2000通程度学習させてから普段使っているメールアカウントで試してみたところ結構正しく判定してびっくりです。 ...

#  (スコア:6957)

2005-07-05 [類似検索]

[Q3] スパムィルタと振り分けルール (6)

Invalid TextIMAP4のスパムィルタはスパムだと判定するとサーバ上でメッセージを移動させようとするため、Junkフォルダをローカルフォルダにするとうまく動かないのですが、振り分けルールと統合するとこの問題も解決できそうです。 学習周りがなんとかなれば良いのですが、@Junk以外でクリーンと判定されたメ ...

#  (スコア:6957)

2004-08-07 [類似検索]

Gmail (4)

パムィルタについて。 Gmailのスパムィルタは甘めに設定されているのか、結構な数のスパムが通り抜けてしまいます。スパムじゃないメールがスパムと判定されるのを避けるためなのだと思いますが、もう少し厳しくして欲しいところです。 ...

#  (スコア:6946)

2005-03-27 [類似検索]

[Q3] スパムィルタ再び (2)

試しに以下を変えてみました。 いわゆる全角カタカナと全角英数字は2gramで分割せずに連続しているところまででひとつのトークンとするようにしました ひらがなや句読点などを含むトークンは無視するようにしました 同じスパム度・クリーン度を持つトークンをランダムに入れ替えて、判定対象となる15トークンに ...

#  (スコア:6942)

2008-01-08 [類似検索]

[Q3] スパムィルタのトークン分割

最近、英語の文章をCamelCase化してSubjectや本文を書いたスパムが多くなりました。今のトークン分割方法だとまとめて一つのトークンになってしまうために初出のトークンと見なされて、スパムと判定されないことが多かったので、このような場合には、CamelとCaseにトークンを分割するようにしました。 ...

#  (スコア:6852)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 次へ