[SIMILAR] WITH 6058 invitation WITH 1066 判定 WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ WITH 115 コミ WITH 1 !! WITH 1 ( WITH 1 snak WITH 1 ) WITH 1 を送 WITH 1 送っ WITH 1 って WITH 1 てお WITH 1 おき WITH 1 きま WITH 1 まし WITH 1 した WITH 1 た( WITH 1 (sp WITH 1 spam WITH 1 定さ WITH 1 され WITH 1 れち WITH 1 ちゃ WITH 1 ゃう WITH 1 うか WITH 1 かも WITH 1 も^^ WITH 1 ^^; WITH 1 )# WITH 1 # の検索結果 127 件中 1 - 10 件目 (0.353615899 秒)
どこかの論文(出所がわからなくなってしまいました)を読んだときに形態素解析するとコーパスが小さいときには判定精度が上がるが、コーパスが大きくなったときには2gramの方が判定精度が上がるという実験結果があったので形態素解析するほうは試していなかったのですが、試して見る価値はあるかも知れませんね ...
# (スコア:1758)
日本語スパムの判定精度があまり上がってこないので(半分くらいすり抜けてしまいます)、ここ数日どういう風に判定しているのかをログを取って調べてみました。すると、 日本語は2gramで処理しているので英語に比べてトークンの取りうる範囲が広い 日本語のメールはクリーンなメールに対してスパムの学習量が少 ...
# (スコア:1731)
自動振り分け処理中はロックをこまめにはずすようにしました。 また、スパムフィルタ自身がホワイトリストとブラックリストを持てるようにしたため、@Junkで個別にホワイトリストやブラックリストを指定できる必要はないであろうと考え、@Junkの動作を変えました。新しい書式は、 Boolean @Junk(Boolean?, Bool ...
# (スコア:1731)
学習周りについて考えてみました。 まず現状をまとめてみると、学習するかどうかの設定は二種類あります。ここでは、自動学習と手動学習と呼びます。自動学習はスパムフィルタで判定したときに結果に従って学習することです。手動学習は、ユーザがメッセージを移動したときに学習することです。 さて、問題はと ...
# (スコア:1731)
Invalid TextIMAP4のスパムフィルタはスパムだと判定するとサーバ上でメッセージを移動させようとするため、Junkフォルダをローカルフォルダにするとうまく動かないのですが、振り分けルールと統合するとこの問題も解決できそうです。 学習周りがなんとかなれば良いのですが、@Junk以外でクリーンと判定されたメ ...
# (スコア:1731)
サーバ側にもスパムフィルタがあった場合、そこでスパムと判定されたメールは即座にスパム扱いしてしまいたいところです。そんな場合には、以下のようにします。ここではサーバ側のスパムフィルタでスパムと判定されたメールには、 X-Spam-Flag: YES というヘッダが付くものとします。 アカウントの設定でスパム ...
# (スコア:1731)
# (スコア:10000)