トップ 最新

#3 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 12932 定精 WITH 11426 態素 WITH 10586 素解 WITH 4698 精度 WITH 4422 形態 WITH 3409 出所 WITH 2970 析す WITH 2450 解析 WITH 2227 験結 WITH 2132 判定 WITH 1014 パス WITH 957 論文 WITH 831 ーパ WITH 728 価値 WITH 723 実験 WITH 631 度が WITH 629 が上 WITH 507 プル WITH 475 お願 WITH 454 試し WITH 440 願い WITH 394 コー WITH 344 ンプ WITH 323 サン WITH 309 スが WITH 290 上が WITH 277 結果 WITH 253 きに WITH 191 とき WITH 134 ミ!! WITH 122 ツッ WITH 117 ッコ の検索結果 77 件中 1 - 10 件目 (0.077751161 秒)

1 2 3 4 5 6 7 8 次へ

2005-01-29 [類似検索]

ツッミ!! (snak)

どこかの論文出所がわからなくなってしまいました)を読んだときに態素析するとコーパスが小さいときには判定精度が上がるが、コーパスが大きくなったときには2gramの方が判定精度が上がるという実験結果があったので形態素析するほうは試していなかったのですが、試して見る価値はあるかも知れませんね ...

#  (スコア:10000)

2005-01-15 [類似検索]

[Q3] スパムフィルタ (4)

Invalid Text英数字しか処理していないと「未承諾広告※」と書いてあっても素通りしてしまうので、英数字以外の処理についても考えてみました。色々と調べてみると、形態素解析をするとデータベースのサイズは小さくなるものの精度はそれほど上がらず(解析精度が悪いと下がることも)速度も遅くなるようです。 ...

#  (スコア:7627)

2005-11-30 [類似検索]

[Q3] 全文検索にHyper Estraierを使う (2)

以前書いたように、QMAIL3の全文検索エンジンとしてHyper Estraierを使ってみました。試してみて感じたことは、 セットアップが楽 Namazuはperlを入れたり環境変数を設定したりしなくてはいけなくてそこそこ面倒だった気がするのですが、Hyper Estraierアーカイブを展開するだけなので楽です。 インデックスは少 ...

#  (スコア:7371)

2005-12-12 [類似検索]

Hyper Estraier 1.1.1

Invalid TextMecabを使って形態素解析もできるようになったそうです。インデックスに互換性がなくなったので作り直す必要があるようです。 ...

#  (スコア:7371)

2005-01-29 [類似検索]

ツッミ!! (miri)

ここ数日の結果だと、なぜか日本語SPAMの排除率は上がったのですが、GB2312やらBIG5系のSPAMが目だって残っている気がします。 形態素解析の際はお声掛けください、比較的容易にSPAMは用意できると思いますので^^; ...

#  (スコア:7371)

2005-04-06 [類似検索]

[Q3] スパムフィルタ

学習させなおして使っているスパムフィルタですが、まだ時々通り抜けてしまうときもありますが、以前よりはかなり日本語スパムの判定精度が良くなりました。 ...

#  (スコア:6267)

2005-03-26 [類似検索]

[Q3] スパムフィルタ再び

日本語スパムの判定精度があまり上がってこないので(半分くらいすり抜けてしまいます)、ここ数日どういう風に判定しているのかをログを取って調べてみました。すると、 日本語は2gramで処理しているので英語に比べてトークンの取りうる範囲が広い 日本語のメールはクリーンなメールに対してスパムの学習量が少 ...

#  (スコア:4635)

2005-01-29 [類似検索]

ツッミ!! (miri)

私も最近Junk Filterを有効にしたばかりですが、学習のさせ方の問題なのか日本語のSPAMには弱いなぁと感じてました。 出力されるログを見ると、現在のロジックだと日本語のSPAMの分別は難しそうですよね。 私の手元には「非常に大量のサンプル」がありますが、ご提供しましょうか? #精度が上がるならいくらでも ...

#  (スコア:2116)

2002-04-10 [類似検索]

日本語の添付ファイル名

日本語を使ったファイル名のファイルを添付するときに、Content-Dispositionのfilenameパラメータにiso-2022-jpで直に書いてくるMUAがあるという話は、パーサの関係でうまく対処できませんでした。 というのは、Content-Dispositionにはコメントを書けるのですが、コメントは「()」で括られています。コメントは ...

#  (スコア:1732)

2007-08-31 [類似検索]

ツッミ!! (snak)

確かに良く分かりませんね。QMAIL3では、OpenSSLのS/MIMEの機能をそのまま使っているわけではなくて、MIMEの解析は自前でやってPKCS7の処理をOpenSSLでやっているので、そのあたりで動作が異なるのかもしれません。 試しに、S/MIMEの処理まわりに、デバッグログを出力するコードを入れてみます。 ...

#  (スコア:1117)

1 2 3 4 5 6 7 8 次へ