トップ 最新

#3 [全文検索]

検索方法

並べ替え: 表示件数: 検索条件の書式:

[SIMILAR] WITH 17139 態素 WITH 15880 素解 WITH 12377 字以 WITH 11917 通程 WITH 10694 英数 WITH 7748 字区 WITH 7613 区切 WITH 6676 2gram WITH 6633 形態 WITH 6127 度学 WITH 5655 告※ WITH 5415 gram WITH 5269 諾広 WITH 4900 解析 WITH 4698 精度 WITH 4081 パム WITH 3848 。形 WITH 3712 未承 WITH 3548 、n WITH 3492 数字 WITH 3479 クン WITH 3324 素通 WITH 3157 承諾 WITH 2678 タ( WITH 2674 り文 WITH 2657 文字 WITH 2527 タベ WITH 2399 unicode WITH 2063 ムフ WITH 1946 手抜 WITH 1790 字は WITH 1726 分割 の検索結果 145 件中 1 - 10 件目 (0.117196484 秒)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 次へ

2005-01-15 [類似検索]

[Q3] スパムフィルタ (4)

Invalid Text英数字しか処理していないと「未承諾広告※」と書いてあっても素通りしてしまうので、英数字以外の処理についても考えてみました。色々と調べてみると、形態素解析をするとデータベースのサイズは小さくなるものの精度はそれほど上がらず(解析精度が悪いと下がることも)速度も遅くなるようです。 ...

#  (スコア:10000)

2005-01-29 [類似検索]

ツッコミ!! (snak)

どこかの論文(出所がわからなくなってしまいました)を読んだときに形態素解析するとコーパスが小さいときには判定精度が上がるが、コーパスが大きくなったときには2gramの方が判定精度が上がるという実験結果があったので形態素解析するほうは試していなかったのですが、試して見る価値はあるかも知れませんね ...

#  (スコア:6507)

2005-01-29 [類似検索]

ツッコミ!! (miri)

ここ数日の結果だと、なぜか日本語SPAMの排除率は上がったのですが、GB2312やらBIG5系のSPAMが目だって残っている気がします。 形態素解析の際はお声掛けください、比較的容易にSPAMは用意できると思いますので^^; ...

#  (スコア:6420)

2005-12-12 [類似検索]

Hyper Estraier 1.1.1

Invalid TextMecabを使って形態素解析もできるようになったそうです。インデックスに互換性がなくなったので作り直す必要があるようです。 ...

#  (スコア:6420)

2005-11-30 [類似検索]

[Q3] 全文検索にHyper Estraierを使う (2)

以前書いたように、QMAIL3の全文検索エンジンとしてHyper Estraierを使ってみました。試してみて感じたことは、 セットアップが楽 Namazuはperlを入れたり環境変数を設定したりしなくてはいけなくてそこそこ面倒だった気がするのですが、Hyper Estraierアーカイブを展開するだけなので楽です。 インデックスは少 ...

#  (スコア:6130)

2005-01-12 [類似検索]

[Q3] スパムフィルタ (2)

Invalid TextIMAP4でもスパムフィルタを使えるようにして、スパムを1000通程度、クリーンなメールを2000通程度学習させてから普段使っているメールアカウントで試してみたところ結構正しく判定してびっくりです。 ...

#  (スコア:3702)

2006-11-02 [類似検索]

[Q3] アドレスの補完 (3)

アドレス部分も記号で分割するようにしたために、たとえばcを入力したときに'.com'や'.co.jp'などにマッチしてしまうようになりました。これはいまいちなので、'.'の後ろにマッチしたときには、それ以上後ろに'.'がなかったり、後ろに5文字以上ない場合には候補にしないようにしました。 ちょっといい加減ですが ...

#  (スコア:3187)

2005-05-08 [類似検索]

[Q3] 検索フォルダベースで運用

Invalid Textここしばらく英語系ML用のアカウントを検索フォルダベースで運用してみたのですが、メール数が3000通程度で既に遅くて辛い状態になってしまいました。サーバの性能などにも拠るので一概には言えませんが、サーバでの検索に関してサーバソフトで何らかの対処をしないと常用するのは難しそうです。 ...

#  (スコア:3091)

2004-12-09 [類似検索]

[Q3] IMAP4のバッファ

Invalid TextIMAP4でサーバからのレスポンスをパースするときにバッファのコピーを結構していたので、試しにしないようにしたらどの程度パフォーマンスに影響があるかを調べてみました。結果、大して変わらず。しかし大きなメッセージをダウンロードするときにはスピードはともかくメモリ使用量が抑えられるのは ...

#  (スコア:3091)

2006-09-03 [類似検索]

[Q3] keymap.xmlで名前を使って指定

keymap.xmlでは英数字と記号以外のキーは仮想キーコードで指定するようになっていましたが、名前でも指定できるようにしました。ドキュメントには近々書く予定ですが、とりあえずリストだけ。 add, apps, back, convert, delete, devide, down, end, escape, f1〜f24, help, home, insert, kana, kanji, left, ...

#  (スコア:2918)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 次へ