bsf-devel
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Spam (fwd)


From: Ricardo J. Lemus C.
Subject: Spam (fwd)
Date: Thu, 27 Mar 2003 22:35:26 -0400 (CLT)

Esto lo mando Magnungo.

Seria bueno revisarlo.

-- 
Ricardo J. Lemus C. [Linux-user: 54183] address@hidden
Facultad de Ciencias Fisicas y Matematicas    Universidad de Chile
"Laziness is a very important system administrative virtue" from
Essential System Administration, 2nd Ed. by AEllen Frisch, O'Reilly &
Associates, p. 342.

---------- Forwarded message ----------
Date: Wed, 19 Mar 2003 21:38:59 -0400
From: Mañungo <address@hidden>
To: address@hidden
Subject: Spam

Hola!

Te mande un mensaje hace tiempo, pero me da la idea de que no te llego.
Si estoy dando la lata, avisame :-)

Hice mi propia version del filtro bayesiano de graham.
En vez de un archivo score enorme, tengo dos archivos uno para spam y otro
para no-spam, con las apariciones de las palabras.
Cuando llega un e-mail hago los calculos mas complicados solo para las
palabras con frecuencia > 0 que pertenezcan al e-mail.

La mayor gracia es que cuando se cuela un spam o hay un *false positive*,
me auto-envio el e-mail con el suject [SPAM] o [NO] segun correponda y
automagicamente el procmail invoca al programa que agrega el e-mail a la lista.

Funciona increiblemente bien. Con 100 mail tengo un 89% de spam filtrado y
solo un 2% de *falses positives*. Y lo mejor de todo es que los archivos de
puntajes pesan juntos 17 Kb (contra los 400 Kb del score de ustedes).

De repente te tinca mirarlo. Esta en ~mortega/bin/bsf.



Saludos!!  Mañungo

     o
   o   o
  o     o
   \ 0 /     Malabarista de oficio,
    \|/      Ingeniero en los ratos libres...
     |
    / \      Malabarismo: http://www.malabarismo.cl
  _/   \_    Circópata:   http://www.circopata.cl





reply via email to

[Prev in Thread] Current Thread [Next in Thread]