Rocksolid Light

groups  faq  privacy  How to post  login

Message-ID:  

You will have a long and unpleasant discussion with your supervisor.


rocksolid / de.comm.software.newsserver / Re: Leafnode Filter nicht auf Teilstrings?

SubjectAuthor
* Leafnode Filter nicht auf Teilstrings?Frank Schletz
`* Re: Leafnode Filter nicht auf Teilstrings?Martin Klaiber
 `* Re: Leafnode Filter nicht auf Teilstrings?Frank Schletz
  `* Re: Leafnode Filter nicht auf Teilstrings?Martin Klaiber
   `- Re: Leafnode Filter nicht auf Teilstrings?Frank Schletz

1
Subject: Leafnode Filter nicht auf Teilstrings?
From: Frank Schletz
Newsgroups: de.comm.software.newsserver
Date: Wed, 7 Feb 2024 07:59 UTC
Path: i2pn2.org!i2pn.org!weretis.net!feeder8.news.weretis.net!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail
From: frank.sc...@web.de (Frank Schletz)
Newsgroups: de.comm.software.newsserver
Subject: Leafnode Filter nicht auf Teilstrings?
Date: Wed, 07 Feb 2024 08:59:32 +0100
Lines: 30
Message-ID: <4spb9kxfu6.ln2@slackserver.suchdirwasaus.de>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: individual.net hG9++9Mrx1iOJEh1GNtwSAUK19x3wcbonNpfMyMGAZfiUOoJE=
X-Orig-Path: slackserver.suchdirwasaus.de!not-for-mail
Cancel-Lock: sha1:8XEyyh+NGwGD7K5QgzC6WUvT4tw= sha256:zdGZv+aEVFu1uKGdTRmCwnJKblVnZzZ12MMBvEYPUv4=
User-Agent: Pan/0.149 (Bellevue; 4c157ba git@gitlab.gnome.org:GNOME/pan.git)
View all headers

Moin allerseits.

Ich werde alt oder was auch immer.
Mir schlüpft immer wieder ein Thread durch den Filter.

Newsgroups: de.sci.electronics,de.sci.physik,de.talk.tagesgeschehen
Subject: Re: Der P�¤rmewumpen-Wahnsinn

Weder der hier:
newsgroup = de\..*
pattern = ^Subject:(.*Weltordnung.*|.*Stalking.*|.*DENNIS\ GERT.*|.*Hausverbot.*|.*Klimagerechtigkeit.*|.*Erdwachstum.*|.*ahnsinn.*)
action = kill

noch der hier:
newsgroup = de\..*
pattern = ^Subject:(.*Mit\ Torf\ heizen.*|.*Workstation: erste Tests.*|.*ahnsinn.*)
action = kill

wirkt.
Ich hatte schon einige Varianten ausprobiert.
Ich bin sicher, die anderen (Torf heizen, Workstation und so weiter) wirkten.
Also war ich sicher, dass ein weiterer Teilstring zur Erkennung langt.
Insbesondere, da von dem Thread-Erzeuger immer wieder das Subjekt "subtil"
angepasst wird und der Teilstring "Wahnsinn" die Konstante ist.

Was übersehe ich?
Kann auch daran liegen, dass ich mit den div. regexen der div. Sprachen
immer durcheinander komme und die Filter alle falsch sind?

Frank

Subject: Re: Leafnode Filter nicht auf Teilstrings?
From: Martin Klaiber
Newsgroups: de.comm.software.newsserver
Organization: Freie Universitaet Berlin
Date: Wed, 7 Feb 2024 15:48 UTC
References: 1
Path: i2pn2.org!i2pn.org!eternal-september.org!feeder3.eternal-september.org!fu-berlin.de!uni-berlin.de!not-for-mail
From: usenet.m...@gmx.de (Martin Klaiber)
Newsgroups: de.comm.software.newsserver
Subject: Re: Leafnode Filter nicht auf Teilstrings?
Date: Wed, 7 Feb 2024 16:48:19 +0100
Organization: Freie Universitaet Berlin
Lines: 43
Message-ID: <1blc9k-ths.ln1@tempo.martinkl.dialup.fu-berlin.de>
References: <4spb9kxfu6.ln2@slackserver.suchdirwasaus.de>
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: 8bit
X-Trace: news.uni-berlin.de 75bppzWBTngrQvnKrig7swHpgiZL6hM5j5NwHK0vRr7V6CK8NCin+eIzpe
X-Orig-Path: not-for-mail
Cancel-Lock: sha1:UeuQV6YpeOM1pypkOj4gRAzDa5Q= sha256:7SzTDxIA0BpFCd1RaOZeNKl/3hkpNceSoxOG0KP2zOQ=
User-Agent: tin/2.6.2-20221225 ("Pittyvaich") (Linux/6.1.0-17-686 (i686))
View all headers

Frank Schletz <frank.schletz@web.de> wrote:

> Mir schlüpft immer wieder ein Thread durch den Filter.

> Newsgroups: de.sci.electronics,de.sci.physik,de.talk.tagesgeschehen
> Subject: Re: Der P�¤rmewumpen-Wahnsinn

> Weder der hier:
> newsgroup = de\..*
> pattern = ^Subject:(.*Weltordnung.*|.*Stalking.*|.*DENNIS\ GERT.*|.*Hausverbot.*|.*Klimagerechtigkeit.*|.*Erdwachstum.*|.*ahnsinn.*)
> action = kill

> noch der hier:
> newsgroup = de\..*
> pattern = ^Subject:(.*Mit\ Torf\ heizen.*|.*Workstation: erste Tests.*|.*ahnsinn.*)
> action = kill

> wirkt.

[...]

> Was übersehe ich?
> Kann auch daran liegen, dass ich mit den div. regexen der div. Sprachen
> immer durcheinander komme und die Filter alle falsch sind?

Ich kenne den leafnode-Filter nicht, aber es könnte sein, dass er
nicht wirkt, weil das gesuchte Wort kodiert ist. Beispiel aus dem
von Dir genannten Thread in der "Roh-Ansicht":

| Message-ID: <20240205203731.5f711bae@Achmuehle.WOR>
| Subject: Re: Der =?UTF-8?B?UMODP8OCwqRybWV3dW1wZW4tV2FobnNpbm4=?=

Vielleicht erkennt der Filter auch nicht, wenn das Subject auf zwei
Zeilen aufgeteilt ist, so wie hier:

| Message-ID: <7tiqpil8pu2ga8d637r1pvr8r7sv998nul@4ax.com>
| Subject: Re: =?utf-8?Q?Der_P=C3=83=3F=C3=82=C2=A4rmewumpen?=
| =?utf-8?Q?-Wahnsinn?=

Wie gesagt, ich kenne den Filter nicht und weiß nicht, ob er vor dem
Filtern das Subject dekodiert. Obiges daher nur als Anregung.

Martin

Subject: Re: Leafnode Filter nicht auf Teilstrings?
From: Frank Schletz
Newsgroups: de.comm.software.newsserver
Date: Wed, 7 Feb 2024 16:23 UTC
References: 1 2
Path: i2pn2.org!i2pn.org!news.swapon.de!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail
From: frank.sc...@web.de (Frank Schletz)
Newsgroups: de.comm.software.newsserver
Subject: Re: Leafnode Filter nicht auf Teilstrings?
Date: Wed, 07 Feb 2024 17:23:31 +0100
Lines: 63
Message-ID: <3dnc9kxgj3.ln2@slackserver.suchdirwasaus.de>
References: <4spb9kxfu6.ln2@slackserver.suchdirwasaus.de>
<1blc9k-ths.ln1@tempo.martinkl.dialup.fu-berlin.de>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: individual.net nmHegZE93gtSHiGTWP7r+wuXSSCcHHQYDNqn/QKOPwYgrth2A=
X-Orig-Path: slackserver.suchdirwasaus.de!not-for-mail
Cancel-Lock: sha1:NLhUc/zWijlQyoLosCXD2lZSfjU= sha256:8k4E8q+GuMEjnJApzM8CkM0R2F7O0iiPl701iYichU4=
User-Agent: Pan/0.149 (Bellevue; 4c157ba git@gitlab.gnome.org:GNOME/pan.git)
View all headers

On Wed, 7 Feb 2024 16:48:19 +0100, Martin Klaiber wrote:

> Frank Schletz <frank.schletz@web.de> wrote:
>
>> Mir schlüpft immer wieder ein Thread durch den Filter.
>
>> Newsgroups: de.sci.electronics,de.sci.physik,de.talk.tagesgeschehen
>> Subject: Re: Der P�¤rmewumpen-Wahnsinn
>
>> Weder der hier:
>> newsgroup = de\..*
>> pattern = ^Subject:(.*Weltordnung.*|.*Stalking.*|.*DENNIS\ GERT.*|.*Hausverbot.*|.*Klimagerechtigkeit.*|.*Erdwachstum.*|.*ahnsinn.*)
>> action = kill
>
>> noch der hier:
>> newsgroup = de\..*
>> pattern = ^Subject:(.*Mit\ Torf\ heizen.*|.*Workstation: erste Tests.*|.*ahnsinn.*)
>> action = kill
>
>> wirkt.
>
> [...]
>
>> Was übersehe ich?
>> Kann auch daran liegen, dass ich mit den div. regexen der div. Sprachen
>> immer durcheinander komme und die Filter alle falsch sind?
>
> Ich kenne den leafnode-Filter nicht, aber es könnte sein, dass er
> nicht wirkt, weil das gesuchte Wort kodiert ist. Beispiel aus dem
> von Dir genannten Thread in der "Roh-Ansicht":
>
> | Message-ID: <20240205203731.5f711bae@Achmuehle.WOR>
> | Subject: Re: Der =?UTF-8?B?UMODP8OCwqRybWV3dW1wZW4tV2FobnNpbm4=?=
>
> Vielleicht erkennt der Filter auch nicht, wenn das Subject auf zwei
> Zeilen aufgeteilt ist, so wie hier:
>
> | Message-ID: <7tiqpil8pu2ga8d637r1pvr8r7sv998nul@4ax.com>
> | Subject: Re: =?utf-8?Q?Der_P=C3=83=3F=C3=82=C2=A4rmewumpen?=
> | =?utf-8?Q?-Wahnsinn?=
>
> Wie gesagt, ich kenne den Filter nicht und weiß nicht, ob er vor dem
> Filtern das Subject dekodiert. Obiges daher nur als Anregung.
>
> Martin

Oh, danke.
Leafnode nutzt (laut Doku) eine PCRE-Engine.
Ich muss wohl nochmal lesen, was bei codierten Strings "passiert".
Das Problem mit diesem, mich in den Wahnsinn(sic!) treibenden Thread, ist,
dass dort immer wieder das Subjekt ein kleines bischen Verändert wird.
Und da dies immer am Anfang passiert, kann ich nur auf einen Teilstring regexen.
So kann ich nicht wirklich nen Score oder ein Kill drauf ansetzen.

Na, ich schau mal, das ich manuell applyfilter im dry-modus und Verbose laufen lasse.
Dann sehe ich (oder auch nicht), was da passiert.
Ein nachträgliches apply-filter meldet seltsamerweise einige Kills.
Die Beiträge hätten jedoch erst gar nicht durch den Filter kommen dürfen.
seufz. Die Trolle sind immer besser als ich.

Frank

Subject: Re: Leafnode Filter nicht auf Teilstrings?
From: Martin Klaiber
Newsgroups: de.comm.software.newsserver
Organization: Freie Universitaet Berlin
Date: Wed, 7 Feb 2024 22:52 UTC
References: 1 2 3
Path: i2pn2.org!i2pn.org!news.hispagatos.org!eternal-september.org!feeder3.eternal-september.org!fu-berlin.de!uni-berlin.de!not-for-mail
From: usenet.m...@gmx.de (Martin Klaiber)
Newsgroups: de.comm.software.newsserver
Subject: Re: Leafnode Filter nicht auf Teilstrings?
Date: Wed, 7 Feb 2024 23:52:50 +0100
Organization: Freie Universitaet Berlin
Lines: 46
Message-ID: <07ed9k-oau.ln1@tempo.martinkl.dialup.fu-berlin.de>
References: <4spb9kxfu6.ln2@slackserver.suchdirwasaus.de> <1blc9k-ths.ln1@tempo.martinkl.dialup.fu-berlin.de> <3dnc9kxgj3.ln2@slackserver.suchdirwasaus.de>
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: 8bit
X-Trace: news.uni-berlin.de kqGcGCMAl4RE0u8znh/6Nwer4YuvtpgzYgDfv0LLGSCfi7LiGzR2k+Icz/
X-Orig-Path: not-for-mail
Cancel-Lock: sha1:J1ERNkfjnRHNWei1MptiXKl21T0= sha256:ALazefe8AD8NDckA+7xDxg4p1RSMbaGmHkP0teczxVY=
User-Agent: tin/2.6.2-20221225 ("Pittyvaich") (Linux/6.1.0-17-686 (i686))
View all headers

Frank Schletz <frank.schletz@web.de> wrote:

> Leafnode nutzt (laut Doku) eine PCRE-Engine.

Ja, aber das ist ja nur der Teil für die regular expressions.

> Ich muss wohl nochmal lesen, was bei codierten Strings "passiert".

Ich vermute, leafnode wird nicht dekodieren. In der man-page habe ich
jedenfalls nichts dazu gefunden. Würde mich auch wundern, das ist doch
üblicherweise die Aufgabe des Newsreaders.

> Das Problem mit diesem, mich in den Wahnsinn(sic!) treibenden Thread, ist,
> dass dort immer wieder das Subjekt ein kleines bischen Verändert wird.
> Und da dies immer am Anfang passiert, kann ich nur auf einen Teilstring regexen.
> So kann ich nicht wirklich nen Score oder ein Kill drauf ansetzen.

Ich filtere auf Personen, nicht auf das Subject. Das Subject ändert
sich, aber die Troll-Inhalte bleiben doch mehr oder weniger immer die
gleichen und sie kommen immer von den gleichen Personen.

Und ich filtere im Newsreader, damit hat man solche Probleme mit
kodierten Header-Zeilen nicht mehr, da der Newsreader sie vor dem
Filtern dekodiert.

> Na, ich schau mal, das ich manuell applyfilter im dry-modus und Verbose laufen lasse.
> Dann sehe ich (oder auch nicht), was da passiert.
> Ein nachträgliches apply-filter meldet seltsamerweise einige Kills.
> Die Beiträge hätten jedoch erst gar nicht durch den Filter kommen dürfen.
> seufz. Die Trolle sind immer besser als ich.

Du könntest noch auf Crossposts filtern. Das wird von applyfilter
unterstützt. Dieser Politik-Troll-Spam (weiß gar nicht, wie man das
bezeichnen soll) wird üblicherweise über mindestens drei Newsgroups
verbreitet.

Aus <https://linux.die.net/man/8/leafnode>:

| maxcrosspost = 5
| | If you want to combat spam, you can filter out all postings that are
| posted to more than a certain number of newsgroups. The number is
| defined by setting "maxcrosspost". Setting this parameter to very low
| values is probably a bad idea. This feature is switched off by default.

Martin

Subject: Re: Leafnode Filter nicht auf Teilstrings?
From: Frank Schletz
Newsgroups: de.comm.software.newsserver
Date: Thu, 8 Feb 2024 09:14 UTC
References: 1 2 3 4
Path: i2pn2.org!i2pn.org!usenet.goja.nl.eu.org!3.eu.feeder.erje.net!feeder.erje.net!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail
From: frank.sc...@web.de (Frank Schletz)
Newsgroups: de.comm.software.newsserver
Subject: Re: Leafnode Filter nicht auf Teilstrings?
Date: Thu, 08 Feb 2024 10:14:58 +0100
Lines: 67
Message-ID: <ilie9kxgj3.ln2@slackserver.suchdirwasaus.de>
References: <4spb9kxfu6.ln2@slackserver.suchdirwasaus.de>
<1blc9k-ths.ln1@tempo.martinkl.dialup.fu-berlin.de>
<3dnc9kxgj3.ln2@slackserver.suchdirwasaus.de>
<07ed9k-oau.ln1@tempo.martinkl.dialup.fu-berlin.de>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: individual.net mpli8Grrv4KXVTOLQs4KDwSgcGIJ8stnzKJLgDEE/s3Kvgem8=
X-Orig-Path: slackserver.suchdirwasaus.de!not-for-mail
Cancel-Lock: sha1:wf4LNVuTf9KcFdtB6PsfEzzL6Z0= sha256:DmwsLv++DqowLLPY6LEu+yQ7AD/4/PAYpQPPWHLB738=
User-Agent: Pan/0.149 (Bellevue; 4c157ba git@gitlab.gnome.org:GNOME/pan.git)
View all headers

On Wed, 7 Feb 2024 23:52:50 +0100, Martin Klaiber wrote:

> Frank Schletz <frank.schletz@web.de> wrote:
>
>> Leafnode nutzt (laut Doku) eine PCRE-Engine.
>
> Ja, aber das ist ja nur der Teil für die regular expressions.
>
>> Ich muss wohl nochmal lesen, was bei codierten Strings "passiert".
>
> Ich vermute, leafnode wird nicht dekodieren. In der man-page habe ich
> jedenfalls nichts dazu gefunden. Würde mich auch wundern, das ist doch
> üblicherweise die Aufgabe des Newsreaders.
>

Hm, offensichtlich. Schade.

>> Das Problem mit diesem, mich in den Wahnsinn(sic!) treibenden Thread, ist,
>> dass dort immer wieder das Subjekt ein kleines bischen Verändert wird.
>> Und da dies immer am Anfang passiert, kann ich nur auf einen Teilstring regexen.
>> So kann ich nicht wirklich nen Score oder ein Kill drauf ansetzen.
>
> Ich filtere auf Personen, nicht auf das Subject. Das Subject ändert
> sich, aber die Troll-Inhalte bleiben doch mehr oder weniger immer die
> gleichen und sie kommen immer von den gleichen Personen.
>

Tja, die "Trolle" habe ich auch im Filter.
Nur wird denen auch noch massiv geantwortet.
Manchmal sogar von Leuten, deren sonstigen Beiträge ich gerne lese.

> Und ich filtere im Newsreader, damit hat man solche Probleme mit
> kodierten Header-Zeilen nicht mehr, da der Newsreader sie vor dem
> Filtern dekodiert.
>

Das werde ich wohl für diese Art Spezialfälle auch machen müssen. :(

>> Na, ich schau mal, das ich manuell applyfilter im dry-modus und Verbose laufen lasse.
>> Dann sehe ich (oder auch nicht), was da passiert.
>> Ein nachträgliches apply-filter meldet seltsamerweise einige Kills.
>> Die Beiträge hätten jedoch erst gar nicht durch den Filter kommen dürfen.
>> seufz. Die Trolle sind immer besser als ich.
>
> Du könntest noch auf Crossposts filtern. Das wird von applyfilter
> unterstützt. Dieser Politik-Troll-Spam (weiß gar nicht, wie man das
> bezeichnen soll) wird üblicherweise über mindestens drei Newsgroups
> verbreitet.
>
> Aus <https://linux.die.net/man/8/leafnode>:
>
> | maxcrosspost = 5
> |
> | If you want to combat spam, you can filter out all postings that are
> | posted to more than a certain number of newsgroups. The number is
> | defined by setting "maxcrosspost". Setting this parameter to very low
> | values is probably a bad idea. This feature is switched off by default.
>

Die leider nur über 3 Newsgroups.
Und auf maxcrosspost = 2 wollte ich nun nicht gehen.
Da bin ich mir nicht sicher, dass nicht einiges verloren geht.

Danke erst mal für die Hilfe

Frank


rocksolid / de.comm.software.newsserver / Re: Leafnode Filter nicht auf Teilstrings?

1
server_pubkey.txt

rocksolid light 0.9.12
clearnet tor