Ich finde mind. einen Beitrag von mir dazu auch nicht mehr ... vermutlich war er in dem Thread, wo er stand, am Ende OT und wurde entsorgt - eine Info dazu gibt es ja erst seit Xenforo und der gesuchte Beitrag war definitiv älteren Datums.
Daher noch einmal (kurz) die Zusammenfassung:
Bei der Paketbeschleunigung werden für Verbindungen, welche die Firewall des Routers passieren dürfen, in speziellen Tabellen die notwendigen Daten gesammelt und verwaltet, damit man solche Pakete - nachdem die zugrundeliegende Verbindung erst einmal "aktiviert" wurde (das ist dann eine "PA session", wenn man in die eigenen Support-Daten schaut) - direkt an das korrekte Ziel im LAN (oder auch auf der Box selbst, aber auf deren "LAN-Seite") weiterleiten kann.
Das erfolgt dann durch direkten Austausch von Adressdaten in diesem Paket ... da werden dann IP-Adressen und auch -Ports umgeschrieben bei portbasierten Protokollen und ebenso die "L2-Adressen" (aka MAC-Adressen), die ebenfalls passen müssen, damit das richtige Ziel im LAN dieses Paket überhaupt erst erhält.
Das alles erfolgt dann auch schon recht früh nach dem Eintreffen eines solchen Pakets im Router ... dieses Paket durchläuft dann gar nicht mehr alle "Verarbeitungsstufen" im IP-Stack, die es ansonsten passieren müßte und verbraucht in der Folge auch weniger Ressourcen (in erster Linie CPU-Zeit) auf der Box. Das Ergebnis ist ein höherer erzielbarer Durchsatz bei der reinen Paketweiterleitung durch die Router-Funktionen.
Das gibt es bei AVM in Software-Form (das wäre dann der "avm_pa") und bei passenden Chipsets (z.B. dem VR9 - aka XWAY VRX268) auch in Form einer PPE (Protocol Processor Engine), die das Ganze dann in Hardware und ohne weitere Beteiligung der "normalen CPU" für das FRITZ!OS erledigen kann, wenn man diese "Tabellen" mit den Umformungen passend in der PPE programmiert ... das übernimmt dann ebenfalls der "avm_pa" (dann eben "mit Hardware-Beschleunigung"), wenn die entsprechenden Optionen nicht abgeschaltet werden (denn m.W. ist der Standard immer noch "ein" und die geänderte Einstellung wird nicht persistent gespeichert).
Da es diese Beschleunigung eben "beim Chipset" bereits gibt (Lantiq nannte das m.W. "smart acceleration"), gibt es von Lantiq auch entsprechende Patches für den Linux-Kernel und den dort verwendeten IP-Stack, inkl. Connection-Tracking und was da sonst noch zur Nutzung so einer Beschleunigungseinheit gehört. Diese Beschleunigung an sich ist also keine Erfindung von AVM und es gibt sie auch schon recht lange ... eine 7390 (als Single-Core-SoC) würde ohne HW-Beschleunigung vermutlich nicht mal die 50 MBit/s ohne Vectoring bewältigen können.
Neu ist bei AVM jetzt die Möglichkeit, diese Beschleunigung bei Problemen abzuschalten (das ging zuvor nur über einen Shell-Zugang) ... das Ergebnis ist aber ein spürbarer Einbruch beim max. zu erzielenden Durchsatz zwischen Internet und LAN - weil jetzt jedes Paket wirklich den kompletten IP-Stack durchlaufen muß. Dadurch, daß AVM auf der WAN-Seite so eine Art eigenen Protokoll-Stack verwendet (der geht vermutlich in seinen Grundlagen bis zum AVM-MPR (Multi-Protokoll-Router inkl. IPX, u.a. auch über ISDN) aus der Mitte der 90er zurück), ist halt auch die Ansteuerung der PPE eher im AVM-eigenen Code zu finden und nicht mehr in den Patches von Lantiq - ob das nun ein Vor- oder ein Nachteil ist, mag jeder selbst beurteilen (die Lantiq-Quellen zum VR9 findet man z.B. bei OpenWRT/Lede).
Fakt ist halt, daß durch diese Paketbeschleunigung (wenn sie denn in Hardware erfolgt) lange nicht mehr jedes Paket das FRITZ!OS auch "passieren" muß ... das hat dann Auswirkungen auf die Zählung von Paketen und damit auch auf QoS-Mechanismen im Downstream, wenn man hier irgendwelche Limits setzen will. Das muß dann entweder die Hardware auch noch übernehmen (z.B. das "Zählen" von Paketen und Volumina) oder die Pakete müssen eben doch noch weiter in Richtung "System" ihren Weg machen, was sie dann zusätzlich verzögert.
Im "Blockschaltbild" bei Lantiq sieht das dann so aus:
- da kann also auch ein Paket von der "routing engine" direkt an den Switch und damit an die dort angeschlossenen (W)LAN-Clients gehen - auch der WLAN-Chip hängt an diesem internen Switch.
Am Ende hat das Auswirkungen auf so manche Funktion (das FRITZ!OS wird erst wieder bei speziellen Paketen einbezogen, z.B. beim Beenden einer Verbindung, wo dann die PA-Session abgeräumt wird), die auf der "üblichen Zählung" von Traffic beruht ... bis hin zur "client-genauen" Traffic-Saldierung. Das, was AVM da im eigenen GUI anzeigt, sind halt die zusammengezählten Werte für alle Verbindungen ... wer das genauer will, müßte sich selbst darum kümmern, die Zähler für jede einzelne Session nach Clients zu führen - um mal ein Beispiel zu benennen, bei dem das im FRITZ!OS eben anders läuft als im "normalen" Linux.