PrestaShop Künstliche Intelligenz

Thin Content Detector — KI Thin-Content-Erkennung PrestaShop 8/9

Der Thin-Content-Detektor, der Ihre schwachen Seiten in ranking-starke Seiten verwandelt

Google bestraft Seiten mit zu kurzem oder zu ähnlichem Inhalt. Bei einem Katalog von mehreren hundert Produkten ist das mit bloßem Auge unsichtbar. Thin Content Detector scannt automatisch alle Ihre Produkte, Kategorien und CMS-Seiten in allen aktiven Sprachen, erkennt drei SEO-toxische Muster und generiert KI-Anreicherungsvorschläge, die zum Einfügen bereit sind.

PrestaShop 8 & 9 Mehrsprachig KI integriert Nativer Cron
  • 30 Tage Rückgaberecht
  • 12 Monate Updates
  • 24-h-Support
www.datafirefly.com/de/
Thin Content Detector — KI Thin-Content-Erkennung PrestaShop 8/9
v1.0.0 · aktualisiert 2026-05-27
Was es leistet

Die Kurzfassung.

01

Thin-Content-Erkennung

Erkennt Produkte, Kategorien und CMS-Seiten unterhalb der konfigurierbaren Wortzahlschwelle (standardmäßig 150 Wörter für Produkte, 100 für Kategorien, 250 für CMS). Schweregrad kritisch / Warnung / Hinweis je nach Abstand zur Schwelle.

02

Duplikaterkennung

Identifiziert identische Beschreibungen (SHA1-Hash) oder sehr ähnliche (Jaccard-Ähnlichkeit ≥ 85% konfigurierbar) zwischen Produkten. Unverzichtbar für Varianten-Kataloge.

03

Template-/Inhalt-Verhältnis

Erkennt Seiten, die von Boilerplate dominiert werden: zu viele Tokens mit Geschwisterseiten gemeinsam, zu wenige eindeutige Tokens. Die klassische Falle des Copy-Paste Kategorie für Kategorie.

04

KI-Vorschläge zum direkten Einfügen

Für jedes erkannte Problem wird ein auf den Problemtyp und Objekttyp zugeschnittener Anreicherungsvorschlag generiert. Sauberes HTML-Output, kein Markdown.

Die ausführliche Fassung

Alles, was Sie wissen sollten bevor Sie installieren.

Ein detaillierter Blick darauf, wie Thin Content Detector — KI Thin-Content-Erkennung PrestaShop 8/9 funktioniert, warum wir es so gebaut haben und der Gedanke hinter den Funktionen oben.

§ 01

Warum Thin Content Ihr SEO ruiniert

Seit dem Helpful Content Update stuft Google aktiv Seiten ab, deren Inhalt zu dünn, zu ähnlich oder zu sehr von wiederholten Elementen dominiert wird. In einem E-Commerce-Shop sind das typischerweise vom Lieferanten kopierte Produktblätter, Kategorien mit zwei generischen Sätzen oder Varianten, die 95% ihrer Beschreibung teilen. Für das bloße Auge unsichtbar bei einem Katalog mit 500 Produkten — aber kumuliert ist es das, was Ihre Website am Ranking hindert.

§ 02

Drei sich ergänzende Erkennungstypen

Thin Content Detector zählt nicht nur Wörter. Der Inhaltsanalysator markiert Seiten unterhalb der Schwelle. Der Duplikatdetektor verwendet einen SHA1-Hash für exakte Duplikate, dann eine Jaccard-Ähnlichkeit für Quasi-Duplikate. Der Template-Ratio-Analysator identifiziert Tokens, die in mehr als der Hälfte der Geschwisterseiten (gleiche übergeordnete Kategorie) erscheinen, und berechnet den Prozentsatz eindeutiger Tokens pro Seite. Eine Seite mit 200 Wörtern, aber 90% Boilerplate ist genauso toxisch wie eine Seite mit 30 Wörtern.

§ 03

Kontextbezogene KI-Vorschläge

Für jedes erkannte Problem generiert das Modul einen Anreicherungsvorschlag über einen OpenAI-kompatiblen Endpunkt. Der Prompt ist auf den Problemtyp (Thin Content anreichern, Duplikate differenzieren, zu Template-lastigen Inhalt einzigartig machen) UND auf den Objekttyp (USPs und Specs für Produkte, Sortiments-USPs für Kategorien, redaktionelle Entwicklung für CMS) zugeschnitten. Das Ergebnis ist sauberes HTML — Absätze, Listen, Zwischenüberschriften — direkt in TinyMCE einfügbar. Kein Markdown zum Bereinigen.

§ 04

Anbieter-unabhängiger KI-Endpunkt

Konfigurieren Sie jeden Dienst, der mit der OpenAI Chat Completions API kompatibel ist: OpenAI direkt, Mistral AI, Groq für ultraschnelle Antworten, lokales Ollama für Null Token-Kosten oder Anthropic über einen kompatiblen Proxy. Sie behalten die Kontrolle über Anbieter, Modell und Kosten.

§ 05

Für große Kataloge ausgelegt

Alle SQL-Abfragen sind in Batches aufgeteilt (500 Produkte pro Batch). Der CSV-Export wird gestreamt, um eine Speichersättigung zu vermeiden. Die Duplikaterkennung verwendet eine Vorfilterung nach Wortzahl (±50%) vor der Berechnung der Jaccard-Ähnlichkeit, und eine Sicherheitsobergrenze bei 1500 Elementen verhindert jede katastrophale O(n²)-Komplexität. Bei einem 5000-Produkte-Katalog dauert ein vollständiger Scan einige Minuten.

§ 06

Sicherer Cron und automatischer erneuter Scan

Ein token-geschützter Cron-Endpunkt ermöglicht es Ihnen, nächtliche Scans über crontab zu planen. Aktivieren Sie den automatischen erneuten Scan, sodass jedes Speichern eines Produkts, einer Kategorie oder einer CMS-Seite einen gezielten erneuten Test auslöst — Sie sehen in Echtzeit, ob Ihre Umschreibung ausreicht, um die Schwellenwerte zu überschreiten.