PrestaShop Intelligence Artificielle

Thin Content Detector — Détection IA contenu pauvre PrestaShop 8/9

Le détecteur de contenu pauvre qui transforme vos pages faibles en pages qui rankent

Google pénalise les pages au contenu trop court ou trop similaire. Sur un catalogue de plusieurs centaines de produits, c'est invisible à l'œil nu. Thin Content Detector scanne automatiquement tous vos produits, catégories et pages CMS dans toutes les langues actives, repère trois patterns toxiques pour le SEO, et génère des suggestions d'enrichissement par IA prêtes à coller.

PrestaShop 8 & 9 Multilingue IA intégrée Cron natif
  • Remboursement 30 jours
  • 12 mois de mises à jour
  • Support 24h
www.datafirefly.com/
Thin Content Detector — Détection IA contenu pauvre PrestaShop 8/9
v1.0.0 · mis à jour 2026-05-27
Ce que ça fait

La version courte.

01

Détection thin content

Repère les produits, catégories et pages CMS sous le seuil de mots configurable (par défaut 150 mots produit, 100 catégorie, 250 CMS). Sévérité critique / avertissement / notice selon l'écart au seuil.

02

Détection de doublons

Identifie les descriptions identiques (hash SHA1) ou très proches (similarité Jaccard ≥ 85% configurable) entre produits. Indispensable pour les catalogues variantes.

03

Ratio template / contenu

Détecte les pages dominées par du boilerplate : trop de tokens partagés avec les pages sœurs, pas assez de tokens uniques. Le piège classique du copier-coller catégorie par catégorie.

04

Suggestions IA prêtes à coller

Pour chaque problème détecté, génère une suggestion d'enrichissement adaptée au type de problème et au type d'objet. Sortie HTML propre, sans markdown.

La version longue

Tout ce que vous voudriez savoir avant d'installer.

Un regard détaillé sur le fonctionnement de Thin Content Detector — Détection IA contenu pauvre PrestaShop 8/9, pourquoi nous l'avons conçu ainsi, et la réflexion derrière les fonctionnalités ci-dessus.

§ 01

Pourquoi le thin content tue votre SEO

Depuis le Helpful Content Update, Google déclasse activement les pages au contenu trop pauvre, trop similaire ou trop dominé par des éléments répétés. Sur une boutique e-commerce, ce sont typiquement les fiches produit reprises du fournisseur, les catégories avec deux phrases génériques, ou les variantes qui partagent 95% de leur description. Invisible à l'œil nu sur un catalogue de 500 produits — mais cumulé, c'est ce qui empêche votre site de ranker.

§ 02

Trois types de détection complémentaires

Thin Content Detector ne se contente pas de compter les mots. L'analyseur de contenu pauvre signale les pages sous le seuil. Le détecteur de doublons utilise un hash SHA1 pour les doublons exacts, puis une similarité Jaccard pour les quasi-doublons. L'analyseur de ratio template identifie les tokens qui apparaissent dans plus de la moitié des pages sœurs (même catégorie parent) et calcule le pourcentage de tokens uniques par page. Une page avec 200 mots mais 90% de boilerplate est tout aussi toxique qu'une page de 30 mots.

§ 03

Suggestions IA contextualisées

Pour chaque problème détecté, le module génère une suggestion d'enrichissement via un endpoint compatible OpenAI. Le prompt est adapté au type de problème (enrichir le thin content, différencier les doublons, rendre unique le contenu trop template) ET au type d'objet (USP et specs pour les produits, USP de gamme pour les catégories, développement éditorial pour les CMS). Le retour est du HTML propre — paragraphes, listes, sous-titres — directement collable dans TinyMCE. Pas de markdown à nettoyer.

§ 04

Endpoint IA agnostique

Configurez n'importe quel service compatible avec l'API chat completions OpenAI : OpenAI direct, Mistral AI, Groq pour des réponses ultra-rapides, Ollama en local pour zéro coût de tokens, ou Anthropic via un proxy compatible. Vous restez maître du fournisseur, du modèle et du coût.

§ 05

Conçu pour les gros catalogues

Toutes les requêtes SQL sont chunkées (500 produits par batch). L'export CSV est streamé en sortie pour éviter la saturation mémoire. La détection de doublons utilise un pré-filtrage par nombre de mots (±50%) avant de calculer la similarité Jaccard, et un plafond de sécurité à 1500 items empêche toute complexité O(n²) catastrophique. Sur un catalogue de 5000 produits, un scan complet prend quelques minutes.

§ 06

Cron sécurisé et auto-rescan

Un endpoint cron sécurisé par token vous permet de planifier les scans nocturnes via crontab. Activez le rescan automatique pour que chaque sauvegarde de produit, catégorie ou page CMS déclenche un re-test ciblé — vous voyez en temps réel si votre réécriture suffit à dépasser les seuils.