PrestaShop Inteligencia Artificial

Thin Content Detector — Detección IA contenido pobre PrestaShop 8/9

El detector de contenido pobre que transforma tus páginas débiles en páginas que posicionan

Google penaliza las páginas con contenido demasiado corto o demasiado similar. En un catálogo de varios cientos de productos, esto es invisible a simple vista. Thin Content Detector escanea automáticamente todos tus productos, categorías y páginas CMS en todos los idiomas activos, detecta tres patrones tóxicos para el SEO y genera sugerencias de enriquecimiento por IA listas para pegar.

PrestaShop 8 y 9 Multilingüe IA integrada Cron nativo
  • Reembolso de 30 días
  • 12 meses de actualizaciones
  • Soporte 24h
www.datafirefly.com/es/
Thin Content Detector — Detección IA contenido pobre PrestaShop 8/9
v1.0.0 · actualizado 2026-05-27
Qué hace

La versión corta.

01

Detección thin content

Detecta productos, categorías y páginas CMS por debajo del umbral de palabras configurable (por defecto 150 palabras para productos, 100 para categorías, 250 para CMS). Gravedad crítica / advertencia / aviso según la distancia al umbral.

02

Detección de duplicados

Identifica descripciones idénticas (hash SHA1) o muy similares (similitud Jaccard ≥ 85% configurable) entre productos. Imprescindible para catálogos con variantes.

03

Ratio plantilla / contenido

Detecta páginas dominadas por boilerplate: demasiados tokens compartidos con páginas hermanas, no suficientes tokens únicos. La trampa clásica del copia-pega categoría por categoría.

04

Sugerencias IA listas para pegar

Para cada problema detectado, genera una sugerencia de enriquecimiento adaptada al tipo de problema y al tipo de objeto. Salida HTML limpia, sin markdown.

La versión larga

Todo lo que querrías saber antes de instalar.

Una mirada detallada a cómo funciona Thin Content Detector — Detección IA contenido pobre PrestaShop 8/9, por qué lo construimos así y la lógica detrás de las características anteriores.

§ 01

Por qué el thin content arruina tu SEO

Desde el Helpful Content Update, Google está degradando activamente las páginas con contenido demasiado pobre, demasiado similar o demasiado dominado por elementos repetidos. En una tienda e-commerce, suelen ser fichas de producto copiadas del proveedor, categorías con dos frases genéricas o variantes que comparten el 95% de su descripción. Invisible a simple vista en un catálogo de 500 productos, pero acumulado es lo que impide que tu sitio posicione.

§ 02

Tres tipos de detección complementarios

Thin Content Detector no se limita a contar palabras. El analizador de contenido pobre señala las páginas por debajo del umbral. El detector de duplicados usa un hash SHA1 para los duplicados exactos, después una similitud Jaccard para los cuasi-duplicados. El analizador de ratio plantilla identifica los tokens que aparecen en más de la mitad de las páginas hermanas (misma categoría padre) y calcula el porcentaje de tokens únicos por página. Una página con 200 palabras pero 90% de boilerplate es tan tóxica como una página de 30 palabras.

§ 03

Sugerencias IA contextualizadas

Para cada problema detectado, el módulo genera una sugerencia de enriquecimiento mediante un endpoint compatible con OpenAI. El prompt está adaptado al tipo de problema (enriquecer thin content, diferenciar duplicados, hacer único contenido demasiado plantilla) Y al tipo de objeto (USPs y specs para productos, USPs de gama para categorías, desarrollo editorial para CMS). El resultado es HTML limpio (párrafos, listas, subtítulos), directamente pegable en TinyMCE. Sin markdown que limpiar.

§ 04

Endpoint IA agnóstico

Configura cualquier servicio compatible con la API chat completions de OpenAI: OpenAI directo, Mistral AI, Groq para respuestas ultra-rápidas, Ollama en local para coste cero de tokens, o Anthropic vía proxy compatible. Mantienes el control del proveedor, modelo y coste.

§ 05

Diseñado para grandes catálogos

Todas las consultas SQL están en lotes (500 productos por batch). La exportación CSV se transmite en streaming para evitar la saturación de memoria. La detección de duplicados utiliza un pre-filtrado por número de palabras (±50%) antes de calcular la similitud Jaccard, y un tope de seguridad de 1500 elementos impide cualquier complejidad O(n²) catastrófica. En un catálogo de 5000 productos, un escaneo completo dura unos minutos.

§ 06

Cron seguro y reescaneo automático

Un endpoint cron protegido por token te permite programar escaneos nocturnos mediante crontab. Activa el reescaneo automático para que cada guardado de producto, categoría o página CMS desencadene un retest dirigido — verás en tiempo real si tu reescritura supera los umbrales.