Entendiendo los Quality Scores
Los Quality Scores en cada producto (Durability, Quality Perception, Value for Money, Price Positioning, Typical Competitors) son 100% generados por el LLM basándose en el texto del producto. No están respaldados por reviews, devoluciones, datos de ventas, certificaciones ni ninguna evidencia externa — todavía.
Qué usa el LLM
Al puntuar un producto, Clione le pasa al LLM:
- Título
- Descripción
- Precio + moneda
- Vendor
- Categorías
- Cualquier respuesta del Enrichment Wizard (audiencia objetivo, materiales, beneficios clave, etc.)
Qué NO usa el LLM
- Reviews reales de clientes (Google / Trustpilot / internas)
- Tasa de devoluciones
- Datos de ventas / conversión
- Comparativas de catálogos externos
- Certificaciones del fabricante (ISO, CE, GOTS, OEKO-TEX, etc.)
- Resultados de tests de durabilidad
- Bases de datos de sostenibilidad
Qué significa esto para ti
- Los scores son opinión sintética, no hechos verificados.
- Mismo producto puede dar scores distintos entre runs si la temperatura del modelo es distinta de cero.
- Útiles relativamente, no absolutamente — el LLM tiene sentido común (Hermès → luxury, Primark → budget). Los scores ayudan a diferenciar productos dentro de tu propio catálogo; no te benchmarkean contra competidores.
typical_competitorstiene la misma limitación — son inferencias plausibles, no datos de mercado verificados.
Cómo distinguir scores grounded vs sintéticos
Cada producto muestra un badge junto a los Quality Scores:
- 🟢 Data-grounded — evidencia externa respalda el score (futuro: reviews, devoluciones, certificaciones)
- 🔵 AI + owner hints — completaste el Enrichment Wizard para este producto
- 🟡 AI-inferred — opinión pura del LLM basada en title/description/vendor (default)
Cómo lo estamos arreglando
Ya shippeado (abril 2026)
Enrichment Wizard — preguntas de evidencia. El Wizard tiene ahora una sección Evidence dedicada tras las preguntas de contexto originales. Cinco campos nuevos, todos opcionales:
- Warranty — None / 6m / 1y / 2y / 3y / 5y / 10y / Lifetime
- Certifications — lista comma-separated (ISO 9001, CE, GOTS, OEKO-TEX, MIL-STD-810, B-Corp, Fair Trade, etc.)
- Returns rate — rangos de
<2%a>20%, más un opt-out Don't know - Customer reviews — rating + count agregados de cualquier fuente (Google, Trustpilot, internas, marketplaces)
- Manufacturing origin — país + nombre del fabricante
Rellenar 3+ de estos campos sube el badge del producto de amber (AI-inferred) a verde (Data-grounded). Rellenar 1-2 lo sube a cyan (AI + owner hints). El wizard te avisa cuando entras en la sección de evidencia y qué hace rellenarlos.
Typical Competitors verificados por el owner. El Edit tab del producto tiene ahora una sección Typical Competitors donde añades los productos competidores reales (brand + model + precio de referencia opcional + notes). Cuando hay al menos una entrada guardada, Clione marca la lista como owner-verified y deja de dejar al LLM regenerarla en re-enrichment. Es el mismo patrón de grounding que el wizard de evidencia — tu input gana sobre la conjetura del LLM.
Si no rellenas nada, los competitors inferidos por el LLM siguen apareciendo con una etiqueta AI-INFERRED para que siempre sepas qué estás viendo.
Roadmap (lo que viene)
- Conectores de datos externos — Google Analytics conversion rate, APIs de reviews Judge.me y Yotpo, Shopify Refunds API / BigCommerce Returns webhook
- Procedencia por score — cada score individual lleva su propio
source(owner/reviews/returns/llm_synthetic/composite) con su traza de evidencia, y la UI muestra why this score bajo demanda - Scoring compuesto — cuando varias fuentes discrepan, el dashboard explica el resultado ponderado en lugar de elegir una y esconder las otras
Hasta que lleguen los conectores externos, trata los scores como la lectura del LLM del texto de tu catálogo, afinada por la evidencia + competidores que le pases vía Wizard y Edit tab.