Building Agentic Commerce #3: Trust Scores — Cómo los Agentes Deciden a Quién Comprarle
Cuando un agente IA evalúa merchants, no lee reseñas ni reconoce logos. Lee trust scores — 12 señales verificables por máquina que determinan ranking de búsqueda, elegibilidad de checkout y fricción de pago. Así funciona el sistema.
Resumen ejecutivo
Tercer post de la serie 'Building Agentic Commerce'. Guía developer del sistema de trust scoring de 12 componentes: cómo se calculan los scores, cómo los usan los agentes para ranking y gating, cómo la verificación eIDAS QTSP proporciona el mayor boost de confianza, y cómo el motor de políticas KYAI aplica umbrales por merchant.
Publicado
2026-04-06
14 min
Autoría
Equipo de arquitectura de integraciones
Arquitectos de implementación
El equipo de arquitectura de integraciones se centra en patrones prácticos de despliegue para tiendas que adoptan superficies de comercio compatibles con MCP.
Ver perfilCategoría
developer-guide
Cuando compras algo online, te basas en reconocimiento de marca, estrellas, recomendaciones y intuición. Un agente IA no tiene nada de eso. Necesita señales cuantitativas y verificables por máquina para decidir: ¿debo comprar a este merchant? ¿Cuánta fricción debo aceptar? ¿Es fiable este listado de productos? Esto es lo que resuelven los trust scores — y en este post te mostramos exactamente cómo AgenticMCPStores los calcula, sirve y aplica en cada interacción con agentes.
Este es el Parte 3 de la serie 'Building Agentic Commerce'. La Parte 1 cubrió checkout multi-protocolo (MCP + x402 + ACP). La Parte 2 cubrió descubrimiento de agentes vía NLWeb y llms.txt. La Parte 4 cubrirá pagos con stablecoins x402 en profundidad.
Por Qué los Agentes Necesitan Trust Scores
Los compradores humanos evalúan la confianza de forma subconsciente. Ves un sitio web cuidado, reconoces una marca, verificas un badge de Trustpilot y decides en segundos. Los agentes IA operan diferente — procesan respuestas JSON, no señales visuales. Un merchant con un storefront hermoso y otro con un feed de productos roto se ven idénticos a menos que haya una señal de confianza estructurada adjunta a los datos. Los trust scores proporcionan esa señal. Cada merchant en AgenticMCPStores tiene un score entre 0 y 1.0, calculado a partir de 12 componentes en tiempo real. Este score determina tres cosas: ranking de búsqueda, elegibilidad de checkout y nivel de fricción de pago.
Los 12 Componentes de Trust
El trust score no es una métrica única — es un compuesto ponderado de 12 señales independientes. Cada componente mide una dimensión diferente de fiabilidad del merchant. El sistema fue diseñado para que ningún componente pueda dominar el score, y manipular una métrica no mejore significativamente el total.
8 Componentes Originales (59% del peso)
Estos ocho componentes formaban parte del framework de confianza inicial y se centran en calidad de catálogo y fiabilidad de transacciones: • catalog_completeness (11%) — Porcentaje de productos con metadatos completos (título, descripción, precio, imágenes, categorías). Una tienda con 200 productos donde 180 tienen metadatos completos puntúa 0.90. • catalog_freshness (11%) — Cuán recientemente se sincronizó el catálogo. La frescura decae con el tiempo — un sync de hace 2 horas puntúa más que uno de hace 48 horas. Se recalcula cada 6 horas. • price_accuracy (12%) — Desviación entre precios declarados y precios reales en checkout. Si un producto lista $29.99 pero cobra $34.99 en checkout, este componente baja. El componente original con mayor peso porque la confianza en precios es fundamental. • availability_accuracy (8%) — Concordancia entre stock declarado y disponibilidad real. Si productos marcados 'in_stock' fallan consistentemente en checkout, este score se degrada. • policy_coverage (8%) — Completitud de políticas de devolución, envío y reembolso. Los agentes necesitan políticas claras y legibles por máquina para tomar decisiones de compra en nombre de usuarios. • checkout_success_rate (11%) — Ratio de checkouts completados vs iniciados. Una alta tasa de abandono (causada por errores, no por elección del usuario) señala problemas de infraestructura. • fulfillment_rate (8%) — Pedidos cumplidos exitosamente vs pedidos realizados. Rastrea el rendimiento real de entrega en una ventana de 30 días. • dispute_rate (7%) — Contracargos y disputas por transacción. Métrica inversa — menor es mejor. Una tasa de disputas superior al 2% activa revisión automática.
Componentes V2 (24% del peso)
Cuatro componentes adicionales fueron añadidos para capturar señales de calidad específicas de agentes: • agent_satisfaction_rate (8%) — Ratio de eventos CHECKOUT_COMPLETE vs CHECKOUT_START de la tabla AgentRequestMetric. A diferencia de tasas de conversión humanas, mide si los agentes que empiezan a comprar realmente terminan — un proxy de fiabilidad de la API. • response_latency (5%) — Tiempo promedio de respuesta de la API para peticiones de agentes. Respuestas más rápidas puntúan más alto. Actualmente usa un valor sintético por defecto de 0.8 para merchants sin datos suficientes. • review_sentiment (5%) — Rating promedio normalizado de productos (averageRating / 5). Puente entre feedback humano y el modelo de confianza para agentes. • data_consistency (6%) — Delta entre datos del sync y respuestas de la API en vivo. Detecta merchants cuyo sync de catálogo diverge de su storefront real. Actualmente usa un valor sintético por defecto de 0.85.
Distribución de Pesos
Los 12 pesos suman exactamente 1.0. El score final es un promedio ponderado simple: ``` trustScore = Σ(component_score × component_weight) = (catalog_completeness × 0.11) + (catalog_freshness × 0.11) + (price_accuracy × 0.12) + (availability_accuracy × 0.08) + (policy_coverage × 0.08) + (checkout_success_rate × 0.11) + (fulfillment_rate × 0.08) + (dispute_rate × 0.07) + (agent_satisfaction_rate × 0.08) + (response_latency × 0.05) + (review_sentiment × 0.05) + (data_consistency × 0.06) ``` Los scores se recalculan cada 6 horas por un job programado. El servicio trust-component-calculator.ts maneja las matemáticas.
eIDAS QTSP: El Boost de Verificación
Los trust scores miden fiabilidad conductual, pero no verifican identidad. Un merchant puede tener un catálogo perfecto y aún así ser fraudulento. Aquí entra la verificación eIDAS QTSP. Los merchants que completan verificación de identidad certificada por el gobierno a través de un Qualified Trust Service Provider (InfoCert) reciben un boost de trust score aditivo a su score calculado.
Existen tres niveles de verificación: ```typescript VERIFICATION_TRUST_BOOST = { BASIC: 0.05, // ID Personal, MDL, EUDI PID STANDARD: 0.10, // Registro de Empresa QUALIFIED: 0.18 // eIDAS QTSP (InfoCert KYB) } ``` El nivel QUALIFIED (+0.18) es el más alto porque requiere verificación Know Your Business supervisada por el gobierno vía InfoCert, con validez legal en 30 países EU/EEA bajo el Reglamento eIDAS 910/2014. Un merchant con score conductual de 0.72 y verificación QTSP tendría un score efectivo de 0.90 — una ventaja significativa en ranking de búsqueda para agentes.
Detalle importante: los boosts no son aditivos entre tipos de verificación. Si un merchant tiene tanto un boost VDC (Verifiable Digital Credential) como un boost de identidad KYApay, el sistema usa el máximo de los dos, no la suma. Esto previene el apilamiento de boosts: ```typescript // vdc-trust-boost.service.ts effectiveBoost = Math.max(kyapayBoost, vdcBoost) ```
Cómo los Trust Scores Afectan el Ranking de Búsqueda
Cuando un agente llama a search_products o usa la búsqueda semántica de AgentFinder, los trust scores influyen directamente en qué resultados aparecen y en qué orden.
Filtro de Elegibilidad Duro
Antes de cualquier ranking, un filtro duro elimina merchants no elegibles: ```typescript // agent-search.service.ts store: { verificationLevel: { in: ['BASIC', 'STANDARD', 'PREMIUM'] }, trustScore: { gte: 0.3 }, suspendedAt: null } ``` Merchants con trust score inferior a 0.3 son invisibles para los agentes. No aparecen en resultados de búsqueda, listados de productos ni endpoints de descubrimiento. Es una puerta dura — ningún nivel de relevancia textual puede anularla.
Fórmula de Ranking Ponderada por Trust
Para merchants que pasan el filtro, el score de relevancia final combina calidad de coincidencia textual con trust: ```typescript // nlweb-agentfinder.service.ts relevanceScore = Math.min(1, relevanceScore * 0.7 + trustWeight * 0.3) // donde trustWeight = trustScore / 5 ``` 70% del ranking viene de relevancia textual/semántica (cuán bien el producto coincide con la query). 30% viene del trust. Esto significa que un producto altamente relevante de un merchant con bajo trust puede ser superado por un producto moderadamente relevante de un merchant con alto trust.
Niveles de Estado por Score
Los trust scores se mapean a cuatro estados operacionales: • ACTIVE (score ≥ 0.5) — Visibilidad total en resultados de búsqueda. Posiciones top de ranking. • DEPRIORITIZED (0.3 ≤ score < 0.5) — Aparece en búsqueda pero con ranking inferior. Los agentes ven estos resultados pero prefieren merchants ACTIVE. • HIDDEN (0.2 ≤ score < 0.3) — Eliminado de resultados de búsqueda completamente. Los enlaces directos siguen funcionando. • SUSPENDED (score < 0.2) — Auto-suspensión activada. Todas las herramientas MCP devuelven errores. El merchant debe resolver el problema para reactivarse. Cuando un merchant cae por debajo de 0.3, se registra un evento de seguridad y se envía una notificación GDPR Artículo 22 (porque el scoring automatizado afecta el acceso comercial).
Motor de Políticas KYAI: Trust en el Checkout
Los trust scores no solo afectan el descubrimiento — controlan el checkout. El motor de políticas KYAI (Know Your AI) evalúa cada intención de compra contra una cadena de reglas, cada una con un nivel de prioridad. Dos reglas usan específicamente los trust scores:
Agent Trust Gate (Prioridad 10) ```typescript // agent-trust-gate.rule.ts MINIMUM_TRUST_SCORE = 0.3 // Decisión: BLOCK si // intent.agent.trustTier === 'BLOCKED' // intent.agent.trustScore < 0.3 ``` Esta es una puerta dura. Los agentes con trust score inferior a 0.3 son bloqueados de iniciar cualquier checkout. El primer BLOCK en la cadena de reglas termina la evaluación — ninguna regla posterior puede anularlo.
Minimum Buyer Trust (Prioridad 15) ```typescript // min-buyer-trust.rule.ts DEFAULT_MIN_BUYER_TRUST = 0.3 // Decisión: FRICTION si // intent.agent.trustScore < merchant_threshold ``` Esta es más suave — aplica fricción (pasos de verificación adicionales) en lugar de bloquear. Los merchants pueden configurar su propio umbral mínimo de trust del comprador. Un merchant premium puede requerir agentes con score de 0.6+ mientras un merchant de marketplace acepta 0.3+.
El motor KYAI procesa reglas en orden de prioridad (1 a 15). Los resultados posibles son: • ALLOW — Proceder normalmente • FRICTION — Verificación adicional requerida (confirmar intención, proporcionar autorización del usuario) • REVIEW — Marcado para revisión manual del merchant • BLOCK — Transacción denegada Múltiples reglas FRICTION se acumulan — la peor decisión gana. Pero un BLOCK termina la cadena inmediatamente.
El Modelo de Confianza Trilateral
AgenticMCPStores usa un modelo de confianza trilateral — tres actores separados, cada uno con su propio score: • Trust de Merchant — 12 componentes, actualizado cada 6 horas, umbral mínimo 0.3 • Trust de Agente Comprador — 8 componentes, actualizado cada hora, umbral mínimo 0.5 • Trust de Agente Vendedor — 8 componentes, actualizado cada hora, umbral mínimo 0.6 Los scores de agentes comprador y vendedor tienen umbrales más altos porque las acciones de agentes tienen impacto más inmediato — un agente comprometido podría realizar compras no autorizadas o listar productos fraudulentos a escala. La asimetría entre comprador (0.5) y vendedor (0.6) refleja el mayor potencial de daño del compromiso de un agente vendedor.
Acceso a Trust Scores vía API
Los trust scores están disponibles tanto por REST como por interfaz MCP. Endpoints REST API: ``` GET /trust/scores/:storeId → Score actual + 12 componentes GET /trust/scores/:storeId/history → Historial de scores (param days) POST /trust/scores/:storeId/compute → Forzar recálculo (admin) GET /trust/health → Estadísticas de la red GET /trust/recommendations/:storeId → Sugerencias de mejora ``` Herramienta MCP: Los datos de trust están integrados en la respuesta de la herramienta `get_merchant_profile`. No existe herramienta de trust separada — los agentes obtienen información de trust como parte del descubrimiento del merchant, alineado con el principio de que el trust debe ser contextual, no aislado.
Tips de Producción
- 1Sincroniza tu catálogo frecuentemente — catalog_freshness (11% peso) decae con el tiempo. Un sync diario mantiene este componente cerca de 1.0.
- 2Completa metadatos de productos — catalog_completeness (11%) verifica títulos, descripciones, precios, imágenes y categorías. Solo faltar imágenes puede bajar este componente a 0.8.
- 3Arregla errores de checkout rápidamente — checkout_success_rate (11%) es uno de los componentes con mayor peso. Una integración de pago rota puede hundir tu score en 6 horas.
- 4Obtén verificación eIDAS QTSP — el boost de +0.18 es la mayor mejora individual disponible. Es especialmente impactante para merchants nuevos que aún no tienen historial conductual.
- 5Monitoriza el endpoint /trust/recommendations — devuelve sugerencias específicas y accionables ordenadas por impacto. Empieza por los componentes de mayor peso.
- 6Mantén precios consistentes — price_accuracy (12%) es el componente original con mayor peso. Cualquier discrepancia entre precio listado y precio de checkout degrada la confianza rápidamente.
Qué Viene Después
En la Parte 4 de Building Agentic Commerce, profundizaremos en pagos con stablecoins x402 — cómo los agentes pagan con USDC on-chain, el flujo HTTP 402, soporte multi-cadena (Base, Ethereum, Solana, Polygon, Arbitrum) y el pipeline de settlement asíncrono. Los trust scores juegan un papel ahí también: el motor KYAI puede requerir mayor trust para transacciones x402 de alto valor.
Preguntas frecuentes
¿Cuál es el trust score mínimo para que un merchant aparezca en resultados de búsqueda de agentes?
0.3. Los merchants con trust score inferior a 0.3 son completamente invisibles para los agentes — no aparecen en resultados de búsqueda, listados de productos ni ningún endpoint de descubrimiento. Entre 0.2 y 0.3, los merchants están HIDDEN (solo accesibles por enlaces directos). Por debajo de 0.2, se activa la auto-suspensión.
¿Con qué frecuencia se recalculan los trust scores?
Cada 6 horas para trust scores de merchants. El servicio trust-component-calculator se ejecuta como job programado y recalcula los 12 componentes para cada merchant activo. Los trust scores de agentes (comprador y vendedor) se actualizan cada hora por su naturaleza de mayor impacto.
¿Pueden los merchants ver los componentes de su propio trust score?
Sí. El endpoint REST GET /trust/scores/:storeId devuelve el score general más los 12 scores individuales de componentes. El endpoint /trust/recommendations/:storeId proporciona sugerencias accionables de mejora, ordenadas por impacto en el score total.
¿Cómo se compara el boost de trust eIDAS QTSP con otros métodos de verificación?
La verificación BASIC (ID personal) proporciona un boost de +0.05. La verificación STANDARD (registro de empresa) proporciona +0.10. La verificación QUALIFIED (eIDAS QTSP vía InfoCert) proporciona +0.18 — la más alta disponible. El boost es aditivo al score conductual pero no apilable con otros tipos de boost (el sistema usa máximo, no suma).
¿Qué pasa si el trust score de un merchant cae repentinamente?
Si el score cae por debajo de 0.3, el merchant es eliminado de resultados de búsqueda y se registra un evento de seguridad. Por debajo de 0.2, se activa la auto-suspensión. En ambos casos se envía una notificación GDPR Artículo 22 porque el scoring automatizado afecta el acceso comercial. El dashboard del merchant muestra métricas de trust en tiempo real y alertas de cambios de score.
Fuentes y referencias
Artículos relacionados
developer-guide
Building Agentic Commerce #1: Checkout Multi-Protocolo — MCP + x402 + ACP en un solo flujo
Un agente, tres protocolos, un checkout. Asi es como MCP, pagos stablecoin x402 y ACP trabajan juntos para que los agentes de IA compren productos, con ejemplos de codigo que puedes ejecutar hoy.
developer-guide
Building Agentic Commerce #2: Como los agentes de IA descubren tu tienda sin API Key
Antes de que un agente pueda comprar algo, necesita encontrar tu tienda. Asi funciona la cadena de descubrimiento de 6 fases que lleva a un agente de IA de cero conocimiento a listo para checkout en menos de 2 segundos, sin configuracion previa.
trust-compliance
Por que la identidad de comerciante verificada con eIDAS lo cambia todo para el comercio con IA
Los agentes de IA necesitan mas que datos de productos para comprar: necesitan prueba criptografica de que los comerciantes son quienes dicen ser. Asi es como la verificacion eIDAS QTSP resuelve la brecha de confianza en el comercio agentico.