Generar ideas es fácil. Determinar si son nuevas y valiosas es el verdadero desafío. El sistema incluye un módulo de auditoría automatizada que actúa como un "Revisor de Pares" preliminar.
Los sistemas de IA generativa pueden producir hipótesis que suenan plausibles pero que en realidad ya han sido exploradas en la literatura. Sin validación externa, se corre el riesgo de:
Cada idea se valida contra la literatura científica mundial en tiempo real
AI2 (Allen Institute)
OurResearch (ex Microsoft Academic)
Tres pasos para cada idea generada
El sistema construye queries semánticas a partir de la idea propuesta y busca activamente en Semantic Scholar y OpenAlex papers que ya hayan explorado esa combinación específica de conceptos.
Ejemplo de query:
"transfer learning computer vision natural language processing cross-domain application"
Un modelo evaluador especializado (LLM con prompt de revisión) analiza:
Basándose en la evidencia recuperada, la idea se clasifica en uno de tres estados:
Clasificación automática del nivel de novedad basada en evidencia científica
Genuinamente Nuevo
No se recuperó evidencia significativa que conecte los conceptos clave de la idea propuesta. Es una brecha de investigación genuina con alta probabilidad de ser inédita.
Métricas:
novelty_score > 0.8🚀 Acción recomendada:
✓ Prioridad alta para investigación
✓ Proceder con desarrollo de hipótesis formal
✓ Diseñar experimentos preliminares
✓ Asegurar recursos y financiamiento
Tendencia Reciente
Existen papers muy recientes (últimos 2-3 años) que empiezan a explorar esta conexión. El tema está en crecimiento activo.
Criterios de validación:
⚡ Acción recomendada:
⚠ Competencia emergente detectada
✓ Revisar papers recientes identificados
✓ Identificar el "ángulo diferenciador"
✓ Actuar rápido antes de saturación del tema
Consolidado
La conexión está bien establecida en la literatura anterior.
El sistema proporciona referencias existentes (prior_art_refs) para consulta.
Métricas:
knownness_score > 0.75🔄 Acción recomendada:
× Descartar o pivotar la idea original
✓ Leer los papers existentes (aprendizaje)
✓ Buscar un ángulo completamente no explorado
✓ Considerar extensiones o variaciones novedosas
Ambiguo
Evidencia insuficiente o contradictoria. El evaluador LLM no pudo determinar con confianza si la idea es nueva o existente.
Causas posibles:
🔍 Acción recomendada:
⚠ Requiere ojo humano experto
⚠ Revisar evidencia recuperada manualmente
⚠ Consultar con experto del dominio
⚠ Refinar la formulación de la idea y re-validar
Modelo evaluador especializado (ej. GPT-4o mini) que analiza abstracts
Veredicto del Juez
La combinación específica de conceptos no aparece en la evidencia recuperada. Los abstracts analizados no muestran interacción directa entre las ideas propuestas.
Veredicto del Juez
Los conceptos aparecen interactuando directamente en la evidencia. Múltiples papers demuestran que la conexión ya ha sido explorada o implementada.
Veredicto del Juez
La interacción aparece solo en literatura reciente. El tema es joven y está en fase de exploración activa por la comunidad científica.
Rango: 0.0 - 1.0
Probabilidad estimada de que la idea sea inédita. Calculada a partir de:
Umbral típico: novelty_score > 0.8 → clasificación NOVEL_BRIDGE
Rango: 0.0 - 1.0
Grado de certeza de que la idea ya existe en la literatura. Inverso conceptual a novelty_score.
Umbral típico: knownness_score > 0.75 → clasificación KNOWN_LINK
Cada clasificación debe estar respaldada por evidencia para garantizar la confiabilidad del sistema:
Mínimo de referencias
min_evidence_refs = 2 (default)
Se requieren al menos 2 documentos recuperados para hacer una clasificación confiable.
Fuentes de verdad
• OpenAlex (250M+ works)
• Semantic Scholar (200M+ papers)
• Consulta en tiempo real
El impacto real de la validación automática
De ideas generadas por IA sin validación son redundantes o existentes
Más rápido que una revisión bibliográfica manual exhaustiva
Ahorro en recursos de investigación evitando duplicación de esfuerzos
Cómo funciona bajo el capó
A partir de la idea propuesta, el sistema genera múltiples queries optimizadas:
Los papers recuperados se rankean por relevancia y se analiza el top-K:
Modelo especializado en revisión crítica de ideas:
Cada resultado incluye metadatos accionables:
No deje que meses de investigación terminen en un "esto ya se hizo en 2019". Valide automáticamente antes de comenzar.