Taxonomía de la IA Generativa
Taxonomía de la IA generativa
La inteligencia artificial generativa abarca una familia de sistemas computacionales capaces de crear nuevo contenido (texto, imágenes, audio, vídeo o datos sintéticos) basándose en patrones aprendidos a partir de datos de entrenamiento. Esta taxonomía proporciona un marco estructurado para comprender las tecnologías clave y sus posibles aplicaciones dentro de la cadena de valor agroalimentaria.
1. Modelos de cimentación y familias de arquitectura
1.1 Modelos de cimentación
Definición : Modelos a gran escala entrenados en conjuntos de datos diversos y multimodales que sirven como base para múltiples aplicaciones posteriores.
Características clave :
Preentrenado con conjuntos de datos masivos (normalmente miles de millones de parámetros)
Generalizable a través de múltiples tareas y dominios
Requiere ajustes para aplicaciones específicas
Altos requisitos computacionales para entrenamiento e inferencia
Aplicaciones agroalimentarias : Monitoreo de cultivos, optimización de la cadena de suministro, análisis predictivo para pronóstico de rendimiento, sistemas automatizados de control de calidad.
1.2 Arquitectura del transformador
Definición : Una arquitectura de red neuronal basada en mecanismos de atención que procesa datos secuenciales en paralelo en lugar de secuencialmente.
Componentes clave :
Mecanismos de atención multicabezal
Codificación de posición
Redes de propagación hacia adelante
Estructuras codificador-decodificador (opcional)
Importancia : Constituye la columna vertebral de la mayoría de los modelos lingüísticos modernos y de muchos sistemas multimodales.
2. Sistemas basados en el lenguaje
2.1 Modelos de lenguaje grandes (LLM)
Definición : Modelos basados en transformadores diseñados específicamente para la comprensión y generación del lenguaje natural.
Especificaciones técnicas :
Recuentos de parámetros que van desde millones hasta billones
Capacitado en corpus de texto que abarcan múltiples idiomas y dominios.
Capacidad de aprendizaje de pocos disparos y de cero disparos
Aplicaciones agroalimentarias :
Generación de documentación técnica
Informes de cumplimiento normativo
Análisis de mercado e identificación de tendencias
Automatización del servicio al cliente
Comunicación en la cadena de suministro
2.2 Modelos de lenguaje pequeños (SLM)
Definición : Modelos de lenguaje compactos optimizados para tareas específicas o restricciones de implementación.
Características :
Menos parámetros (normalmente menos de 10 mil millones)
Capacitación específica del dominio
Requisitos computacionales más bajos
Tiempos de inferencia más rápidos
Ventajas agroalimentarias : Adecuado para implementación de borde en sistemas de IoT agrícolas, procesamiento fuera de línea en ubicaciones remotas, implementación rentable para operaciones más pequeñas.
2.3 Modelos multimodales grandes (MLM)
Definición : Sistemas que procesan y generan contenido en múltiples modalidades (texto, imágenes, audio, vídeo).
Capacidades :
Generación de imagen a texto
Síntesis de texto a imagen
Comprensión intermodal
Razonamiento integrado entre modalidades
Aplicaciones agroalimentarias : Identificación automatizada de enfermedades de cultivos mediante análisis de imágenes, sistemas de evaluación de calidad, monitoreo de agricultura de precisión, sistemas de informes automatizados que combinan datos de sensores con inspección visual.
3. Sistemas de generación de imágenes y visuales
3.1 Redes generativas antagónicas (GAN)
Definición : Un marco que consta de dos redes neuronales que compiten entre sí: un generador y un discriminador.
Arquitectura :
Generador: Crea datos sintéticos
Discriminador: Distingue entre datos reales y sintéticos.
Entrenamiento mediante funciones de pérdida adversarial
Aplicaciones agroalimentarias :
Generación de imágenes de cultivos sintéticos para conjuntos de datos de entrenamiento
Aumento de datos para sistemas de identificación de plagas
Simulación del crecimiento de cultivos en diferentes condiciones.
Capacitación en sistemas de control de calidad
3.2 Autocodificadores variacionales (VAE)
Definición : Modelos probabilísticos que aprenden a codificar datos en un espacio latente y decodificarlos nuevamente al espacio original.
Características técnicas :
Arquitectura del codificador-decodificador
Representación probabilística del espacio latente
El espacio latente continuo permite la interpolación
Enfoque basado en principios para la generación mediante muestreo
Aplicaciones agroalimentarias :
Predicción del rendimiento de los cultivos mediante modelos de variación genética
Análisis y síntesis de la composición del suelo
Interpolación de parámetros de calidad
Detección de anomalías en sistemas agrícolas
3.3 Modelos de difusión
Definición : Modelos generativos que aprenden a revertir un proceso gradual de adición de ruido para crear muestras de alta calidad.
Proceso :
Proceso de avance: agrega gradualmente ruido a los datos
Proceso inverso: aprende a eliminar el ruido y generar muestras
Enfoque de refinamiento iterativo
Ventajas : Calidad de imagen superior, entrenamiento estable, proceso de generación controlable.
Aplicaciones agroalimentarias :
Mejora de imágenes satelitales de alta resolución
Generación de escenas agrícolas sintéticas
Visualización de simulación climática
Diseño de embalaje de productos
4. Sistemas específicos de la aplicación
4.1 Chatbots e IA conversacional
Definición : Sistemas interactivos diseñados para el diálogo en lenguaje natural con los usuarios.
Componentes técnicos :
Comprensión del lenguaje natural (NLU)
Gestión del diálogo
Generación de lenguaje natural (NLG)
Mecanismos de retención de contexto
Implementación Agroalimentaria :
Sistemas de asesoramiento a los agricultores
Automatización del soporte técnico
Coordinación de la cadena de suministro
Difusión de información de mercado
4.2 Modelos de generación de código
Definición : Modelos de lenguaje especializados entrenados para generar, completar o modificar código de programación.
Capacidades :
Completado de código y sugerencia
Detección y corrección de errores
Generación de documentación
Traducción entre idiomas
Aplicaciones agroalimentarias :
Aceleración del desarrollo de software agrícola
Programación de dispositivos IoT
Generación de scripts de análisis de datos
Modernización de sistemas heredados
Research by: Beatriz Vallina, PhD
Thesis Supervisors: Roberto Cervelló, Prof.PhD & Juan José Lull, PhD
Institution: Doctorate in Agrifood Economics, Universitat Politècnica de València
© 2025. All rights reserved.