#0027 - IA generativa con datos propios sin re-entrenar

20 de sep. de 2023 · 50m 35s
#0027 - IA generativa con datos propios sin re-entrenar
Descripción

Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para...

mostra más
Los casos de uso de la IA generativa se están multiplicando pero un denominador común en muchos de ellos es la necesidad de utilizar información personalizada, propia y privada para generar las respuestas sin que dicha información haya formado parte del entrenamiento de un modelo, sin olvidarnos también de evitar las alucinaciones que pueden producirse.
En este capítulo Pablo Nuñez Pölcher nos cuenta como el uso de estrategias como la generación amplificada por recuperación de información (Retrieval Augmented Generation o RAG) son claves para conseguir estos objetivos. Veremós en qué se basa esta estrategia, qué componentes tecnológicos son necesarios, las distintas alternativas para su implementación en AWS y como escojer la más adecuada: desde el servicio gestionado Amazon Kendra hasta los distintos modelos fundacionales para el cálculo de embeedings, pasando por las bases de datos vectoriales disponibles.Si quieres probar tu mismo los conceptos aparecidos en el capítulo, con distintos proveedores de modelos y distintos orígenes para RAG puedes hacerlo siguiendo este link: https://github.com/aws-samples/aws-genai-llm-chatbot/tree/main

Albert Capdevila es un arquitecto de soluciones de AWS basado en Barcelona, ayudando a los clientes a construir sus cargas en AWS de acuerdo a las mejores prácticas. Después de más de 15 años trabajando en proyectos en el ámbito de las arquitecturas de integración, lleva ya 4 años focalizado en el cloud y en el AI/ML.
Albert está actualmente trabajando en un modelo de predicción del tiempo libre que sus hijos le van a dejar para poder ir a escalar montañas.
Contacta con Albert Capdevila en LinkedIn en https://www.linkedin.com/in/albertcapdevila/

Pablo Núñez es arquitecto de soluciones de AWS con base en Madrid. Desde allí, trabaja con clientes de salud y educación ayudándoles diseñar y desplegar sus cargas de manera escalable, sostenible y según mejores prácticas.
Lleva inmerso en el mundo del cloud y el machine learning más de 5 años, y otros 15 de desarrollador backend. Su pasión por la bioingeniería lo ha llevado a ser además biólogo con especialización en fisiología.
Cuando no está frente al ordenador, reparte su tiempo entre la electrónica, sus bicicletas, su alérgico gato negro (Hawking), y discutiendo investigaciones médicas con su esposa.
Contacta con Pablo Nuñec en LinkedIn en https://www.linkedin.com/in/ppolcher
mostra menos
Información
Autor Amazon Web Services España
Organización Amazon Web Services España
Página web -
Etiquetas

Parece que no tienes ningún episodio activo

Echa un ojo al catálogo de Spreaker para descubrir nuevos contenidos.

Actual

Portada del podcast

Parece que no tienes ningún episodio en cola

Echa un ojo al catálogo de Spreaker para descubrir nuevos contenidos.

Siguiente

Portada del episodio Portada del episodio

Cuánto silencio hay aquí...

¡Es hora de descubrir nuevos episodios!

Descubre
Tu librería
Busca