Clibrain presenta LINCE, el primer modelo de lenguaje (LLM) optimizado para la IA en español

04/08/2023 - 16:55 por Business Wire
Clibrain presenta LINCE, el primer modelo de lenguaje (LLM) optimizado para la IA en español

Clibrain anuncia el logro de un hito dentro de la inteligencia artificial: la creación de su primer modelo de lenguaje (LLM) completamente adaptado y entrenado en español: LINCE. Este modelo es un hito sin precedentes en nuestra lengua y Clibrain se sitúa a la vanguardia en la evolución de las IA, dando un paso adelante en el camino hacia un futuro donde la comunicación entre humanos y máquinas está alcanzando su máxima expresión.

El desarrollo de este modelo es una innovación en el proceso de entrenamiento, corpus y técnicas empleadas para obtener el mejor rendimiento, aplicando las últimas técnicas de entrenamiento (fine-tuning) eficientes sobre LLMs, resultado de un dataset totalmente nuevo e inexistente hasta la fecha. El modelo está hecho bajo un enfoque de instrucciones.

¿Por qué nace un modelo del lenguaje entrenado íntegramente en español?

Existe una gama de más de 21 variantes del español para las cuales no existen modelos de lenguaje especializados. Las máquinas suelen ofrecer dos o tres variedades, entre las que normalmente se encuentran el español de España y el “latino”, pero sin mucha más variedad. Y lo que es más importante, es que, por lo general, las respuestas e instrucciones en nuestro idioma son el resultado de traducir del inglés a otras lenguas, lo que implica una pérdida de calidad y de matices que nos pone de entrada en desventaja.

“Si el contexto para la IA generativa es importante, el contexto cultural aún lo es más, y especialmente cuando hablamos de variedades del lenguaje y dialectos”, explica Elena González-Blanco, CEO de Clibrain.

Este desafío se vuelve particularmente notorio en disciplinas con lenguaje técnico y especializado como lo son las jurídicas, las financieras o las médicas, al igual que en la interpretación de refranes, frases hechas e incluso en el análisis del castellano antiguo.

Un modelo Open Source

Otra pieza interesante del camino que emprende Clibrain es el lanzamiento de dos versiones del modelo de lenguaje: la primera ya se ha publicado bajo licencia open source, con más de 7 billones de parámetros, denominada “LINCE ZERO”, que puede utilizar cualquiera para crear sus aplicaciones o utilizarla con fines no comerciales; la versión definitiva, "LINCE", se lanzará en las próximas semanas.

Únete a la lista de espera

Si quieres ser uno de los primeros en probar LINCE, puedes solicitar acceso en lince@clibrain.com.

Contacts :

Ignacio Goñi
Clibrain
ignacio@clibrain.com
(+34) 606 719 368


Source(s) : Clibrain