La guerra por la supremacía en el desarrollo de Inteligencia Artificial tiene un nuevo contendiente. Meta – la empresa matriz de Facebook – presentó LLaMa, acrónimo para Large Language Model Meta AI. Este es un modelo de lenguaje de 65 mil millones de parámetros y es considerado como fundacional, lo que significa que no está especializado en ninguna tarea específica, sino que puede adaptarse a diferentes aplicaciones y dominios.
Meta ha decidido compartir públicamente LLaMa con la comunidad científica para fomentar la investigación abierta y colaborativa en este ámbito. Además, Meta asegura que LLaMa tiene algunas ventajas sobre otros modelos similares como el GPT-3 de OpenAI o el Prometheus de Bard.
- Es más eficiente: LLaMa utiliza menos recursos computacionales para entrenarse y ejecutarse que otros modelos de su tamaño. Esto se debe a que emplea técnicas innovadoras como OPT175B o Mixture of Experts para optimizar su rendimiento.
- Es más versátil: LLaMa puede aprender de múltiples fuentes de datos simultáneamente, lo que le permite incorporar información más variada y actualizada a su conocimiento. Por ejemplo, puede combinar datos extraídos de Wikipedia con datos provenientes de redes sociales o sitios web especializados.
- Es más adaptable: LLaMa puede ajustar su nivel de complejidad y formalidad según el contexto y el público al que se dirige. Por ejemplo, puede generar textos más simples o más elaborados dependiendo del propósito y del tono deseado.
Meta dice que su modelo llamado LLaMA-13B funciona mejor que el modelo popular de OpenAI, llamado GPT-3, en la mayoría de las pruebas. Además, su modelo más grande, LLaMA-65B, es muy bueno y compite con otros modelos avanzados como Chinchilla70B de DeepMind y PaLM 540B de Google.
La empresa espera que LLaMa sea una herramienta útil para los investigadores y desarrolladores que quieran explorar las posibilidades y los desafíos de los modelos de lenguaje de gran escala. Asimismo, Meta planea utilizar LLaMa para mejorar sus propios productos y servicios como Facebook, Instagram o WhatsApp.
LLaMA no es un sistema conversacional como ChatGPT o Bing. Es una herramienta de investigación que Meta comparte con el objetivo de “democratizar el acceso en este campo relevante y en rápida evolución”. Es decir: ayudar a los expertos a resolver los problemas de los modelos de lenguaje de IA, desde el sesgo y la toxicidad hasta su propensión a simplemente inventar información.
LLaMA estará disponible bajo licencia no comercial para investigadores y entidades afiliadas al gobierno, la sociedad civil y la academia. Puedes registrarte para solicitar acceso en el formulario que Meta ha puesto a disposición.