Todo lo que debes saber de LLaMA, el modelo de lenguaje de Meta

La empresa de Mark Zuckerberg es la última tecnológica que entra al mercado de la Inteligencia Artificial. Meta no se quiere quedar atrás.
Foto: Wikimedia

La guerra por la supremacía en el desarrollo de Inteligencia Artificial tiene un nuevo contendiente. Meta – la empresa matriz de Facebook – presentó LLaMa, acrónimo para Large Language Model Meta AI. Este es un modelo de lenguaje de 65 mil millones de parámetros y es considerado como fundacional, lo que significa que no está especializado en ninguna tarea específica, sino que puede adaptarse a diferentes aplicaciones y dominios.

Meta ha decidido compartir públicamente LLaMa con la comunidad científica para fomentar la investigación abierta y colaborativa en este ámbito. Además, Meta asegura que LLaMa tiene algunas ventajas sobre otros modelos similares como el GPT-3 de OpenAI o el Prometheus de Bard.

  • Es más eficiente: LLaMa utiliza menos recursos computacionales para entrenarse y ejecutarse que otros modelos de su tamaño. Esto se debe a que emplea técnicas innovadoras como OPT175B o Mixture of Experts para optimizar su rendimiento.
  • Es más versátil: LLaMa puede aprender de múltiples fuentes de datos simultáneamente, lo que le permite incorporar información más variada y actualizada a su conocimiento. Por ejemplo, puede combinar datos extraídos de Wikipedia con datos provenientes de redes sociales o sitios web especializados.
  • Es más adaptable: LLaMa puede ajustar su nivel de complejidad y formalidad según el contexto y el público al que se dirige. Por ejemplo, puede generar textos más simples o más elaborados dependiendo del propósito y del tono deseado.

Meta dice que su modelo llamado LLaMA-13B funciona mejor que el modelo popular de OpenAI, llamado GPT-3, en la mayoría de las pruebas. Además, su modelo más grande, LLaMA-65B, es muy bueno y compite con otros modelos avanzados como Chinchilla70B de DeepMind y PaLM 540B de Google.

La empresa espera que LLaMa sea una herramienta útil para los investigadores y desarrolladores que quieran explorar las posibilidades y los desafíos de los modelos de lenguaje de gran escala. Asimismo, Meta planea utilizar LLaMa para mejorar sus propios productos y servicios como Facebook, Instagram o WhatsApp.

LLaMA no es un sistema conversacional como ChatGPT o Bing. Es una herramienta de investigación que Meta comparte con el objetivo de “democratizar el acceso en este campo relevante y en rápida evolución”. Es decir: ayudar a los expertos a resolver los problemas de los modelos de lenguaje de IA, desde el sesgo y la toxicidad hasta su propensión a simplemente inventar información.

LLaMA estará disponible bajo licencia no comercial para investigadores y entidades afiliadas al gobierno, la sociedad civil y la academia. Puedes registrarte para solicitar acceso en el formulario que Meta ha puesto a disposición.

Lee el paper de LLaMA

Total
0
Shares
Previous Post

Steve Jobs: a 68 años del inicio de una leyenda tecnológica

Next Post

Antonio Felix Da Costa gana un increíble EPrix de Ciudad del Cabo

Related Posts