Large Language Model (LLM)
Presentació
Un model de llenguatge gran (amb acrònim anglès LLM) és un model de llenguatge que consisteix en una xarxa neuronal amb milers de paràmetres, entrenats en grans quantitats de text sense etiqueta i mitjançant aprenentatge no supervisat.
És complicat utilitzar-los eficientment. Per obtenir els millors resultats, caldria tenir un bon coneixement del domini en el que es vol treballar (les respostes no sempre són correctes), un cert coneixement sobre com funcionen els models i una certa intuïció generada a partir de l’experiència de treballar amb aquests models.
Els models més rellevants son:
ChatGPT: OpenAI
Descripció:
Model de propòsit general utilitzat per tasques relacionades amb processament de text natural.
Interface d’usuari tipus xat disponible amb registre
Model utilitzat:
ChatGPT 3.5, 4 i 4-turbo
https://cdn.openai.com/papers/gpt-4.pdf
Accés:
https://chat.openai.com (amb registre)
Costos i llicències:
https://openai.com/chatgpt/pricing
Sense cost: accés bàsic via web a model GPT-3.5
Plus 20$/mes (aprox.): creació i ús de GPTs amb el model GPT-4
Microsoft Copilot
Descripció:
Xat amb funcions de text, veu i imatge. Resum de documents i pàgines web utilitzant els models d’OpenAI
Model utilitzat:
ChatGPT 3.5, 4, 4o
Accés:
https://copilot.microsoft.com/
Costos i llicències:
Versió bàsica amb accés gratuït utilitzant el NIU UAB.
Google Gemini
Descripció breu:
chatbot similar a ChatGPT
Model utilitzat:
Basat en model propi PaLM 2
https://ai.google/discover/palm2
https://ai.google/static/documents/palm2techreport.pdf
Enllaç per poder utilitzar-lo:
Costos i llicències:
Bàsic: gratuït, model pro 1.0, cal ser usuari plataforma google
Advanced: 22€ (aprox.), model advanced, integrat a google docs
Anthropic Claude
Model – Claude desenvolupat per Anthropic AI
És un LLM i també un xatbot que utilitza el model per respondre preguntes. Ha estat entrenat per interactuar amb llenguatge natural i permet realitzar tasques com resums, edició de text, preguntes sobre coneixement, codi font informàtic, entre d’altres.
Enllaç per poder utilitzar-lo:
Costos i llicències:
Bàsic: gratuït, model claude 2 sonnet, cal donar-se d’alta al servei
Pro: 20€/mes (aprox.), model claude-3 opus, servei per accés individuals
Llama 2
Descripció breu: que fa, como interactuar, qui gestiona l’eina
Chatbot com chatGPT. Desenvolupat per Meta.
Model utilitzat:
Llama 2. desenvolupat per Meta i lliurat com model de codi obert amb restriccions. Publicat el 22 de juliol del 2023. https://ai.meta.com/blog/code-llama-large-language-model-coding/
Molt rellevant per recerca i per desenvolupament d’aplicacions comercials. És un fitxer de 7,16GB anomenat “llama-2-7b-chat" que conté el model amb les seves matrius i pesos. Es pot utilitzar com una funció i fer preguntes al nostre ordinador a les que retornarà les respostes trobades al model.
Enllaç per poder utilitzar-lo:
Es pot utilitzar en un ordinador local demanant l’accés a Meta: https://ai.meta.com/resources/models-and-libraries/llama-downloads/
També es pot explorar una demo a la web huggingface:
https://huggingface.co/spaces/ysharma/Explore_llamav2_with_TGI
Costos i llicències:
Codi obert amb restriccions.