2 min read

LLM, SLM og MMM: Slik forstår du de tre generative AI-modellene

LLM, SLM og MMM: Slik forstår du de tre generative AI-modellene

De fleste er nå klar over at ChatGPT er bygget på en LLM (Large Language Model), men nå introduseres SLMer og MMMer. Hva er egentlig forskjellen mellom disse og hva kan de brukes til?

 

LLM - Large Language Model)

La oss begynne med en LLM (Large Language Model). Dette er en stor språkmodell, som er basert på kunstig intelligens, som er designet for å forstå, generere og behandle menneskelig språk på en måte som etterligner hvordan mennesker leser, skriver og tolker tekst. Disse modellene er meget store både i form av størrelsen på datasettene de er trent på og antall parametere de inneholder. De trenes på et mangfold av datasett og treningen gjør at de kan forstå og generere et bredt spekter av menneskelig språk og stiler.

LLMer er i stand til å utføre en rekke språkrelaterte oppgaver, som oversettelse, sammendrag, besvare spørsmål, skrive e-poster, skrive essays, lage innhold og mer. De kan forstå kontekst, gjenkjenne nyanser og til og med generere kreativ skriving. Selv om LLMer er svært avanserte, er de ikke perfekte og har begrensninger. De er basert på dataene de ble trent på og kan noen ganger generere feilaktig eller skjev informasjon. Kontinuerlig forbedring og oppdatering med nye data og algoritmer er viktig for deres effektivitet. 

Noen kjente LLM-er er GPT-4 (OpenAIs ChatGPT), LLAMA (Meta) og Genesis (Google). 

 

SLM - Small Language Model

Så hva er da en SLM? SLM står for Small Language Model. Man kan si at man har tatt en LLM og vesentlig redusert antall parametere. Også disse modellene er designet for å utføre oppgaver som involverer forståelse og generering av naturlig språk, men de er mindre i skala, noe som gjør dem mer tilgjengelige og lettere å bruke i visse sammenhenger.

Reduksjonen i størrelse og kompleksitet gjør dem mer tilgjengelig og passende for applikasjoner med begrensede databehandlingsmuligheter eller for utviklere med begrensede ressurser. De trenger også vesentlig mindre datakraft og derved mindre energi for å prosesseres. På grunn av deres mindre størrelse, kan SLM-er være mer effektive og raskere til å behandle forespørsler. Dette gjør dem ideelle for sanntidsapplikasjoner eller scenarier der raske svar er essensielle.

De kan også lettere tilpasses spesifikke domener eller applikasjoner enn større modeller. Denne spesialiseringen kan føre til forbedret ytelse i nisjeområder eller spesifikke oppgaver. Opplæring av en liten språkmodell er generelt mindre ressurskrevende enn opplæring av en stor modell. Dette kan gjøre SLM-er til et mer kostnadseffektivt alternativ for bedrifter eller forskere med budsjettbegrensninger. Merk deg likevel at mens SLM-er tilbyr ulike fordeler, kan de kanskje ikke matche ytelsen til større modeller når det gjelder å forstå kontekst, generere kompleks tekst eller håndtere et bredt spekter av språkoppgaver med høy nøyaktighet. 

 

MMM - Multi Modale Modeller

Multi Modale Modeller, er modeller som kan forstå flere typer inndata, som tekst, bilder, lyd og video. De kan altså håndtere en kombinasjon av datatyper. Modellene er designet for å tolke og integrere informasjon fra forskjellige sensoriske innganger, mye som mennesker oppfatter og forstår verden gjennom flere sanser.

For eksempel kan de analysere et bilde og dets ledsagende tekstbeskrivelse, forstå en video ved å behandle både det visuelle innholdet og lydsporet, eller tolke et sosiale medier-innlegg ved å vurdere teksten, emojiene og bildene. Dette kan føre til bedre ytelse i oppgaver som innholdsanalyse eller sentimentanalyse og mer nøyaktige prediksjoner eller anbefalinger, enn ved bruk av LLM eller SLM. 

Opplæring av multi-modale modeller er som regel mer komplekst enn opplæring av enkeltmodus-modeller, da det krever store og mangfoldige datasett som dekker alle typer inndata som modellen forventes å håndtere. Disse modellene bruker derved mye energi. MMM er et raskt voksende forskningsområde, og er eksempelvis nyttige for å bygge avanserte roboter som kan navigere og samhandle med sitt miljø ved hjelp av visuelle, auditive og sensoriske data. 

 

Ønsker du å vite mer om hvordan Move kan hjelpe dere i gang med å bruke AI?

Les mer og kontakt oss

Jobb-PC til privat bruk? Slik gjør du det riktig

Jobb-PC til privat bruk? Slik gjør du det riktig

I disse dager har grensen mellom jobb og fritid blitt temmelig tåkete. Med hjemmekontor og fleksible arbeidstider er det ikke rart at jobbens laptop...

Les mer
Sikkerhetsovervåkning: valg av strategi og verktøy

Sikkerhetsovervåkning: valg av strategi og verktøy

I dagens digitale landskap er sikkerhet en topp prioritet for bedrifter i alle størrelser. Mange ser behovet for å komme i gang med logging og...

Les mer
AI har kommet for å bli – er din bedrift klar?

AI har kommet for å bli – er din bedrift klar?

Kunstig intelligens (AI) er et begrep som har vært på alles lepper helt siden ChatGPT ble lansert. De fleste vi kjenner har på forskjellige vis...

Les mer
RAG og AI Act: Slik bygger du lovlige AI-løsninger basert på egne data

RAG og AI Act: Slik bygger du lovlige AI-løsninger basert på egne data

Visste du at EU gjennom AI Act forbyr virksomheter å bruke ChatGPT i mange AI-løsninger? I denne artikkelen får du en kortfattet forklaring på...

Les mer
Generativ AI: Mixtral viser hvordan neste-generasjons AI kan kjøre på mobilen

Generativ AI: Mixtral viser hvordan neste-generasjons AI kan kjøre på mobilen

Franske Mistral demonstrerer at de kan konkurrere med giganter som GPT-4 og Gemini, og at det er mulig å lage langt mer effektive språkmodeller som...

Les mer
Verdifull innsikt med prescriptive dataanalyse

Verdifull innsikt med prescriptive dataanalyse

BI konsulent Elsa Bjerregaard gir en rask oversikt over muligheter med Prescriptive Analytics. “Data is the new oil” har blitt nevnt gjentatte...

Les mer
UiO: Livsviktig deling av forskningsdata

UiO: Livsviktig deling av forskningsdata

Deling av forskningsdata er avgjørende for åpen forskning. Det kan også spare samfunnet for verdifull tid – og i ytterste konsekvens bidra til å...

Les mer