Onderzoekers van ETH Zürich hebben een methode ontwikkeld die AI-antwoorden steeds betrouwbaarder maakt. Het selecteert specifiek data die relevant is voor de vraag, waardoor de onzekerheid van AI stukken kleiner wordt.
Bovendien behalen zelfs AI-modellen die tot 40 keer kleiner zijn dezelfde prestaties als de beste grote AI-modellen. Het nieuwe algoritme van ETH-onderzoekers verbetert grote taalmodellen (LLM’s) zodat de geselecteerde antwoorden nauwkeuriger en relevanter zijn. (Illustratie: AI gegenereerd/ ETH Zürich)
ChatGPT en vergelijkbare modellen geven helaas herhaaldelijk reden tot twijfel. Het grootste probleem met krachtige kunstmatige intelligentie is dat ze ons met hetzelfde gemak perfecte antwoorden en overduidelijke onzin geven. Een van de grootste uitdagingen ligt in hoe de grote taalmodellen (LLM’s) die ten grondslag liggen aan AI omgaan met onzekerheid.
Tot nu toe was het erg moeilijk om te beoordelen of LLM’s hun antwoorden baseren op een solide databasis of dat ze op onzekere basis opereren. Onderzoekers van het Institute for Machine Learning van de afdeling Computerwetenschappen aan de ETH Zürich hebben nu een methode waarmee de onzekerheid van AI stukken minder wordt.
Gebruikers kunnen bijvoorbeeld hun lokaal opgeslagen data invoeren in een groot taalmodel (LLM), zoals Llama. Het SIFT-algoritme (Selecting Informative data for Fine-Tuning), ontwikkeld door computerwetenschappers van ETH, kan de aanvullende data vervolgens gebruiken om specifieke informatie te selecteren die het meest relevant is voor de vraag.
Taalmodel verrijken met data uit relevant vakgebied
“Ons algoritme kan het algemene taalmodel van de AI verrijken met aanvullende gegevens uit het relevante vakgebied van een vraag. In combinatie met de specifieke vraag kunnen we vervolgens uit de diepte van het model en uit de verrijkingsdata precies die verbanden halen die de grootste kans hebben op een correct antwoord”, legt Jonas Hübotter van de Learning & Adaptive Systems Group uit, die de nieuwe methode ontwikkelde als onderdeel van zijn promotieonderzoek.
“De methode is met name geschikt voor bedrijven, wetenschappers of andere gebruikers die algemene AI willen gebruiken in een gespecialiseerd vakgebied dat slechts gedeeltelijk of helemaal niet wordt bestreken door de AI-trainingsdata”, voegt Andreas Krause, hoofd van de onderzoeksgroep en directeur van het ETH AI Centre, toe.
Tip:
- GenAI voorbij de hype: Nu versneller voor AI-innovatie?