3min Gadgets

Microsoft introduceert stilletjes Fara-7B: een nieuwe ‘agentische’ AI-agent die direct op je pc draait

Microsoft introduceert stilletjes Fara-7B: een nieuwe ‘agentische’ AI-agent die direct op je pc draait

Microsoft heeft zonder veel ruchtbaarheid Fara-7B geïntroduceerd, een compacte maar krachtige nieuwe agentic small language model (SLM) die direct op een computer kan draaien. Anders dan klassieke taalmodellen, die vooral worden gebruikt voor tekstuele interactie of zoekopdrachten, is Fara-7B ontworpen als een computer use agent (CUA). Het model kan taken op een computer volledig zelfstandig uitvoeren door de muis en het toetsenbord over te nemen, alsof er een menselijke gebruiker achter zit.

Fara-7B

Volgens Microsoft werkt Fara-7B door webpagina’s en interfaces visueel waar te nemen. Het scrollt, typt en klikt op voorspelde coördinaten, zonder hulp van aanvullende analysetools of toegankelijkheidsstructuren. Daarmee gebruikt het precies dezelfde zintuiglijke modaliteit als een mens wanneer het een taak uitvoert. Wat opvalt is de schaal: Fara-7B gebruikt slechts zeven miljard parameters, terwijl modellen zoals GPT-4o honderden miljarden parameters tellen. En toch weet dit kleine model in veel benchmarks grotere modellen te overtreffen.

SLM’s zoals Fara-7B worden gezien als een veelbelovende oplossing voor de energie- en complexiteitsproblemen van enorme AI-modellen. Doordat Fara-7B klein genoeg is om lokaal te draaien, kunnen CUA-taken met minimale vertraging en maximale privacy worden uitgevoerd. De gegevens van de gebruiker blijven immers op het apparaat.

Training met synthetische data

Een grote uitdaging bij het ontwikkelen van een CUA-model is het gebrek aan hoogwaardige data over menselijke computerinteractie. Handmatige annotatie is duur en tijdrovend: één taak kan tientallen stappen omvatten. Microsoft loste dit op door een synthetische datageneratie-pipeline te ontwikkelen, waarbij het model multi-step webtaken kreeg voorgeschoteld op basis van echte webpagina’s en gebruikersgedrag.

Deze nieuwe AI-agent werd uiteindelijk getraind op 145.000 interactietrajecten, samen goed voor één miljoen stappen. Daarnaast bevatte de dataset extra trainingsmateriaal voor bijvoorbeeld UI-lokalisatie, captioning en visuele vraag-en-antwoordtaken.

Experimenteren in een veilige omgeving

Hoewel Fara-7B indrukwekkende prestaties toont, inclusief betere resultaten dan GPT-4o op diverse benchmarks, benadrukt Microsoft dat het model nog experimenteel is. Gebruikers worden aangemoedigd om ermee te spelen, maar wel in een sandboxomgeving en niet met gevoelige gegevens. Het model heeft strikte beveiligingsmaatregelen en een hoge weigeringsgraad van 82 procent, conform Microsofts Responsible AI-richtlijnen.

Fara-7B is nu beschikbaar via Microsoft Foundry, Hugging Face en de Magentic-UI van Microsoft Research. Ook komt er een geoptimaliseerde versie voor Copilot+ pc’s, die direct op Windows 11 draait. Microsoft publiceert bovendien de open-weights van Fara-7B, zodat ontwikkelaars vrij kunnen experimenteren en bijdragen aan de verdere ontwikkeling van CUA-technologie.

Routinetaken

Volgens Microsoft moet Fara-7B de drempel verlagen om routinetaken, zoals formulieren invullen, reserveringen doen of informatie zoeken, te automatiseren. Een kleine AI-agent op de pc, maar met potentieel grote impact.