IBMs släpper öppen källkod Granite 4.0 Nano – kompakt LLM för laptop computer och mobil

IBM släpper fyra nya kompakta AI-modeller (350 miljoner – 1,5 miljarder parametrar) som kan köras lokalt.
Modellerna fungerar på vanliga laptops, mobiler och i webbläsaren utan molntjänster.
Släpps below Apache 2.0-licens.

Det är överraskande att IBM har tagit ett modigt steg mot mer tillgänglig AI genom att släppa Granite 4.0 Nano som öppen källkod, En familj av fyra kompakta språkmodeller som faktiskt kan köras på din laptop computer eller telefon.

Granite 4.0 modellerna:

Granite-4.0-H-1B
Granite-4.0-H-350M
Granite-4.0-1B
Granite-4.0-350M – Transformer-based variant

Dessa modeller är små nog att köra direkt i din webbläsare utan att behöva ladda upp information until molnet. Du kan testa dem redan nu på IBMs Granite Playground.

Prestanda som överraskar

Modellerna presterar bra på Qualcomms senaste NPU:er når Granite-4.0-Micro 36,4 tokens per sekund på X2 Elite-datorer och 28,7 tokens per sekund på smartphones med Snapdragon 8 Elite Gen 5.

En 3 miljarders parametermodell med 128K token context size behöver bara 4 GB minne kanske tillräckligt litet för att köras på en Raspberry Pi.

Så här kommer du igång

Vill du testa Granite 4.0 Nano? Det finns flera sätt att komma igång. Du kan köra modellerna lokalt på din laptop computer, mobil eller until och med direkt i webbläsaren med WebGPU-acceleration.

IBMs Granite Playground: https://www.ibm.com/granite/playground

Granite WebGPU HuggingFace: https://huggingface.co/spaces/ibm-granite/Granite-4.0-Nano-WebGPU

För utvecklare finns modellerna tillgängliga på Hugging Face, Docker och IBMs egen watsonx.ai plattform. Alla modeller är öppen källkod med Apache 2.0-licens, vilket betyder att du fritt kan använda och modifiera dem.