Logo von nextlevels
Hey!
Zurück zum Wiki

Fine-Tuning

Fine-Tuning (deutsch: Feinabstimmung oder Nachtrainieren) bezeichnet im Bereich der künstlichen Intelligenz das gezielte Weitertrainieren eines bereits vortrainierten Modells – etwa eines großen Sprachmodells (LLM) – mit zusätzlichen, spezialisierten Daten. Das Ausgangsmodell hat in einem aufwendigen, teuren Vortraining bereits allgemeine Fähigkeiten erworben (Sprache, Wissen, Schlussfolgern). Beim Fine-Tuning wird dieses Modell mit einem vergleichsweise kleinen, kuratierten Datensatz weiter angepasst, sodass es eine bestimmte Aufgabe besser erfüllt, einen gewünschten Tonfall trifft oder das Fachvokabular einer Branche beherrscht. Man baut also nicht bei null an, sondern verfeinert ein vorhandenes Fundament.

Wie Fine-Tuning funktioniert

Beim Fine-Tuning werden die internen Parameter (Gewichte) des Modells anhand der neuen Beispieldaten angepasst. Typischerweise besteht der Trainingsdatensatz aus Paaren von Eingabe und gewünschter Ausgabe – etwa Kundenanfragen und idealen Antworten. Das Modell lernt aus diesen Beispielen, sein Verhalten in die gewünschte Richtung zu verschieben. Weil ein vollständiges Nachtrainieren aller Milliarden Parameter sehr rechenintensiv ist, haben sich ressourcenschonende Verfahren etabliert, allen voran LoRA (Low-Rank Adaptation) und verwandte Methoden des „Parameter-Efficient Fine-Tuning“. Dabei wird nur ein kleiner Teil zusätzlicher Parameter trainiert, während das Grundmodell weitgehend eingefroren bleibt – das senkt Kosten und Rechenbedarf erheblich.

Abgrenzung: Embeddings

Embeddings sind etwas grundsätzlich anderes als Fine-Tuning und werden häufig damit verwechselt. Ein Embedding ist eine numerische Repräsentation – ein Vektor aus vielen Zahlen –, die die Bedeutung eines Textes, Bildes oder Produkts in einem mathematischen Raum abbildet. Inhalte mit ähnlicher Bedeutung liegen in diesem Raum nah beieinander. Embeddings verändern das Modell nicht; sie sind das Werkzeug, um Ähnlichkeit und Bedeutung messbar zu machen. Genutzt werden sie etwa für semantische Suche, Empfehlungen und – besonders wichtig – für Retrieval Augmented Generation (RAG), bei der ein Modell zur Laufzeit relevante Dokumente abruft und in seine Antwort einbezieht, ohne neu trainiert zu werden.

Fine-Tuning, RAG oder Prompting – wann was?

Eine der häufigsten praktischen Fragen lautet: Soll man ein Modell feinabstimmen, ein RAG-System bauen oder es einfach geschickt instruieren (Prompting)? Die drei Ansätze lösen unterschiedliche Probleme:

AnsatzEignet sich fürÄndert das Modell?
PromptingSchnelle Anpassung von Verhalten und Format ohne AufwandNein
RAG / EmbeddingsAktuelles, faktisches Domänenwissen einbinden (z. B. eigener Produktkatalog)Nein
Fine-TuningStil, Tonfall, Format, spezialisiertes Verhalten konsistent verankernJa

Eine wichtige Faustregel: Fine-Tuning ist gut darin, dem Modell ein bestimmtes Verhalten oder einen Stil beizubringen, aber schlecht darin, ihm aktuelles Faktenwissen zuzuführen. Wer einem Modell den eigenen, sich ändernden Produktkatalog „beibringen“ will, ist mit RAG fast immer besser bedient – dort liegen die Fakten in einer durchsuchbaren Wissensbasis und lassen sich aktualisieren, ohne das Modell neu zu trainieren. Fine-Tuning lohnt sich, wenn ein konsistenter Stil, ein festes Antwortformat oder ein spezialisiertes Verhalten gefragt ist, das sich per Prompt nicht zuverlässig erreichen lässt.

Ein konkretes Beispiel

Ein Händler möchte einen KI-Kundenservice, der erstens im markeneigenen, freundlich-knappen Ton antwortet und zweitens stets das aktuelle Sortiment und die Lieferzeiten kennt. Die richtige Lösung kombiniert beide Welten: Der Tonfall und das Antwortformat werden per Fine-Tuning (oder oft schon per gutem Prompting) verankert; das aktuelle Produkt- und Lieferwissen kommt über RAG aus einer ständig aktualisierten Wissensbasis. Würde man versuchen, das Sortiment per Fine-Tuning ins Modell zu „brennen“, wäre es schon beim nächsten Sortimentswechsel veraltet – ein klassischer und teurer Fehler.

Kosten, Risiken und Grenzen

Fine-Tuning ist kein Selbstläufer. Es braucht einen qualitativ hochwertigen, repräsentativen Trainingsdatensatz – schlechte Daten führen zu schlechtem Verhalten. Es besteht das Risiko des „Catastrophic Forgetting“, bei dem das Modell durch das Nachtrainieren allgemeine Fähigkeiten verliert. Zudem entstehen Kosten für Training, Versionierung und erneutes Feinabstimmen, wenn sich Anforderungen ändern. Und ein feinabgestimmtes Modell muss gewartet werden: Erscheint ein besseres Basismodell, steht die Arbeit unter Umständen erneut an. Aus diesen Gründen gilt die pragmatische Reihenfolge: erst Prompting, dann RAG, und Fine-Tuning erst, wenn beides nicht ausreicht.

Häufige Missverständnisse

Erstens: Fine-Tuning ist nicht der Standardweg, um einem Modell „eigene Daten“ zu geben – dafür ist RAG meist geeigneter. Zweitens: Fine-Tuning macht ein Modell nicht generell „intelligenter“, sondern spezialisierter; es kann an einer Stelle besser und an anderer schlechter werden. Drittens werden Embeddings und Fine-Tuning oft in einen Topf geworfen, obwohl sie völlig verschiedene Dinge tun – Embeddings messen Bedeutung, Fine-Tuning verändert das Modell. Viertens: Mehr Trainingsdaten sind nicht automatisch besser; Qualität und Passung schlagen Menge.

Ausblick

Mit immer fähigeren Basismodellen und größeren Kontextfenstern verschiebt sich die Grenze: Vieles, wofür früher Fine-Tuning nötig war, lässt sich heute per gutem Prompting oder RAG lösen. Gleichzeitig machen effiziente Verfahren wie LoRA das Fine-Tuning günstiger und zugänglicher. Für die meisten Unternehmen bleibt die Empfehlung, mit den leichteren Werkzeugen zu beginnen und Fine-Tuning gezielt dort einzusetzen, wo ein konsistentes, spezialisiertes Verhalten echten Mehrwert bringt. Eine technische Einordnung des Begriffs bietet der englische Wikipedia-Artikel zu Fine-Tuning im Deep Learning.

FAQ

Was ist Fine-Tuning einfach erklärt?
Das Nachtrainieren eines fertigen KI-Modells mit eigenen, spezialisierten Beispieldaten, damit es eine bestimmte Aufgabe oder einen Stil besser beherrscht.

Was ist der Unterschied zwischen Fine-Tuning und Embeddings?
Fine-Tuning verändert das Modell selbst. Embeddings sind numerische Bedeutungsrepräsentationen, die das Modell nicht verändern, sondern Ähnlichkeit messbar machen – etwa für Suche und RAG.

Sollte ich Fine-Tuning oder RAG nutzen?
Für aktuelles Faktenwissen (z. B. den eigenen Produktkatalog) meist RAG. Für konsistenten Stil, Tonfall oder festes Verhalten Fine-Tuning. Häufig ist eine Kombination ideal.

Was ist LoRA?
LoRA (Low-Rank Adaptation) ist ein ressourcenschonendes Fine-Tuning-Verfahren, das nur wenige zusätzliche Parameter trainiert und das Grundmodell weitgehend unverändert lässt – das spart Rechenleistung und Kosten.

Weiterführende Artikel