Die Qualität Ihres Fine-Tuning steht und fällt mit den Trainingsdaten. „Garbage in, garbage out" gilt hier mehr als irgendwo sonst. Gute Trainingsdaten sind der Unterschied zwischen einem nützlichen und einem nutzlosen Modell.
{"messages": [{"role": "system", "content": "Du bist ein Marken-Texter..."}, {"role": "user", "content": "Schreibe einen Produkttext für..."}, {"role": "assistant", "content": "Entdecke..."}]}
{"messages": [{"role": "system", "content": "Du bist ein Marken-Texter..."}, {"role": "user", "content": "Beschreibe unser neues..."}, {"role": "assistant", "content": "Innovation..."}]}
{"instruction": "Schreibe einen Produkttext", "input": "Produkt: Smart Watch X1", "output": "Die Smart Watch X1..."}
{"conversations": [{"from": "human", "value": "..."}, {"from": "gpt", "value": "..."}, {"from": "human", "value": "..."}, {"from": "gpt", "value": "..."}]}
| Kriterium | Beschreibung | Check |
|---|---|---|
| Korrektheit | Sind die Antworten inhaltlich richtig? | Expert Review |
| Konsistenz | Gleicher Stil und Ton in allen Beispielen? | Style Guide |
| Vielfalt | Decken die Beispiele verschiedene Szenarien ab? | Coverage Matrix |
| Relevanz | Passen die Beispiele zum Ziel-Use-Case? | Use-Case-Alignment |
| Länge | Entsprechen die Antworten der gewünschten Ausgabelänge? | Token-Count |
| Methode | Qualität | Kosten | Skalierung |
|---|---|---|---|
| Eigene Experten | Sehr hoch | Hoch | Niedrig |
| Annotation-Services (Scale AI, Toloka) | Hoch | Mittel | Hoch |
| LLM-gestützte Annotation | Mittel | Niedrig | Sehr hoch |
| Community/Crowdsourcing | Variabel | Niedrig | Hoch |
Best Practice: LLM-Vorschlag + Expert Review — die AI erstellt einen Entwurf, ein Mensch prüft und korrigiert.
| Ziel | Minimum | Empfohlen | Maximum |
|---|---|---|---|
| Stil-Anpassung | 50 Beispiele | 200–500 | 1.000 |
| Task-Spezialisierung | 100 Beispiele | 500–2.000 | 10.000 |
| Domain-Training | 500 Beispiele | 2.000–10.000 | 100.000+ |
Praxis-Tipp: Starten Sie mit 100 hochwertigen Beispielen. Trainieren, evaluieren, dann gezielt ergänzen. 100 perfekte Beispiele schlagen 10.000 mittelmäßige.