OnDemandModelle
OnDemandModelle bezeichnet ein Konzept im Bereich der Künstlichen Intelligenz und Softwareentwicklung, das die Erstellung, Bereitstellung und Verwaltung von Machine-Learning-Modellen nach Bedarf ermöglicht, um schwankende Arbeitslasten effizient zu bewältigen. Modelle können in der Cloud, lokal oder am Edge betrieben werden, und Ressourcen werden dynamisch skaliert. Die Abrechnung erfolgt häufig nutzungsbasiert.
Wesentliche Merkmale sind dynamische Skalierung, nutzungsbasierte Abrechnung, Versionierung, Governance und Sicherheit. Weitere Kriterien umfassen Datenschutz, Reproduzierbarkeit
Architektur: Ein OnDemand-Modelle-Stack umfasst Modell-Register, Orchestrierung, Inferenzdienste, Datenpipelines, Monitoring und Abrechnung. Nutzende können Trigger setzen (z.
Anwendungsfälle: Echtzeit-Personalisierung, Betrugserkennung, Kundensupport-Chats, Bild- und Spracherkennung auf Mobil- oder Edge-Geräten sowie medizinische Entscheidungsunterstützung, jeweils mit
Vorteile sind Kosten- und Ressourcen-Effizienz, schnelle Bereitstellung und maßgeschneiderte Modelle je Anwendungsfall. Herausforderungen betreffen Latenz bei
Im Forschungs- und Industriekontext gilt OnDemandModelle als Teil von MLOps-Strategien, die Automatisierung, Reproduzierbarkeit und Governance stärken.
Siehe auch: Maschinelles Lernen, Modellserving, MLOps, Edge Computing.