Enterprise TensorFlow - Eine TensorFlow Session in Java ausführen

Eine TensorFlow Session wird in Java genauso ausgeführt wie in Python. Dieser Post zeigt wie.

Im vorigen Post wurde gezeigt was nötig ist, um ein TensorFlow SavedModel in Java zu laden. Jetzt ist es an der Zeit, Ergebnisse mit dem Modell zu erzeugen. Zum Glück ist das Vorgehen auf der JVM hier genau das gleiche wie bei Low-Level-TensorFlow in Python. Alles, was wir tun müssen, ist, die Knoten zu identifizieren, die die Ein- und Ausgabe unseres Computing-Graphen definieren, Daten in Tensoren zu verpacken und in einer Session die Berechnung durchzuführen.

Wie bei den vorherigen Beiträgen ist der komplette Code auf github zu finden.

Das Ausführen einer TensorFlow-Session in Java erfordert die folgenden Schritte:

Eingabedaten in Tensorobjekte verpacken, mit statischen Helfern der Tensors-Klasse.
Session-Objekt holen
Erstellen eines Runner-Objekts für die Sitzung
Eingangs-Tensoren mit Runner.feed den richtigen Knoten im Graphen zuordnen
Definieren der Ausgabe, die mit Runner.fetch zurückgegeben werden soll.
Ausführen der Berechnung mit Runner.run
Entpacken der Ergebnis Tensoren mit einer der Utility-Methoden der Tensors-Klasse oder einem copyTo-Aufruf.
Nicht vergessen, alle Resourcen (Tensorobjekte) zu schließen.

Das sieht vielleicht ziemlich beängstigend aus, ist aber in der Praxis sehr einfach, dank einer gut dokumentierten API, vielen Hilfsfunktionen und einem netten fluent-Interface.

Daten in `org.tensorflow.Tensor`-Objekte einpacken

Die Tensor-Klasse ist die wichtigste Klasse beim Einsatz des TensorFlow Java Wrappers. Sie wird verwendet, um Daten zu verpacken und zu entpacken, um sie der TensorFlow-Engine zuzuführen und Ergebnisse zu erhalten. Der komplizierteste Teil der Ausführung unseres Modells in Java ist das korrekte Ein- und Auspacken unserer Daten. Zum Glück, sind im Fehlerfall die daraus resultierenden Fehlermeldungen sehr aussagekräftig und ausführlich, so dass dies normalerweise ein einfacher Job ist.

In 99% aller Anwendungsfälle reicht einfach eine der Hilfsmethoden in der Tensors-Klasse, um einen Tensor mit der richtigen Form, dem richtigen Datentyp und dem richtigen Inhalt zu erstellen. Hier ist ein Beispiel für das verpacken eines einzelnen Input-Fließkommawertes:

final Tensor<Float> t = Tensors.create(f);

Es gibt Hilfsmethoden für alle Datentypen und bis zu sechs Dimensionen, daher sollten dort alles zu finden sein, was man braucht. Wie wir später sehen werden, ist es dennoch sinnvoll, das erzeugen von Tensor-Objekten in r-Erstellungen in eigene Funktionsaufrufe zu packen, um das Ressourcenhandling ein wenig zu vereinfachen - es muss sichergestellt werden .close() auf allen erstellten Tensoren aufgerufen wird!

In sehr, sehr seltenen Fällen müssen Sie auf die Tensor-Klasse selbst zurückgreifen - so können Sie einen Tensor jeder beliebigen Form erstellen. Der Vollständigkeit halber sei hier ein Beispiel für das manuelle Verpacken eines float in einen Tensor genannt (Finger weg von dieser Methode, es sei denn, es ist unbedingt nötig):

final Tensor<Float> t = Tensor.create(
    new long[] {1}, // the shape
    FloatBuffer.wrap(new float[] {f}) // the data
);

Ausführen einer Sitzung und Output der Ergebnisse

Wie in der Python Low-Level-API wird ein Modell in einer Sitzung ausgeführt. Um ein Handle auf ein Session-Objekt zu bekommen, rufen wir einfach die Methode SavedModelBundle.session() auf. Das Session-Objekt wird wiederum verwendet, um einen Runner zu erhalten. Der Runner bietet eine fluent API, die verwendet wird, um Tensoren an Knoten im Graphen mit Runner.feed zu binden und zu definieren, welche Tensoren nach der Berechnung mit Runner.fetch zurückgegeben werden sollen. Die fluent API funktioniert wie ein Builder, jeder Aufruf gibt wieder den Runner zurück, so dass wir Aufrufe verketten können. Wenn alles verkabelt ist, rufen wir Runner.run() auf, um die Berechnung durchzuführen und das Ergebnis zurückzugeben. Das Ergebnis ist eine Liste von Tensoren, die Anzahl der Elemente in der Liste hängt von der Anzahl der Runner.fetch-Aufrufe ab, jeder Aufruf erzeugt einen zusätzlichen Listeneintrag. Dies ist ein vollständiges Beispiel, das alle Aufrufe zu einer langen Anweisung verkettet:

final Tensor<?> result = 
    // gets the session
    bundle.session() 
    // creates a runner
    .runner() 
    // binds tensors to input nodes in the graph, in our case 
    // `values` is an array of floats, toTensor creates a Tensor
    // object, the first argument is a string with the name of 
    // the input node
    .feed("wine_type"           , toTensor(values[1], tensorsToClose))
    .feed("fixed_acidity"       , toTensor(values[2], tensorsToClose))
    .feed("volatile_acidity"    , toTensor(values[3], tensorsToClose))
    .feed("citric_acid"         , toTensor(values[4], tensorsToClose))
    .feed("residual_sugar"      , toTensor(values[5], tensorsToClose))
    .feed("chlorides"           , toTensor(values[6], tensorsToClose))
    .feed("free_sulfur_dioxide" , toTensor(values[7], tensorsToClose))
    .feed("total_sulfur_dioxide", toTensor(values[8], tensorsToClose))
    .feed("density"             , toTensor(values[9], tensorsToClose))
    .feed("ph"                  , toTensor(values[10], tensorsToClose))
    .feed("sulphates"           , toTensor(values[11], tensorsToClose))
    .feed("alcohol"             , toTensor(values[12], tensorsToClose))
    // define which output tensor to return
    // (you can chain multiple `fetch` calls to 
    // return more then one tensor)
    .fetch("dnn/head/logits:0")
    // execute the runner - this returns a list
    .run()
    // We have only one fetch call, so we get a 
    // one-element-list. The `get(0)` call fetches
    // the first element of the list
    .get(0);

Auspacken der resultierenden Tensoren

Was jetzt noch bleibt, ist, das Ergebnis aus dem Tensor zu holen, der vom run()-Aufruf zurückgegeben wird. Wenn der Ergebnis-Tensor nur ein Skalar ist, kann dafür einfach Tensor.floatValue(), Tensor.booleanValue() usw. aufgerufen werden. Wenn der resultierende Tensor kein Skalar ist, müssen die resultierenden Daten mit Tensor.copyTo(U destination) abgerufen werden, wobei destination ein multidimensionales Array ist. Eine vorgefertigte Regression mit neuronalen Netzen gibt beispielsweise immer einen zweidimensionalen Tensor zurück, auch wenn en nur ein einziges numerisches Ergebnis gibt. In diesem Fall kommt man wie folgt an das Ergebnis:

float[][] resultValues = (float[][]) result.copyTo(new float[1][1]);
float prediction = resultValues[0][0];

Der Type und die Anzahl der Dimensionen des Arrays hängen vom jeweiligen Modell ab.

Ressourcenverwaltung

Zwei Arten von Objekten müssen manuell geschlossen werden: Sessions und Tensoren. Beachten Sie, dass alle Tensor-Objekte - ob manuell erstellt oder aus einer laufenden Sitzung zurückgegeben - manuell geschlossen werden müssen. Ich ziehe es vor, dies zu tun, indem ich Tensor-Erzeuging immer in einer Hilfsfunktion ausführe, die alle erstellten Tensoren in einer Collection sammelt um dann alles in einem finally Block freizugeben, wenn ich fertig bin:

private static Tensor<Float> toTensor(final float f, 
        final Collection<Tensor<?>> tensorsToClose) 
{
    final Tensor<Float> t = Tensors.create(f);
    if (tensorsToClose != null) {
        tensorsToClose.add(t);
    }
    return t;
}       

private static void closeTensors(final Collection<Tensor<?>> ts) {      
    for (final Tensor<?> t : ts) {
        try {
            t.close();
        } catch (final Exception e) {
            // TODO: decide on the error handling best fitting your use case here
            // In most cases logging is the only useful thing left to do
            System.err.println("Error closing Tensor.");
            e.printStackTrace();
        }
    }
    ts.clear();
}

private void runSession(final float foo, /* more params here */) {
    final List<Tensor<?>> tensorsToClose = new ArrayList<Tensor<?>>(); 
    try {            
        // run session
        final List<Tensor<?>> result = bundle.session().runner()
            .feed("foo", toTensor(foo, tensorsToClose))
            // ... feed more tensors as necessary ...
            .fetch("some_node")
            // ... fetch more tensors as necessary ...
            .run(); 
        // mark result for cleanup
        tensorsToClose.addAddAll(result);
        // ... do something with the result ...
    } finally {
        closeTensors(tensorsToClose);
    }
}

Hierbei muss man darauf achten, auf der Session _nicht _close()aufzurufen! Die Session wird einmalig für das SavedModelBundle erstellt, der session()Aufruf gibt eine bestehende Referenz zurück, keine neue Session. Die Session ist thread-safe, so dass sie überall wiederverwendet werden kann. Sie muss erst geschlossen werden, wenn keine weiteren Aufrufe mehr folgen. Daher sollten die Session nur am Ende des Programms oder beim Herunterfahren eines Servers beendet werden. Sie können dies einfach tun, indem Sie Ihr SavedModelBundle schließen, das alle mit dem SavedModel verbundenen Ressourcen freigibt. (Sie können sogar das Schließen der Sitzung auslassen, da das Ende Ihres JVM-Prozesses ohnehin alle damit verbundenen Ressourcen schließen sollte - ich hatte nie irgendwelche negativen Auswirkungen, aber tun Sie dies auf eigenes Risiko!)

Die richtigen Namen für Ein- und Ausgabeknoten bestimmen

Wenn Sie einen eigenen Estimator geschrieben haben, wissen Sie wahrscheinlich wie Ihre Ein- und Ausgabeknoten heißen und welche Form sie haben. Manchmal haben Sie jedoch einen vorgefertigten Estimator verwendet, bei dem Sie nicht wissen, wie die Ausgabeknoten aufgerufen werden, oder Sie haben das Modell nicht selbst geschrieben und müssen die gespeicherten Daten überprüfen, um zu wissen, was Sie aufrufen sollen. In diesem Fall müssen Sie Ihr SavedModel auf der Kommandozeile überprüfen, um Ihr Tag, Ihre Ein- und Ausgabeknotennamen, deren Formen und Datentypen zu bestimmen. Dies kann durch aufeinanderfolgende Aufrufe des saved_model_cli geschehen (wir verwenden hier das SavedModel aus unserem Beispielprojekt, Ihre Ausgabe hängt natürlich vom verwendeten Modell ab):

chris$ ~/Library/Python/3.6/bin/saved_model_cli show \ 
--dir saved_models/1512127459/
The given SavedModel contains the following tag- sets:
serve

chris$ ~/Library/Python/3.6/bin/saved_model_cli show \
--dir saved_models/1512127459/ \
--tag_set serve
The given SavedModel MetaGraphDef contains
SignatureDefs with the following keys:
SignatureDef key: "predict"

chris$ ~/Library/Python/3.6/bin/saved_model_cli show\
--dir saved_models/1512127459/ \
--tag_set serve \
--signature_def predict
The given SavedModel SignatureDef contains the following input(s):
inputs['wine_type'] tensor_info:
dtype: DT_FLOAT
shape: (-1)
name: wine_type:0
...
The given SavedModel SignatureDef contains the
following output(s):
outputs['predictions'] tensor_info:
dtype: DT_FLOAT
shape: (-1, 1)
name: dnn/head/logits:0
Method name is: tensorflow/serving/predict

Wie Sie sehen können, benötigen wir aufeinanderfolgende Aufrufe von saved_model_cli show, um tiefer in unserem SavedModel vorzudringen, um die Namen, Formen und Datentypen der Ein- und Ausgangstensoren zu bestimmen. Leider können diese Informationen nicht generisch mit der Java-API (AFAIK) abgerufen werden. Die Art und Form des Ergebnis-Tensors zumindest kann aber auch durch Aufrufe von Tensor.shape() und Tensor.dataType() überprüft werden.

Zusammenfassung

Eine TensorFlow-Sitzung in Java auszuführen ist ziemlich einfach. Hier noch einmal eine Checkliste:

SavedModelBundle und die zugehörige Session sind thread-safe, Tensoren nicht
Verwenden Sie das saved_model_cli, um die Namen und die Form Ihrer Ein- und Ausgabeknoten zu bestimmen.
Verpacken Sie Ihre Eingabedaten mit den Hilfsmethoden in der Klasse Tensors
Verwenden Sie die fluent-API des SavedModelBundleBundle, um eine Session zu erhalten und auszuführen: bundle.session().runner().feed(...).fetch(...).run()
Für skalare Ergebnisse: Verwenden Sie Tensor.floatValue() usw., um Daten aus den resultierenden Tensoren zu holen.
Für nicht skalare Ergebnisse: Verwenden Sie den richtigen Array-Typ und die richtige Form, um Daten aus Ihren resultierenden Tensoren mit Tensor.copyTo() zu holen.
Schließen Sie das SavedModelBundle erst dann, wenn Sie Ihre JVM beenden möchten, z.B. beim Herunterfahren des Servers.

25 Feb. 2025
Arbeiten mit Ollama, Teil 2
Im ersten Teil unseres Artikels über Ollama haben wir gezeigt, wie man Ollama und zugehörige Modelle installiert. Im zweiten Teil des Artikels wird die fortgeschrittene Nutzung von Ollama durch Anpassung von Modelfiles und die Integration mit dem Frontend AnythingLLM behandelt. Es wird gezeigt, wie diese Tools die Verwaltung und Nutzung von KI-Modellen effizienter gestalten.
weiterlesen
24 Feb. 2025
Arbeiten mit Ollama, Teil 1
Im ersten Teil unseres Zweiteilers “Arbeiten mit Ollama” geben wir eine Einführung in die quelloffene Multi-Plattform-Lösung Ollama, die die Nutzung und Verwaltung von KI-Modellen vereinfacht.
weiterlesen
08 Apr. 2024
Whisper 3 Large für JAVA
Für einen internen Produktprototyp haben wir OpenAIs Whisper 3 Modell von Huggingface getraced und per DJL unter JAVA nutzbar gemacht.
weiterlesen
14 Juni 2023
ChatGPT für Teams: Datenschutzkonforme Nutzung im Unternehmen
In der heutigen digitalen Geschäftswelt sind KI-gestützte Kommunikationsplattformen wie ChatGPT unverzichtbar, um beispielsweise komplexe Code-Fragen zu beantworten oder erstklassige Texte für Angebote zu erstellen. Doch gerade in Unternehmen, in denen sensible Kundendaten im Spiel sind, kann die Verwendung von ChatGPT zu einem Datenschutz-Dilemma führen. Obwohl ChatGPT eine Option bietet, um die Verwendung von Chatkonversationen für Trainingszwecke zu verhindern, gibt es damit gewisse Einschränkungen. Außerdem gibt es bisher (Stand: Juni 2023) keine Möglichkeit, mehrere Teammitglieder oder Benutzer über einen Firmenaccount zu verwalten. Jeder Nutzer muss sich einzeln registrieren und dazu eine eigene Email, Telefonnummer und Kreditkarte verwenden. Will man chatGPT+ nutzen, kann man z.B. nicht alle Nutzer über eine Kreditkarte bezahlen. Auch landen die einzelnen Rechnungen bei den einzelnen Nutzern. Ein organisatorischer und buchahlterischer Albtraum. Auch wir bei DIVISO haben uns mit dieser Problematik auseinandergesetzt und uns auf die Suche nach einer Lösung gemacht.
weiterlesen
25 Okt. 2021
Git als Verwaltungstool für Trainingsdaten und Experimente beim ML
Wir beginnen in diesem Teil der Artikelserie über MLOps mit Informationen, die den meisten von euch bekannt sein werden: Mit den Basics von Git. Um jedoch eine andere Sichtweise auf das bekannte Tool aufzuzeigen, bieten diese Grundlagen die Basis, um die Funktion und Vorteile von Git für das maschinelle Lernen (ML) und den Unterschied bei der Verwaltung von Trainingsdaten zu betonen.
weiterlesen
02 Aug. 2021
MLOps: Etablierung und Betrieb einer KI
Mit Machine Learning Operations (MLOps) stellen wir sicher, dass Daten durch regelmäßiges und automatisiertes Training effizient und strategisch in die unternehmerischen Abläufe eingebunden werden und somit zur Umsatzsteigerung beitragen. Die Herausforderung besteht darin, diese automatisierten Prozesse zu etablieren und instand zu halten.
weiterlesen
29 Juni 2020
NLP, NLU und NLG: KI und Text
Bisher haben wir bei unseren Praxisbeispielen für das Grundverständnis von KI in der Regel einen großen Bogen um die Bereiche Textverständnis und Texterzeugung durch ML gemacht. Aus gutem Grund haben wir uns in erster Linie auf zwei Arten von Problemen konzentriert: Die Klassifikation von Bildern und die Vorhersage von Zahlwerten.
weiterlesen
12 Mai 2020
Deep Java Learning Einführung - Teil 1: NDManager & NDArray
Nach unserer ersten Vorstellung von Amazons neuem Deep Learning Frameworks für Java, DJL, wollen wir nun in einer Reihe von Anfängerposts Schritt für Schritt die Grundlagen von Deep Learning unter Java mit DJL vorstellen. Hierbei soll es nicht um das schnelle Kopieren von Code Snippets, sondern um das wirkliche Verständnis des Frameworks und der Konzepte gehen.
weiterlesen
28 Apr. 2020
Amazon DJL – ein neues Deep Learning Framework für Java
Wer auf der JVM und insbesondere in Java mit neuronalen Netzen und Deep Learning experimentieren wollte, für die gab es bisher nur wenig Auswahl. Wer ausschließlich auf Java setzen wollte, kam bisher an DL4J nicht vorbei. Wenn es die JVM, aber nicht unbedingt Java sein muss, kommt auch noch das Scala Frontend von MXNet in Frage. Wen schließlich ein wenig Python nicht schreckt, die kann eine Hybrid Lösung aus TensorFlow und Java probieren, wie wir bereits in früheren Artikeln erläutert haben.
weiterlesen
06 März 2020
Arten von Künstlichen Neuronalen Netzen
In unserem Praxis-Beispiel haben wir zur Erkennung von handgeschriebenen Ziffern ein “feed-forward neural network” genutzt. Dieses ist die wohl einfachste Form eines NN. In der Praxis gibt es jedoch hunderte Arten von mathematischen Formeln, die über Addition und Multiplikation hinaus benutzt werden, um Schritte in einem Neuronalen Netz zu berechnen, viele verschiedene Arten, die Schichten anzuordnen, und viele mathematische Ansätze das Netz zu trainieren.
weiterlesen
06 März 2020
Die häufigsten Irrtümer über Neuronale Netze
KI und insbesondere Neuronale Netze und Deep Learning sind seit einigen Jahren das technologische Hype Thema. Da die Materie aber recht abstrakt ist – man könnte sagen, für die meisten ist es Neuland – wollen wir hier einige Irrtümer bereinigen, denen wir in unserer Arbeit häufiger begegnen.
weiterlesen
06 März 2020
Was sind Neuronale Netze und wie funktionieren sie?
Nachdem es in den letzten Beiträgen überwiegend um die Grundlagen der derzeitigen KI-Forschung ging und wir versucht haben, diese für Nicht-ITler verständlich zu beleuchten, wagen wir uns heute an das aktuell wohl „heißeste“ KI-Thema, die Neuronalen Netze (NN).
weiterlesen
22 Okt. 2019
Deep Fakes - Woran man Fake-Bilder erkennen kann
Eine (relativ) neue Art neuronaler Netze, sogenannte Generative Adversarial Networks (zu deutsch etwa ‚erzeugende gegnerische Netzwerke’) oder GANs, sind heutzutage in der Lage, täuschend echte Bilder von Menschen zu erzeugen, die es gar nicht gibt. Diese Fake Bilder sind auf den ersten Blick von echten Fotos nicht mehr zu unterscheiden – aber zum Glück auf den zweiten Blick schon.
weiterlesen
26 Juni 2019
Recap zur ML Konferenz 2019 in München
Am 17.06. war es wieder so weit: die halbjährlich stattfindende ML Conference startete mit einem Workshoptag, der allen Teilnehmerinnen durch gemeinsames Live-Coding einen verständlichen Einstieg in die Themen Machine Learning und Deep Learning erlaubte.
weiterlesen
24 Mai 2019
KI leicht erklärt - Teil 5: Überwachtes & unüberwachtes Lernen im ML
Im vorigen Artikel haben wir Grundbegriffe des Machine Learning (ML) kennengelernt und anhand eines einfachen aber praxisrelevanten Algorithmus’ nachvollzogen, wie das Training eines Machine Learning Modells abläuft. Als nächstes wollen wir uns nun die verschiedenen Arten des Machine Learning näher anschauen.
weiterlesen
14 Mai 2019
Fachtagung des BGL 2019 – Vortrag 'KI und Magie'
“Jede hinreichend fortgeschrittene Technologie ist von Magie nicht mehr zu unterscheiden.” - Arthur C. Clark Die JAX 2019 ist gerade erst vorbei, da steht Christoph auch schon für den nächsten Vortrag auf dem Podium. Auf der Fachtagung des Bundesverbandes der Photo-Großlaboratorien geht es in seinem Vortrag um “KI und Magie – Wie funktioniert Künstliche Intelligenz?”
weiterlesen
29 Apr. 2019
Jax 2019 Recap
Die JAX in Mainz rückt näher und auch Christoph ist wieder als Speaker mit an Bord. Dieses Jahr spricht er in seinen Vorträgen über Neuronale Netze und das TensorFlow-Training auf der JVM.
weiterlesen
24 Apr. 2019
KI leicht erklärt - Teil 4: Die Grundlagen des Machine Learning
Nachdem wir uns im vorigen Artikel damit beschäftigt haben, wie die klassische KI funktioniert, wollen wir diesmal einen Blick auf das Machine Learning (maschinelles Lernen, auch abgekürzt als ML) werfen.
weiterlesen
08 Apr. 2019
KI leicht erklärt - Teil 3: Methoden der klassischen KI
Im vorherigen Beitrag haben wir unsere anfängliche Definition von künstlicher Intelligenz um zwei Unterscheidungen erweitert: Unterschieden wird einerseits zwischen starker und schwacher KI (Terminator & Science Fiction vs. Status Quo), sowie zwischen klassischer KI und dem Machine Learning.
weiterlesen
21 März 2019
KI leicht erklärt - Teil 2: Klassische KI, Neuronale Netze und Deep Learning
Die Künstliche Intelligenz (KI) ist so alt wie die Informatik selbst. Rechnen, das Ziehen logischer Schlüsse, das Durchführen komplexer Anweisungen… all das war vor der Erfindung des Computers dem Menschen vorbehalten.
weiterlesen
07 März 2019
KI leicht erklärt - Teil 1: Was ist KI?
Was ist Künstliche Intelligenz? Oder vielmehr: Wie funktioniert eigentlich KI? Vom Haushaltshelfer bis zum Endzeitszenario - bei kaum einem Thema klaffen öffentliche Wahrnehmung, Forschungsstand und Realität so weit auseinander wie bei der KI.
weiterlesen
06 Aug. 2018
DL4J Workshop auf dem ML Summit in Berlin
Am 1. und 2. Oktober findet in Berlin der erste ML Summit statt. In 12 Worshops in drei parallelen Tracks vermitteln Experten Praxiswissen zu den Themen Applications for Business, Machine Learning Basics & Tools und Specialized Topics.
weiterlesen
23 Apr. 2018
JAX 2018 - Recap | Deeplearning4Java
Christoph hält auf der diesjährigen JAX in Mainz zwei Vorträge zum Thema maschinelles Lernen und Java.
weiterlesen
23 Jan. 2018
Enterprise TensorFlow 3 - Ein SavedModel in Java laden
Teil in der Serie über Java / TensorFlow Interoperabilität, der zeigt, wie man ein TensorFlow SavedModel in Java lädt.
weiterlesen
23 Jan. 2018
Enterprise Tensorflow: Code Beispiele
Ein Überblick über die Beispielprojekte zum Thema TensorFlow / Java Integration
weiterlesen
22 Jan. 2018
Enterprise TensorFlow 2 - Wie man ein trainiertes Modell speichert
Teil 2 in der Serie über Java / TensorFlow Interoperabilität, in dem es darum geht ein Modell so zu speichern, dass es in anderen Umgebungen wiederverwendet werden kann.
weiterlesen
11 Jan. 2018
TensorFlow und Java - Ein Interview mit entwickler.de
Auf der ML Konferenz 2017 in Berlin ist unser CTO zum Thema TensorFlow / Java Interoperabilität interviewt worden.
weiterlesen
30 Nov. 2017
Enterprise Tensorflow Teil 1 - Python vs. Java
Dies ist der erste Teil einer Reihe von Posts über Java und Tensorflow Interop. Es ist eine ausführlichere Version meines Vortrags auf der ML Conference 2017 in Berlin.
weiterlesen
15 Nov. 2017
ML Konferenz 2017 in Berlin
Eine Ankündigung für meine Präsentation auf der ML Konferenz 2017 in Berlin
weiterlesen

Enterprise TensorFlow - Eine TensorFlow Session in Java ausführen

Daten in org.tensorflow.Tensor-Objekte einpacken

Ausführen einer Sitzung und Output der Ergebnisse

Auspacken der resultierenden Tensoren

Ressourcenverwaltung

Die richtigen Namen für Ein- und Ausgabeknoten bestimmen

Zusammenfassung

Arbeiten mit Ollama, Teil 2

Arbeiten mit Ollama, Teil 1

Whisper 3 Large für JAVA

ChatGPT für Teams: Datenschutzkonforme Nutzung im Unternehmen

Git als Verwaltungstool für Trainingsdaten und Experimente beim ML

MLOps: Etablierung und Betrieb einer KI

NLP, NLU und NLG: KI und Text

Deep Java Learning Einführung - Teil 1: NDManager & NDArray

Amazon DJL – ein neues Deep Learning Framework für Java

Arten von Künstlichen Neuronalen Netzen

Die häufigsten Irrtümer über Neuronale Netze

Was sind Neuronale Netze und wie funktionieren sie?

Deep Fakes - Woran man Fake-Bilder erkennen kann

Recap zur ML Konferenz 2019 in München

KI leicht erklärt - Teil 5: Überwachtes & unüberwachtes Lernen im ML

Fachtagung des BGL 2019 – Vortrag 'KI und Magie'

Jax 2019 Recap

KI leicht erklärt - Teil 4: Die Grundlagen des Machine Learning

KI leicht erklärt - Teil 3: Methoden der klassischen KI

KI leicht erklärt - Teil 2: Klassische KI, Neuronale Netze und Deep Learning

KI leicht erklärt - Teil 1: Was ist KI?

DL4J Workshop auf dem ML Summit in Berlin

JAX 2018 - Recap | Deeplearning4Java

Enterprise TensorFlow 3 - Ein SavedModel in Java laden

Enterprise Tensorflow: Code Beispiele

Enterprise TensorFlow 2 - Wie man ein trainiertes Modell speichert

TensorFlow und Java - Ein Interview mit entwickler.de

Enterprise Tensorflow Teil 1 - Python vs. Java

ML Konferenz 2017 in Berlin

Daten in `org.tensorflow.Tensor`-Objekte einpacken