Was sind Neuronale Netze und wie funktionieren sie?

Nachdem es in den letzten Beiträgen überwiegend um die Grundlagen der derzeitigen KI-Forschung ging und wir versucht haben, diese für Nicht-ITler verständlich zu beleuchten, wagen wir uns heute an das aktuell wohl „heißeste“ KI-Thema, die Neuronalen Netze (NN).

Nimmt man es ganz genau, haben wir es auch hier nicht mit einer “Erfindung” der letzten Jahre zu tun, sondern mit einer Technik, die schon vor Jahrzehnten “erdacht” wurde, durch technologische Neuerungen (Rechenleistung, Verfügbarkeit von Daten u.ä.) aber erst vor rund 15 Jahren Fahrt aufnahm. Das aber nur am Rande, denn um das Thema “Neuronale Netze” ranken sich so viele Missverständnisse und Irrtümer, dass wir ihnen einen eigenen Beitrag widmen werden.

Was sind Neuronale Netze?

Was meinen wir aber, wenn wir von “Neuronalen Netzen” sprechen? Ganz formell spricht man eigentlich von „Künstlichen Neuronalen Netzen“ (KNN) oder auf Englisch auch „Artificial Neural Networks“ (ANN), denn: „Richtige“ neuronale Netze finden sich nur in höheren Lebewesen, nicht in Software oder Maschinen. In der Welt der IT werden die Begriffe aber wild durcheinander benutzt und bezeichnen alle in der Regel immer künstliche neuronale Netze. Meint man explizit „echte“ neuronale Netze in Lebewesen, spricht man dann oft der Klarheit halber von biologischen Neuronalen Netzen.

Neuerdings wird oft nicht mehr von Neuronalen Netzen, sondern von Deep Learning gesprochen. Das kommt daher, dass es die neuesten, tollen Ergebnisse nur dann erreicht werden, wenn man Neuronale Netze aus mehreren Schichten aufbaut, sie also „tief“ sind. Wenn man es also ganz genau nimmt, heißt Deep Learning „maschinelles Lernen mit künstlichen neuronalen Netzen aus mehreren Schichten“. Aber auch hier werden die Begriffe heutzutage synonym verwendet: Alle interessanten Neuronalen Netze sind ohnehin „tief“, so dass KNN und DL in der Praxis eigentlich das gleiche bezeichnen.

Künstliche neuronale Netze – Aufbau & Funktionsweise

Es gibt sehr viele verschiedene Arten von neuronalen Netzen (auch Architekturen genannt). Um eine Aufgabe zu lösen ist es oft sehr wichtig, genau die richtige Herangehensweise zu wählen. Oft bestehen komplexe Architekturen aus mehreren einfacheren Netzen, die dann auf die richtige Art und Weise kombiniert werden. Im Gegensatz zu unserem Gehirn, dass sich dynamisch blitzschnell an viele Aufgaben anpassen kann, sorgen schon kleinste Fehler dafür, das ein Neuronales Netz versagt und gar nichts lernt. Wählt man die falsche Architektur für eine Aufgabe, hat man meist keine Chance mehr auf gute Resultate.

Jede Architektur funktioniert natürlich anders, aber alle Neuronalen Netze haben dieselbe grundlegende Funktionsweise, die man am besten mit dem Klassiker unter den Neuronalen Netzen erläutert, dem „fully connected neural Network“ oder auch „feed-forward neural network“, manchmal auch etwas ungenau Multi-Layer-Perceptron genannt.

Die Funktionsweise des “Fully Connected Neural Network”

Die meisten anderen Beschreibungen von Neuronalen Netzen fangen nun mit einer biologisch nicht akkuraten Beschreibung von Neuronalen Netzen an und versuchen daran zu erklären, wie KNN in Computern funktionieren. Leider hinkt dieser Vergleich stark und birgt die große Gefahr, ein falsches Gefühl dieser Technik zu entwickeln. Daher lassen wir die biologische Inspiration außen vor und fangen gleich mit einem echten KNN an.

Ein KNN besteht in der Regel aus mehreren Schichten. Eine Schicht bekommt als Eingabe eine (manchmal sehr große) Zahlenkolonne (Vektor) und erzeugt eine neue Zahlenkolonne, die nur auf dieser Eingabe beruht. Diese neue Zahlenkolonne kann kürzer, länger oder gleich groß sein. Dabei führt jede Schicht meist nur sehr wenige Rechenoperation auf den Eingabezahlen aus (z.B. eine Multiplikation oder Addition).

Um eine Vorstellung zu bekommen, wie eine Schicht eines echten Künstlichen Neuronalen Netzes arbeitet, schauen wir uns nun das Fully Connected Neural Network an.

Die drei Schritte des “Fully Connected Neural Network”

Beim Fully Connected Neural Network folgen zum Beispiel nur drei Schritte abwechselnd immer wieder aufeinander:

1. Multiplikation mit Konstanten und Addition der Ergebnisse

2. Addition von Konstanten

3. und eine sogenannte Aktivierungsfunktion.

Alle drei Schritte hintereinander nennt man ein „Schicht“ des neuronalen Netzes. In jeder Schicht sind zusätzlich eine Menge von Zahlen abgespeichert, oft werden diese Zahlen „Gewichte“ genannt. Interessanterweise ist die Mathematik, mit der ein neuronales Netz seine Ergebnisse berechnet, enorm einfach. Eigentlich reicht dazu sogar Grundschulwissen.

Fangen wir an mit Schritt 1. Um einen einzigen Ausgabewert zu berechnen, wird jeder Eingabewert mit einer der in der Schicht gespeicherten Zahlen multipliziert. Die Ergebnisse dieser Multiplikationen werden aufaddiert. Wie oft das gemacht wird, hängt davon ab, wie viele neue Werte man möchte.
Nehmen wir an, wir möchten eine Schicht, in die man 768 Werte herein schicken und von der man 512 Resultate erhalten kann. Dann wird dieser Prozess 512-mal (für jede gewünschte Ausgabe) mit allen 768 Eingaben wiederholt, jedes mal mit anderen in der Schicht gespeicherten Zahlen. Das Netz muss in der Schicht für diesen Schritt also 512*768=393.216 Zahlen vorhalten.

Schritt 2 ist noch einfacher: Auf jedes Ergebnis des vorigen Schritts wird eine weitere, im Neuronalen Netz gespeicherte Zahl aufaddiert. Für diesen Schritt braucht es in unserem Beispiel also 512 weitere Zahlen in einer Schicht.

Schritt 3 wird sogar noch einfacher: Hierbei werden wieder die vorigen Ergebnisse genommen. Diesmal wird nur geschaut, ob das Ergebnis größer ist als null, wir brauchen also keine gespeicherten Zahlen aus dem Netz. Ist das Ergebnis größer als null, wird es einfach weitergeleitet. Ist es kleiner null, wird es durch null ersetzt. Das ist die Aktivierungsfunktion. Eindrucksvoller Name, wenig dahinter.

“Lernen” durch Wiederholung und Verbesserung

Dieser Drei-Schritte-Prozess des Fully Connected Neural Networks wird immer wieder wiederholt, bis alle Schichten des KNN durchlaufen sind. Aber wo kommen diese Zahlen her, mit denen multipliziert und addiert wird?

Im Gegensatz zur Struktur des Netzes (die Anzahl der Schichten, die Anzahl der Ein- und Ausgabewerte), sind diese nicht durch seine Programmierung definiert. Stattdessen werden sie initial mit Zufallszahlen belegt. Das bedeutet: ein frisch geschlüpftes neuronales Netz produziert nur Unsinn aus seiner Eingabe, indem es wild mit Zufallszahlen multipliziert und addiert.

Jetzt kommt das berüchtigte „Lernen“ ins Spiel. Dieses funktioniert genau wie in unserem Blogartikel “Die Grundlagen des Machine Learning” erläutert. Immer, wenn ein Neuronales Netz etwas lernen soll, braucht es eine Reihe von Eingaben, zusammen mit dem zu erzeugenden Ergebnis. Der beste Testdatensatz für Neuronale Netze ist hier der sogenannte MNIST-Datensatz. Hierbei handelt es sich um tausende schwarz-weißer Bilder von handgeschriebenen, einzelnen Ziffern (0 bis 9).

Bilderkennung von Zahlen 0-9 mit Hilfe von Neuronalen Netzen (MNIST-Datensatz)

Für jedes Bild ist bekannt, welche Ziffer darauf zu sehen ist. Die Bilder sind 28 mal 28 Pixel groß. Das neuronale Netz braucht alle Pixel zur Berechnung eines Ergebnisses, die erste Schicht muss also groß genug für 28*28=768 Eingaben sein.

Praxis-Beispiel eines Fully Connected Neural Networks

Wenn wir nun ein Fully Connected Neural Network darauf „trainieren“ wollen, einem Bild die richtige Ziffer zuzuordnen (sie, vermenschlicht gesagt, zu “erkennen”), müssen wir es zunächst sinnvoll aufsetzen. Stimmt das Set-Up, wird das Neuronale Netz sich nach und nach über die immer weiter bereinigten Abweichungen an das richtige Zuordnen der Bilder herantasten.

Das Neuronale Netz als Bilderkenner: Setup

I. Der Input bekommt so viele Werte, wie Pixel in einem der MNIS-Ziffern-Bilder sind (28*28=784). Wir geben also jedesmal alle Pixel auf einmal in das Neuronale Netz.

II. Nun schichten wir ca. fünf Schichten wie oben beschrieben aufeinander, also fünf mal die Schritte Multiplikation und Addition, Addition und Aktivierungsfunktion. Dabei ist die Ausgabe jeder Schicht immer kleiner als ihre Eingabe. (Das muss nicht bei jedem neuronalen Netz so sein, in diesem Fall funktioniert es aber gut).

III. Die letzte Schicht hat 10 Ausgabewerte, einen Wert für jede mögliche Ziffer, die es zu erkennen gilt. Dabei steht jeder Wert dafür, für wie ähnlich das Netz die Eingabe zu einer Ziffer hält. Hier sieht man sehr schön die „ungenaue“ Rechenweise eines Neuronalen Netzes. Es gibt nicht eine Ziffer aus, sondern benennt die Wahrscheinlichkeit für jedes Ergebnis. In der Praxis wählt man meist einfach die Antwort mit der höchsten Wahrscheinlichkeit, wenn man eine einzige Antwort möchte.

Bevor wir das Netz trainieren können, werden die ganzen Zahlen, die in jeder Schicht verwendet werden, mit Zufallszahlen gefüllt. Das klingt erstmal sinnlos, hat aber einen ganz praktischen Grund: Wir wissen ja nicht, wie das Netz die Aufgabe lösen soll – das soll es im nächsten Schritt selber lernen. Da wir selber keine Ahnung haben, wählen wir den Startpunkt des Lernvorgangs durch Zufallszahlen zufällig.

Training und “Backpropagation”

Nun haben wir den Aufbau des Netzes definiert. Man könnte das KNN nun sogar schon starten, allerdings wäre dies ziemlich nutzlos: Durch die Initialisierung mit Zufallszahlen ist das Ergebnis zunächst komplett wertlos. Dies ändert sich erst mit dem nächsten Schritt – dem Training.

Wir nehmen hierzu einen Teil der MNIST-Bilder (ca. 90%) und geben sie nacheinander in das Neuronale Netz. Dann schauen wir uns an, was herauskommt. Diesen Schritt nennt man auf Forward Pass, die Bilder laufen vorwärts durch das Netz. Wir vergleichen die zehn Ausgabewerte mit dem tatsächlichen Ergebnis. Für ein Bild mit einer 3 wäre das gewünschte, perfekte Ergebnis ja [0: 0%, 1: 0% , 2: 0%, 3: 100%, 4: 0%, 5: 0% … ]. Wir können nun durch einfaches Subtrahieren ausrechnen, wie falsch das Neuronale Netz für jeden Prozentwert liegt. Diese numerische Angabe der „Falschheit“ ist der Trick beim Trainieren von Neuronalen Netzen.

Der berechnete Fehler wird benutzt, um mit einem speziellen Algorithmus namens „Backpropagation“ die im neuronalen Netz gespeicherten Konstanten so zu ändern, dass das Ergebnis ein wenig besser wird. Dazu wird der Fehler über alle Schichten „aufgeteilt“ und die ganzen Konstanten werden ein klein wenig auf- oder abjustiert. Der Algorithmus bestimmt also mathematisch, welcher Teil des Netzes den schwersten Fehler verursacht hat und entsprechend gewichtet durch das Justieren “gegensteuern”. Dies ist der sogenannte Backward Pass, weil der Fehler rückwärts (von der Ausgabe zur Eingabe) durch das Netz fließt.

Beim nächsten Mal liegt das Netz dann etwas weniger daneben und das Ergebnis wird wiederholt. Das muss man eine ganze Weile machen. Bei einfachen Problemen wie den MNIST Bildern einige zehn- oder hundertausendmal. Bei schweren Problemen wie der Fußgängererkennung für ein selbstfahrendes Auto auch gerne einmal einige Milliarden Male. Man sieht hier sehr schön einen deutlichen qualitativen Unterschied zu unserem Gehirn: Der Mensch braucht viel, viel weniger Beispiele, um eine Aufgabe zu lernen.

Überprüfung des Trainings anhand der Testdaten

Ist der Fehler beim Training klein genug, hört man mit dem Trainieren auf. Dann kommen die letzten 10% der Daten (Testdaten) ins Spiel, die wir bisher nicht zum Training genutzt haben. Diese hat das Netz ja noch nie gesehen und konnte sie deshalb nicht „auswendig lernen“. Hiermit überprüfen wir, ob das Netz nun wirklich Ziffern erkennen kann. Ist das Netz in der Lage, auf eine für uns akzeptablen Menge von Bildern die richtige Antwort zu liefern, haben wir erfolgreich unser erstes Neuronales Netz trainiert.
Liegt es auf diesem sogenannten Test-Set gründlich daneben, obwohl der Fehler beim Training schön niedrig war, haben wir sogenanntes „Overfitting“. Das Netz hat nicht zu abstrahieren gelernt, sondern nur die Trainingsbilder auswendig gelernt. Wir haben irgendwo einen Fehler gemacht und müssen wieder von vorne anfangen.

25 Feb. 2025
Arbeiten mit Ollama, Teil 2
Im ersten Teil unseres Artikels über Ollama haben wir gezeigt, wie man Ollama und zugehörige Modelle installiert. Im zweiten Teil des Artikels wird die fortgeschrittene Nutzung von Ollama durch Anpassung von Modelfiles und die Integration mit dem Frontend AnythingLLM behandelt. Es wird gezeigt, wie diese Tools die Verwaltung und Nutzung von KI-Modellen effizienter gestalten.
weiterlesen
24 Feb. 2025
Arbeiten mit Ollama, Teil 1
Im ersten Teil unseres Zweiteilers “Arbeiten mit Ollama” geben wir eine Einführung in die quelloffene Multi-Plattform-Lösung Ollama, die die Nutzung und Verwaltung von KI-Modellen vereinfacht.
weiterlesen
08 Apr. 2024
Whisper 3 Large für JAVA
Für einen internen Produktprototyp haben wir OpenAIs Whisper 3 Modell von Huggingface getraced und per DJL unter JAVA nutzbar gemacht.
weiterlesen
14 Juni 2023
ChatGPT für Teams: Datenschutzkonforme Nutzung im Unternehmen
In der heutigen digitalen Geschäftswelt sind KI-gestützte Kommunikationsplattformen wie ChatGPT unverzichtbar, um beispielsweise komplexe Code-Fragen zu beantworten oder erstklassige Texte für Angebote zu erstellen. Doch gerade in Unternehmen, in denen sensible Kundendaten im Spiel sind, kann die Verwendung von ChatGPT zu einem Datenschutz-Dilemma führen. Obwohl ChatGPT eine Option bietet, um die Verwendung von Chatkonversationen für Trainingszwecke zu verhindern, gibt es damit gewisse Einschränkungen. Außerdem gibt es bisher (Stand: Juni 2023) keine Möglichkeit, mehrere Teammitglieder oder Benutzer über einen Firmenaccount zu verwalten. Jeder Nutzer muss sich einzeln registrieren und dazu eine eigene Email, Telefonnummer und Kreditkarte verwenden. Will man chatGPT+ nutzen, kann man z.B. nicht alle Nutzer über eine Kreditkarte bezahlen. Auch landen die einzelnen Rechnungen bei den einzelnen Nutzern. Ein organisatorischer und buchahlterischer Albtraum. Auch wir bei DIVISO haben uns mit dieser Problematik auseinandergesetzt und uns auf die Suche nach einer Lösung gemacht.
weiterlesen
25 Okt. 2021
Git als Verwaltungstool für Trainingsdaten und Experimente beim ML
Wir beginnen in diesem Teil der Artikelserie über MLOps mit Informationen, die den meisten von euch bekannt sein werden: Mit den Basics von Git. Um jedoch eine andere Sichtweise auf das bekannte Tool aufzuzeigen, bieten diese Grundlagen die Basis, um die Funktion und Vorteile von Git für das maschinelle Lernen (ML) und den Unterschied bei der Verwaltung von Trainingsdaten zu betonen.
weiterlesen
02 Aug. 2021
MLOps: Etablierung und Betrieb einer KI
Mit Machine Learning Operations (MLOps) stellen wir sicher, dass Daten durch regelmäßiges und automatisiertes Training effizient und strategisch in die unternehmerischen Abläufe eingebunden werden und somit zur Umsatzsteigerung beitragen. Die Herausforderung besteht darin, diese automatisierten Prozesse zu etablieren und instand zu halten.
weiterlesen
29 Juni 2020
NLP, NLU und NLG: KI und Text
Bisher haben wir bei unseren Praxisbeispielen für das Grundverständnis von KI in der Regel einen großen Bogen um die Bereiche Textverständnis und Texterzeugung durch ML gemacht. Aus gutem Grund haben wir uns in erster Linie auf zwei Arten von Problemen konzentriert: Die Klassifikation von Bildern und die Vorhersage von Zahlwerten.
weiterlesen
12 Mai 2020
Deep Java Learning Einführung - Teil 1: NDManager & NDArray
Nach unserer ersten Vorstellung von Amazons neuem Deep Learning Frameworks für Java, DJL, wollen wir nun in einer Reihe von Anfängerposts Schritt für Schritt die Grundlagen von Deep Learning unter Java mit DJL vorstellen. Hierbei soll es nicht um das schnelle Kopieren von Code Snippets, sondern um das wirkliche Verständnis des Frameworks und der Konzepte gehen.
weiterlesen
28 Apr. 2020
Amazon DJL – ein neues Deep Learning Framework für Java
Wer auf der JVM und insbesondere in Java mit neuronalen Netzen und Deep Learning experimentieren wollte, für die gab es bisher nur wenig Auswahl. Wer ausschließlich auf Java setzen wollte, kam bisher an DL4J nicht vorbei. Wenn es die JVM, aber nicht unbedingt Java sein muss, kommt auch noch das Scala Frontend von MXNet in Frage. Wen schließlich ein wenig Python nicht schreckt, die kann eine Hybrid Lösung aus TensorFlow und Java probieren, wie wir bereits in früheren Artikeln erläutert haben.
weiterlesen
06 März 2020
Arten von Künstlichen Neuronalen Netzen
In unserem Praxis-Beispiel haben wir zur Erkennung von handgeschriebenen Ziffern ein “feed-forward neural network” genutzt. Dieses ist die wohl einfachste Form eines NN. In der Praxis gibt es jedoch hunderte Arten von mathematischen Formeln, die über Addition und Multiplikation hinaus benutzt werden, um Schritte in einem Neuronalen Netz zu berechnen, viele verschiedene Arten, die Schichten anzuordnen, und viele mathematische Ansätze das Netz zu trainieren.
weiterlesen
06 März 2020
Die häufigsten Irrtümer über Neuronale Netze
KI und insbesondere Neuronale Netze und Deep Learning sind seit einigen Jahren das technologische Hype Thema. Da die Materie aber recht abstrakt ist – man könnte sagen, für die meisten ist es Neuland – wollen wir hier einige Irrtümer bereinigen, denen wir in unserer Arbeit häufiger begegnen.
weiterlesen
22 Okt. 2019
Deep Fakes - Woran man Fake-Bilder erkennen kann
Eine (relativ) neue Art neuronaler Netze, sogenannte Generative Adversarial Networks (zu deutsch etwa ‚erzeugende gegnerische Netzwerke’) oder GANs, sind heutzutage in der Lage, täuschend echte Bilder von Menschen zu erzeugen, die es gar nicht gibt. Diese Fake Bilder sind auf den ersten Blick von echten Fotos nicht mehr zu unterscheiden – aber zum Glück auf den zweiten Blick schon.
weiterlesen
26 Juni 2019
Recap zur ML Konferenz 2019 in München
Am 17.06. war es wieder so weit: die halbjährlich stattfindende ML Conference startete mit einem Workshoptag, der allen Teilnehmerinnen durch gemeinsames Live-Coding einen verständlichen Einstieg in die Themen Machine Learning und Deep Learning erlaubte.
weiterlesen
24 Mai 2019
KI leicht erklärt - Teil 5: Überwachtes & unüberwachtes Lernen im ML
Im vorigen Artikel haben wir Grundbegriffe des Machine Learning (ML) kennengelernt und anhand eines einfachen aber praxisrelevanten Algorithmus’ nachvollzogen, wie das Training eines Machine Learning Modells abläuft. Als nächstes wollen wir uns nun die verschiedenen Arten des Machine Learning näher anschauen.
weiterlesen
14 Mai 2019
Fachtagung des BGL 2019 – Vortrag 'KI und Magie'
“Jede hinreichend fortgeschrittene Technologie ist von Magie nicht mehr zu unterscheiden.” - Arthur C. Clark Die JAX 2019 ist gerade erst vorbei, da steht Christoph auch schon für den nächsten Vortrag auf dem Podium. Auf der Fachtagung des Bundesverbandes der Photo-Großlaboratorien geht es in seinem Vortrag um “KI und Magie – Wie funktioniert Künstliche Intelligenz?”
weiterlesen
29 Apr. 2019
Jax 2019 Recap
Die JAX in Mainz rückt näher und auch Christoph ist wieder als Speaker mit an Bord. Dieses Jahr spricht er in seinen Vorträgen über Neuronale Netze und das TensorFlow-Training auf der JVM.
weiterlesen
24 Apr. 2019
KI leicht erklärt - Teil 4: Die Grundlagen des Machine Learning
Nachdem wir uns im vorigen Artikel damit beschäftigt haben, wie die klassische KI funktioniert, wollen wir diesmal einen Blick auf das Machine Learning (maschinelles Lernen, auch abgekürzt als ML) werfen.
weiterlesen
08 Apr. 2019
KI leicht erklärt - Teil 3: Methoden der klassischen KI
Im vorherigen Beitrag haben wir unsere anfängliche Definition von künstlicher Intelligenz um zwei Unterscheidungen erweitert: Unterschieden wird einerseits zwischen starker und schwacher KI (Terminator & Science Fiction vs. Status Quo), sowie zwischen klassischer KI und dem Machine Learning.
weiterlesen
21 März 2019
KI leicht erklärt - Teil 2: Klassische KI, Neuronale Netze und Deep Learning
Die Künstliche Intelligenz (KI) ist so alt wie die Informatik selbst. Rechnen, das Ziehen logischer Schlüsse, das Durchführen komplexer Anweisungen… all das war vor der Erfindung des Computers dem Menschen vorbehalten.
weiterlesen
07 März 2019
KI leicht erklärt - Teil 1: Was ist KI?
Was ist Künstliche Intelligenz? Oder vielmehr: Wie funktioniert eigentlich KI? Vom Haushaltshelfer bis zum Endzeitszenario - bei kaum einem Thema klaffen öffentliche Wahrnehmung, Forschungsstand und Realität so weit auseinander wie bei der KI.
weiterlesen
06 Aug. 2018
DL4J Workshop auf dem ML Summit in Berlin
Am 1. und 2. Oktober findet in Berlin der erste ML Summit statt. In 12 Worshops in drei parallelen Tracks vermitteln Experten Praxiswissen zu den Themen Applications for Business, Machine Learning Basics & Tools und Specialized Topics.
weiterlesen
23 Apr. 2018
JAX 2018 - Recap | Deeplearning4Java
Christoph hält auf der diesjährigen JAX in Mainz zwei Vorträge zum Thema maschinelles Lernen und Java.
weiterlesen
29 Jan. 2018
Enterprise TensorFlow 4 - Eine TensorFlow Session in Java ausführen
Eine TensorFlow Session wird in Java genauso ausgeführt wie in Python. Dieser Post zeigt wie.
weiterlesen
23 Jan. 2018
Enterprise TensorFlow 3 - Ein SavedModel in Java laden
Teil in der Serie über Java / TensorFlow Interoperabilität, der zeigt, wie man ein TensorFlow SavedModel in Java lädt.
weiterlesen
23 Jan. 2018
Enterprise Tensorflow: Code Beispiele
Ein Überblick über die Beispielprojekte zum Thema TensorFlow / Java Integration
weiterlesen
22 Jan. 2018
Enterprise TensorFlow 2 - Wie man ein trainiertes Modell speichert
Teil 2 in der Serie über Java / TensorFlow Interoperabilität, in dem es darum geht ein Modell so zu speichern, dass es in anderen Umgebungen wiederverwendet werden kann.
weiterlesen
11 Jan. 2018
TensorFlow und Java - Ein Interview mit entwickler.de
Auf der ML Konferenz 2017 in Berlin ist unser CTO zum Thema TensorFlow / Java Interoperabilität interviewt worden.
weiterlesen
30 Nov. 2017
Enterprise Tensorflow Teil 1 - Python vs. Java
Dies ist der erste Teil einer Reihe von Posts über Java und Tensorflow Interop. Es ist eine ausführlichere Version meines Vortrags auf der ML Conference 2017 in Berlin.
weiterlesen
15 Nov. 2017
ML Konferenz 2017 in Berlin
Eine Ankündigung für meine Präsentation auf der ML Konferenz 2017 in Berlin
weiterlesen

Was sind Neuronale Netze und wie funktionieren sie?

Was sind Neuronale Netze?

Künstliche neuronale Netze – Aufbau & Funktionsweise

Die Funktionsweise des “Fully Connected Neural Network”

Die drei Schritte des “Fully Connected Neural Network”

“Lernen” durch Wiederholung und Verbesserung

Praxis-Beispiel eines Fully Connected Neural Networks

Das Neuronale Netz als Bilderkenner: Setup

Training und “Backpropagation”

Überprüfung des Trainings anhand der Testdaten

Arbeiten mit Ollama, Teil 2

Arbeiten mit Ollama, Teil 1

Whisper 3 Large für JAVA

ChatGPT für Teams: Datenschutzkonforme Nutzung im Unternehmen

Git als Verwaltungstool für Trainingsdaten und Experimente beim ML

MLOps: Etablierung und Betrieb einer KI

NLP, NLU und NLG: KI und Text

Deep Java Learning Einführung - Teil 1: NDManager & NDArray

Amazon DJL – ein neues Deep Learning Framework für Java

Arten von Künstlichen Neuronalen Netzen

Die häufigsten Irrtümer über Neuronale Netze

Deep Fakes - Woran man Fake-Bilder erkennen kann

Recap zur ML Konferenz 2019 in München

KI leicht erklärt - Teil 5: Überwachtes & unüberwachtes Lernen im ML

Fachtagung des BGL 2019 – Vortrag 'KI und Magie'

Jax 2019 Recap

KI leicht erklärt - Teil 4: Die Grundlagen des Machine Learning

KI leicht erklärt - Teil 3: Methoden der klassischen KI

KI leicht erklärt - Teil 2: Klassische KI, Neuronale Netze und Deep Learning

KI leicht erklärt - Teil 1: Was ist KI?

DL4J Workshop auf dem ML Summit in Berlin

JAX 2018 - Recap | Deeplearning4Java

Enterprise TensorFlow 4 - Eine TensorFlow Session in Java ausführen

Enterprise TensorFlow 3 - Ein SavedModel in Java laden

Enterprise Tensorflow: Code Beispiele

Enterprise TensorFlow 2 - Wie man ein trainiertes Modell speichert

TensorFlow und Java - Ein Interview mit entwickler.de

Enterprise Tensorflow Teil 1 - Python vs. Java

ML Konferenz 2017 in Berlin