Die Grundlagen des Machine Learning

Nachdem wir uns im vorigen Artikel damit beschäftigt haben, wie die klassische KI funktioniert, wollen wir diesmal einen Blick auf das Machine Learning (maschinelles Lernen, auch abgekürzt als ML) werfen.

Bei der klassischen KI wird versucht, ein Problem möglichst exakt zu zerlegen. Nur so können die vom Computer erlernten Antworten (sei es in Form des Entscheidungsbaumes oder einer Tabelle von hinterlegten Lösungen) greifen und das Programm die Aufgabe nachvollziehbar lösen lassen. Dies bedeutet aber auch, dass ein Algorithmus nur ein sehr spezifisches Problem lösen kann. Ändert sich das Problem, so muss der Algorithmus angepasst (oder neu geschrieben) werden.

Genau an diesem Punkt setzt das Machine Learning an. Ziel des Machine Learning ist es, den Computer das Problem Formulieren und Lösen zu lassen - ihn also in die Lage zu versetzen, auch den “unangenehmen Teil” des Justierens und Anpassens selbst zu übernehmen. Möglich ist dies, indem man das Programm mit zwei unterschiedlichen Algorithmen ausstattet, auf die wir gleich näher eingehen werden, nämlich mit einem Lernalgorithmus und einem Vorhersagealgorithmus. Beide zusammen ermöglichen es im Idealfall, viele Probleme mit dem gleichen Verfahren zu lösen, anstatt bei der Programmierung immer wieder bei null anzufangen.

Der Begriff „Lernen“ ist hier übrigens mit Vorsicht zu genießen: Menschen neigen zum Anthropomorphisieren, d.h. wir sprechen nicht-menschlichen Dingen gerne menschliche Eigenschaften zu: Jede hat wohl schon einmal mit ihrem Computer geschimpft - wohlwissend, dass er sie weder hört, noch versteht, was man sagt. Wenn wir nun sagen, Computer (oder besser gesagt: Algorithmen) „lernen”, dann ist die Gefahr groß, diesen Lernprozess wie einen menschlichen Lernprozess zu verstehen. Aber wie wir gleich sehen werden, „lernen“ Maschinen ganz anders als Menschen. Deshalb sprechen die meisten ML-Entwicklerinnen lieber davon, dass sie ihre Algorithmen „trainieren“.

Die wichtigsten ML Begriffe, einfach erklärt

Am besten versteht man wie ML funktioniert, indem man ein Beispiel einmal Schritt für Schritt durchgeht. Um dafür gewappnet zu sein, brauchen wir noch das passende ML Vokabular:

Algorithmus: Ein Algorithmus ist eine fest definierte, endliche Abfolge von Anweisungen, um eine bestimmte Berechnung durchzuführen. Jedes Computerprogramm besteht aus vielen verschiedenen Algorithmen. Ein Algorithmus kann ganz einfach sein („Finde die kleinste Zahl in dieser Liste von Zahlen“) oder sehr kompliziert („Trainiere dieses neuronale Netz“). Die meisten ML Verfahren bestehen aus zwei Algorithmen: Der sogenannte Trainingsalgorithmus trainiert das Programm mit den verfügbaren Daten, der sogenannte Inferenzalalgorithus wendet die gewonnenen “Erkenntnisse” an und liefert Ergebnisse.
Parameter: Ein Wert, der beim Training eines Machine Learning Verfahrens gelernt wird. Basierend auf bereits vorhandenen Parametern “trainiert” der Trainingsalgorithmus und versucht, die Parameter immer weiter zu verbessern. Der Inferenzalgorithmus benutzt die Parameter, um Ergebnisse zu berechnen.
Modell: Ein trainiertes Machine Learning Verfahren. Ein Modell ist hauptsächlich eine (manchmal sehr große) Menge von Parametern und die Information darüber, wie sie benutzt werden müssen - ein abspielbereites ML Verfahren und das Ergebnis des Trainingsprozesses. Der Trainingsalgorithmus erzeugt das Modell, der Inferenzalgorithmus benutzt es.
Inferenz: Das Ausführen eines Modells mithilfe eines zweiten Algorithmus’. Dieser benutzt das Modell um eine Vorhersage oder Klassifizierung einer Eingabe durchzuführen. Daher auch die Bezeichnung “Vorhersagealgorithmus”. Inferenz ist also ein Fachwort für „ML Modell abspielen und Ergebnis ausspucken“.

Beim Machine Learning benutzt man also die Kombination aus einem Trainings- und einem Vorhersage- oder Inferenzalgorithmus. Der Trainingsalgorithmus benutzt Daten, um schrittweise Parameter zu bestimmen. Die Menge aller gelernten Parameter nennt man Modell, im Grunde ein vom Algorithmus aufgestelltes “Regelwerk”, anwendbar auch auf unbekannte Daten. Der Inferenzalgorithmus nun benutzt das Modell, wendet es auf beliebigen Daten an. Er liefert am Ende die gewünschten Ergebnisse

Ablauf eines Machine Learning Trainings

Mit dem richtigen Vokabular ausgestattet können wir uns den Ablauf eines Machine Learning Projektes näher anschauen:

Wir wählen das Machine Learning Verfahren aus, für das wir ein Modell trainieren wollen. Die Auswahl hängt vom zu lösenden Problem, den zur Verfügung stehenden Daten, der Erfahrung und auch vom Bauchgefühl ab.
Danach splitten wir die verfügbaren Daten in zwei Teile auf: Die Trainingsdaten und die Testdaten. Wir trainieren auf den Trainingsdaten und erhalten so unser Modell. Überprüft wird das Modell auf den ihm unbekannten Testdaten. Wichtig hierbei ist natürlich, dass die Testdaten unter keinen Umständen während der Trainingsphase benutzt werden. Der Grund liegt auf der Hand: Computer können toll auswendig lernen. Komplexe Modelle wie neuronale Netze können tatsächlich von selber anfangen, auswendig zu lernen. Die so erzielten Resultate sind zwar ganz wunderbar, basieren aber nicht auf einem vom Programm formulierten Modell, sondern auf den “auswendig gelernten” Daten. Diesen Effekt nennt man „overfitting“.
Die Testdaten sollen aber dazu dienen, bei der Qualitätskontrolle „das Unbekannte“ zu simulieren und zu sehen, ob das Modell wirklich etwas gelernt hat. Ein gutes Modell erreicht ungefähr die gleiche Fehlerrate auf den Testdaten wie auf den Trainingsdaten ohne diese je vorher gesehen zu haben.
Wir benutzen die Trainingsdaten, um mit dem Trainingsalgorithmus das Modell zu trainieren. Je mehr Daten wir haben, desto „stärker“ wird das Modell. Hat man dem Trainingsalgorithmus alle verfügbaren Daten zur Verfügung gestellt, bezeichnet man dies als “Epoche”.
Das trainierte Modell wird zur Qualitätskontrolle auf die ihm unbekannten Testdaten angesetzt und trifft Vorhersagen. Wenn wir alles richtig gemacht haben, sind die Vorhersagen auch auf unbekannten Daten so gut wie auf den Trainingsdaten - das Modell kann abstrahieren und das gestellte Problem lösen. Nun ist es bereit für den Praxiseinsatz.

Maschinelles Lernen aus der Vogelperspektive:
Auswahl eines Verfahrens,
Unterteilung der Rohdaten in Trainings- und Testdaten,
Der Trainingsalgorithmus trainiert mit den Trainingsdaten,
Der Inferenzalgorithmus testet mit den Testdaten und macht die gewünschten Vorhersagen.

Machine Learning anhand eines Beispiels - Schritt für Schritt

Nachdem wir die einzelnen Schritte nun theoretisch durchgegangen sind, wollen wir sie nun auf ein konkretes Beispiel anwenden. Anhand des Beispiels wollen wir außerdem den wichtigsten ML Algorithmus vorstellen - die lineare Regression.

Der wichtigste ML Algorithmus: Lineare Regression

Wir haben im Rahmen unseres “Fahrplans” davon gesprochen, dass zu Beginn eines ML Trainings zunächst der passende Algorithmus für das bestehende Problem ausgewählt wird. Den Algorithmus haben wir beschrieben als eine Anleitung, wie der Computer mit bestimmten Daten verfahren soll. Ein besonders wichtiger Algorithmus im Bereich des Machine Learning ist die sogenannte lineare Regression. Hier findet man bereits alle Grundbausteine des ML. Auch wenn andere Verfahren viel komplizierter aufgebaut sind, arbeiten sie alle nach demselben Prinzip. Man kennt die lineare Regression auch aus Tabellenverarbeitungen unter dem Begriff „Trendlinie“.

Was verbirgt sich nun hinter dem eindrucksvollen Begriff „Lineare Regression“? Eine Regression ist eine Problemstellung, die - basierend auf mehreren eingegebenen Variablen oder Werten - am Ende einen oder mehrere numerische Werte “ausspuckt”. Ein Beispiel für eine Regression ist zum Beispiel eine Steuererklärung: Nach Eingabe einer Reihe von Werten, ergibt sich am Ende die zu zahlende Steuer. Oder die Berechnung eines Bremsweges: Eingegeben wird die Geschwindigkeit, ausgegeben der zu erwartende Bremsweg.

Die Funktionsweise der einfachsten linearen Regression: Die Abfrage wird auf der unteren Achse eingetragen, über die Gerade können wir auf der linken Achse das Ergebnis ablesen.

Eine Regression kann also Zahlen vorhersagen. Das „linear“ bezieht sich auf das mathematische Prinzip. Die lineare Regression benutzt lineare Gleichungen, um dies zu tun. Einfacher gesagt: Wir nehmen eine Reihe von bekannten Datenpunkten, versuchen so gut es geht, eine Linie hindurch zu legen und können dann anhand dieser Trendlinie eine Prognose für neue, unbekannte Werte abgeben.

Um die Dinge nicht zu verkomplizieren und für unser Beispiel möglichst gut darstellen zu können, beschränken wir uns an dieser Stelle auf die einfachste Art der linearen Regression, bei der es nur einen Eingabewert und einen Ausgabewert gibt. Ein bestimmter Wert auf der x-Achse resultiert in einem korrespondierenden Wert auf der y-Achse. Die Werte lassen sich als Punkte in einem Koordinatensystem anschaulich darstellen.

Dieses einfache Verfahren besitzt nur zwei Parameter: Es gibt zum einen die Steigung der Geraden und die Verschiebung der Geraden (auch Achsenabschnitt genannt). Diese beiden Werte werden vom Trainingsalgorithmus schrittweise angepasst.

Der Inferenzalgorithmus ist dann auch sehr einfach: Wir nehmen die Eingabe (den x-Wert) und berechnen die Ausgabe, indem wir schauen, was der entsprechende y-Wert der Geraden an dieser Stelle ist.

ML in der Praxis - Lineare Regression Schritt für Schritt erklärt

Wir liegen auf einer Wiese, schauen in den Nachthimmel, lauschen dem Zirpen der Grillen und fragen uns, wie oft pro Sekunde die Grillen auf der Wiese zirpen. Wir haben die Vermutung, dass Grillen (als Insekten) es eher warm mögen und gehen davon aus, dass die Intensität des Zirpens von der Temperatur abhängt. Wir möchten dies nun aber für alle Temperaturen bestimmen, können das Wetter aber nicht steuern, um die entsprechenden Daten einzuholen. Außerdem haben wir keine Lust, Nacht für Nacht mit Mikrofon und Thermometer auf der Lauer zu liegen.

Schritt 1 - Die Wahl des richtigen ML Verfahrens

Wir haben also zwei Messwerte, die linear voneinander abhängig zu sein scheinen. Je wärmer es wird, desto intensiver scheint das Zirpen der Grillen zu sein: Vor unserem inneren Auge sehen wir eine linear steigende Funktion - und entscheiden uns für die lineare Regression als bestes Verfahren!

Schritt 2 - Trainings- und Testdaten für den Trainingsalgorithmus

Um etwas zu “lernen”, braucht unser Trainingsalgorithmus aber wenigstens ein paar Daten. Wir fassen uns also ein Herz, packen unser Mess-Equipment ein, besuchen die Wiese und sammeln die Trainings- und Testdaten für unser ML Verfahren. (Oder wir laden die Daten einfach hier herunter). Bevor wir das Modell mit den ersten Daten “füttern”, wird es zunächst mit zufälligen Parametern initialisiert. Die Parameter des Modells sind zu Beginn Zufallszahlen oder Nullen (je nach Parameter und ML Verfahren). Ohne, dass irgend etwas gelernt wurde, kann das Modell nun immerhin schon Werte ausspucken, ohne abzustürzen. Allerdings sind diese Werte natürlich total falsch.

Ausgangslage beim Training eines Machine Learning Modells (mithilfe der Linearen Regression): Zu Beginn des Trainings ist die Linie zufällig gewählt und sagt die Daten nur schlecht voraus

Schritt 3 - Das Trainings des ML Modells

Um mit dem eigentlichen Training zu beginnen, geben wir einen Satz Trainingsdaten in das Modell und berechnen das (vermutlich komplett falsche) Ergebnis. Das Modell rät die Ergebnisse zunächst auf’s Geratewohl, bzw. es benutzt die zufälligen Parameter, die wir ihm zu Beginn gegeben haben. Durch die zufälligen Werte in dieser anfänglichen Formel spuckt das Modell zunächst einfach sinnlose Zahlen aus. Aber immerhin haben wir ein Ergebnis, auch wenn es falsch ist.

Damit können wir nun einen Trick anwenden, nämlich den Fehler berechnen. Je größer die Menge der Testdaten ist, mit denen wir das Modell füttern, desto klarer wird unser Bild von den Fehlern und Abweichungen. Mit dem Inferenzalgorithmus berechnen wir, was die aktuelle Vorhersage des Modells ist. Der Trainingsalgorithmus vergleicht die Vorhersage mit dem tatsächlich richtigem Ergebnis in den Trainingsdaten und berechnet, wie sehr diese voneinander Abweichen. Anhand dieser Abweichung passt er die Parameter an, um die nächste Vorhersage zu verbessern. Er verbessert unsere lineare Funktion schrittweise, überprüft die Abweichungen und “registriert”, ob sie größer oder kleiner werden - je nachdem, wie die Parameter angepasst werden. Kurz: Er gibt an, wie wir unser Modell ändern müssen, damit es besser auf die Daten passt.

Nachdem wir einige Trainingsdaten benutzt haben, um unsere Linie zu verschieben, sagt sie die Daten schon etwas besser voraus.

Schritt 4 - Überprüfung anhand der Testdaten

Ohne mathematisch zu tief einzutauchen, fassen wir an dieser Stelle zusammen: Mit den richtigen Formeln, den Trainingsdaten und der anfänglichen (falschen) Ausgabe des Modells kann der Algorithmus die Parameter des Modells optimieren, so dass die Lösung beim nächsten Mal ein wenig besser wird. Bei der linearen Regression in unserem Fall geschieht dies z.B. dadurch, dass die Linie näher an die Trainingspunkte geschoben wird.

Nachdem wir die Trainingsdaten aufgebraucht haben, kann die Linie verwendet werden, um unbekannte Punkte gut vorherzusagen.

Dieser Ablauf wird nun immer wieder wiederholt, bis das Ergebnis gut genug ist:

Wir nehmen einen Teil der Trainingsdaten, berechnen das Ergebnis
Wir berechnen den Fehler und beobachten, wie sehr das Ergebnis daneben liegt (z.B. einfach durch eine Subtrahieren vom gewünschten Ergebnis)
Mithilfe des Fehlers und schlauer Mathematik (meist Ableitungen) berechnen wir, wie wir das Modell ändern müssen, damit der Fehler kleiner wird.
Wenn wir mit dem Ergebnis zufrieden sind, hören wir auf - sonst gehen wir zurück zu 1. und wiederholen mit einem anderen Teil der Trainingsdaten.

Was aber, wenn wir alle Trainingsdaten benutzt haben und mit dem Ergebnis immer noch nicht zufrieden sind? Wir initiieren eine neue Epoche (siehe oben), nachdem wir die Daten in eine neue, zufällige Reihenfolge gebracht haben. Idealerweise gibt es so viele Daten, dass man nie an das Ende einer Epoche kommt, in der Praxis allerdings werden Daten oft mehrmals genutzt, das Modell also über mehrere Epochen trainiert. Bei einem Menschen ist das ähnlich: Auch wir müssen Vokabeln oft mehrmals (und möglichst in wechselnder Reihenfolge) durchgehen, bis wir sie gelernt haben.

Lineare Regression und ML bei “hochdimensionalem Input”

Vielleicht denkt jetzt der ein oder andere: “Das ist doch geschummelt! Eine Linie durch ein paar Punkte zu ziehen, ist doch keine KI!” Dabei muss man allerdings bedenken: Dasselbe Verfahren funktioniert nicht nur bei einer simplen zweidimensionalen Funktion und einem Eingabewert, sondern auch beim sogenannten „hochdimensionalen Input“.

Dieser pompöse Begriff weist lediglich darauf hin, dass man mehrere Eingabegrößen hat, und hat insofern mehr mit einer Steuererklärung als mit Science Fiction zu tun: Jede Steuererklärung hat eine mehrdimensionale Eingabe (Lohn, selbstständiges Einkommen, Anzahl der Kinder, …). Auch jeder Brief wird über mehrdimensionale Eingaben adressiert: Name, Nachname, Firma, Adresszusatz, Straße, Hausnummer, Postleitzahl, Stadt, Land - hier sind wir schon bei einem 9-dimensionalen Input!

Unser Grillen-Beispiel hatte lediglich eine Eingabe- und eine Ausgabegröße, so dass wir die Datensätze zweidimensional in Form einer Linie abbilden konnten. Doch dieselbe Mathematik, mit der man eine einfache Lineare Regression trainieren kann, funktioniert auch bei beliebig vielen Dimensionen. Man nennt das ganze dann zwar immer noch „linear“, weil die zugrundeliegende Mathematik immer noch linear ist - auch wenn es eine Zeichnung des Modells nicht mehr ist, bzw. das Modell gar nicht mehr ohne weiteres grafisch dargestellt werden kann.

ML in der Praxis: So einfach wie möglich, so kompliziert wie nötig

Wir stellen fest: Bei richtiger Vorverarbeitung kann so eine lineare Regression erstaunlich leistungsfähig sein. Daher ist dieser einfache Algorithmus auch heute noch praktisch relevant. Zum einen als Bestandteil komplexerer Systeme - wie wir später sehen werden, kommt kein neuronales Netz ohne lineare Regression aus -, zum anderen ist es beim Machine Learning oft so, dass einfache Verfahren oft besser funktionieren als komplexe. Die Qualität des Ergebnisses hängt in der Regel nämlich weniger vom Verfahren, sondern in erster Linie von den Lerndaten ab. Auch kann der Performancegewinn durch ein kompliziertes Verfahren so gering sein, dass sich der erhöhte Aufwand (Rechenzeit, Speicherverbrauch, Programmieraufwand, Fine-Tuning, …) für das komplexe Verfahren nicht wirklich lohnt.

In jedem Fall sind lineare Verfahren immer gut geeignet, um eine „Baseline“ festzulegen: Was ist mit minimalem Aufwand mit den vorhandenen Daten zu erreichen? Viele Projekte starten mit einem linearen Verfahren um spätere Resultate besser einschätzen zu können.

Natürlich gibt es eine Menge Dinge, die eine lineare Regression nicht kann - sonst bräuchte es kein Deep Learning und keine neuronalen Netze. Aber wie bei den zuvor vorgestellten klassischen KI Verfahren gilt: So einfach wie möglich, so kompliziert wie nötig. In einem realen Projekt gilt es, so ressourcensparend wie möglich das bestmögliche Ergebnis zu erreichen.

Wie also geht es weiter? Im nächsten Artikel werden wir uns weiter mit dem Machine Learning beschäftigen und betrachten, wie man ML Verfahren weiter kategorisieren kann und was ihre Stärken und Schwächen sind.

07 Aug. 2025
Python Dependency Management ohne Kopfschmerzen
Einer der schmerzhaftesten Aspekte bei der Entwicklung neuronaler Netze ist das Dependency Management in Python. Es scheint, als hätte Python mehrere Räder neu erfunden, auf denen andere Sprachen wie JAVA bereits seit Jahren fröhlich dahingrollt sind. Ironischerweise werden Python-Pakete tatsächlich “wheels” genannt. Naja. In diesem kurzen Artikel möchten wir Ihnen unsere Lösung für dieses Problem bei Deep Learning (DL) Projekten vorstellen, wo dieses Problem besonders hartnäckig ist, da man auch noch mehrere CUDA-Versionen jonglieren muss. Beachten Sie, dass es mehrere Wege gibt, damit umzugehen - dies ist nur derjenige, den wir am liebsten mögen - vielleicht werden Sie das auch?
weiterlesen
25 Feb. 2025
Arbeiten mit Ollama, Teil 2
Im ersten Teil unseres Artikels über Ollama haben wir gezeigt, wie man Ollama und zugehörige Modelle installiert. Im zweiten Teil des Artikels wird die fortgeschrittene Nutzung von Ollama durch Anpassung von Modelfiles und die Integration mit dem Frontend AnythingLLM behandelt. Es wird gezeigt, wie diese Tools die Verwaltung und Nutzung von KI-Modellen effizienter gestalten.
weiterlesen
24 Feb. 2025
Arbeiten mit Ollama, Teil 1
Im ersten Teil unseres Zweiteilers “Arbeiten mit Ollama” geben wir eine Einführung in die quelloffene Multi-Plattform-Lösung Ollama, die die Nutzung und Verwaltung von KI-Modellen vereinfacht.
weiterlesen
08 Apr. 2024
Whisper 3 Large für JAVA
Für einen internen Produktprototyp haben wir OpenAIs Whisper 3 Modell von Huggingface getraced und per DJL unter JAVA nutzbar gemacht.
weiterlesen
14 Juni 2023
ChatGPT für Teams: Datenschutzkonforme Nutzung im Unternehmen
In der heutigen digitalen Geschäftswelt sind KI-gestützte Kommunikationsplattformen wie ChatGPT unverzichtbar, um beispielsweise komplexe Code-Fragen zu beantworten oder erstklassige Texte für Angebote zu erstellen. Doch gerade in Unternehmen, in denen sensible Kundendaten im Spiel sind, kann die Verwendung von ChatGPT zu einem Datenschutz-Dilemma führen. Obwohl ChatGPT eine Option bietet, um die Verwendung von Chatkonversationen für Trainingszwecke zu verhindern, gibt es damit gewisse Einschränkungen. Außerdem gibt es bisher (Stand: Juni 2023) keine Möglichkeit, mehrere Teammitglieder oder Benutzer über einen Firmenaccount zu verwalten. Jeder Nutzer muss sich einzeln registrieren und dazu eine eigene Email, Telefonnummer und Kreditkarte verwenden. Will man chatGPT+ nutzen, kann man z.B. nicht alle Nutzer über eine Kreditkarte bezahlen. Auch landen die einzelnen Rechnungen bei den einzelnen Nutzern. Ein organisatorischer und buchahlterischer Albtraum. Auch wir bei DIVISO haben uns mit dieser Problematik auseinandergesetzt und uns auf die Suche nach einer Lösung gemacht.
weiterlesen
25 Okt. 2021
Git als Verwaltungstool für Trainingsdaten und Experimente beim ML
Wir beginnen in diesem Teil der Artikelserie über MLOps mit Informationen, die den meisten von euch bekannt sein werden: Mit den Basics von Git. Um jedoch eine andere Sichtweise auf das bekannte Tool aufzuzeigen, bieten diese Grundlagen die Basis, um die Funktion und Vorteile von Git für das maschinelle Lernen (ML) und den Unterschied bei der Verwaltung von Trainingsdaten zu betonen.
weiterlesen
02 Aug. 2021
MLOps: Etablierung und Betrieb einer KI
Mit Machine Learning Operations (MLOps) stellen wir sicher, dass Daten durch regelmäßiges und automatisiertes Training effizient und strategisch in die unternehmerischen Abläufe eingebunden werden und somit zur Umsatzsteigerung beitragen. Die Herausforderung besteht darin, diese automatisierten Prozesse zu etablieren und instand zu halten.
weiterlesen
29 Juni 2020
NLP, NLU und NLG: KI und Text
Bisher haben wir bei unseren Praxisbeispielen für das Grundverständnis von KI in der Regel einen großen Bogen um die Bereiche Textverständnis und Texterzeugung durch ML gemacht. Aus gutem Grund haben wir uns in erster Linie auf zwei Arten von Problemen konzentriert: Die Klassifikation von Bildern und die Vorhersage von Zahlwerten.
weiterlesen
12 Mai 2020
Deep Java Learning Einführung - Teil 1: NDManager & NDArray
Nach unserer ersten Vorstellung von Amazons neuem Deep Learning Frameworks für Java, DJL, wollen wir nun in einer Reihe von Anfängerposts Schritt für Schritt die Grundlagen von Deep Learning unter Java mit DJL vorstellen. Hierbei soll es nicht um das schnelle Kopieren von Code Snippets, sondern um das wirkliche Verständnis des Frameworks und der Konzepte gehen.
weiterlesen
28 Apr. 2020
Amazon DJL – ein neues Deep Learning Framework für Java
Wer auf der JVM und insbesondere in Java mit neuronalen Netzen und Deep Learning experimentieren wollte, für die gab es bisher nur wenig Auswahl. Wer ausschließlich auf Java setzen wollte, kam bisher an DL4J nicht vorbei. Wenn es die JVM, aber nicht unbedingt Java sein muss, kommt auch noch das Scala Frontend von MXNet in Frage. Wen schließlich ein wenig Python nicht schreckt, die kann eine Hybrid Lösung aus TensorFlow und Java probieren, wie wir bereits in früheren Artikeln erläutert haben.
weiterlesen
06 März 2020
Arten von Künstlichen Neuronalen Netzen
In unserem Praxis-Beispiel haben wir zur Erkennung von handgeschriebenen Ziffern ein “feed-forward neural network” genutzt. Dieses ist die wohl einfachste Form eines NN. In der Praxis gibt es jedoch hunderte Arten von mathematischen Formeln, die über Addition und Multiplikation hinaus benutzt werden, um Schritte in einem Neuronalen Netz zu berechnen, viele verschiedene Arten, die Schichten anzuordnen, und viele mathematische Ansätze das Netz zu trainieren.
weiterlesen
06 März 2020
Die häufigsten Irrtümer über Neuronale Netze
KI und insbesondere Neuronale Netze und Deep Learning sind seit einigen Jahren das technologische Hype Thema. Da die Materie aber recht abstrakt ist – man könnte sagen, für die meisten ist es Neuland – wollen wir hier einige Irrtümer bereinigen, denen wir in unserer Arbeit häufiger begegnen.
weiterlesen
06 März 2020
Was sind Neuronale Netze und wie funktionieren sie?
Nachdem es in den letzten Beiträgen überwiegend um die Grundlagen der derzeitigen KI-Forschung ging und wir versucht haben, diese für Nicht-ITler verständlich zu beleuchten, wagen wir uns heute an das aktuell wohl „heißeste“ KI-Thema, die Neuronalen Netze (NN).
weiterlesen
22 Okt. 2019
Deep Fakes - Woran man Fake-Bilder erkennen kann
Eine (relativ) neue Art neuronaler Netze, sogenannte Generative Adversarial Networks (zu deutsch etwa ‚erzeugende gegnerische Netzwerke’) oder GANs, sind heutzutage in der Lage, täuschend echte Bilder von Menschen zu erzeugen, die es gar nicht gibt. Diese Fake Bilder sind auf den ersten Blick von echten Fotos nicht mehr zu unterscheiden – aber zum Glück auf den zweiten Blick schon.
weiterlesen
26 Juni 2019
Recap zur ML Konferenz 2019 in München
Am 17.06. war es wieder so weit: die halbjährlich stattfindende ML Conference startete mit einem Workshoptag, der allen Teilnehmerinnen durch gemeinsames Live-Coding einen verständlichen Einstieg in die Themen Machine Learning und Deep Learning erlaubte.
weiterlesen
24 Mai 2019
KI leicht erklärt - Teil 5: Überwachtes & unüberwachtes Lernen im ML
Im vorigen Artikel haben wir Grundbegriffe des Machine Learning (ML) kennengelernt und anhand eines einfachen aber praxisrelevanten Algorithmus’ nachvollzogen, wie das Training eines Machine Learning Modells abläuft. Als nächstes wollen wir uns nun die verschiedenen Arten des Machine Learning näher anschauen.
weiterlesen
14 Mai 2019
Fachtagung des BGL 2019 – Vortrag 'KI und Magie'
“Jede hinreichend fortgeschrittene Technologie ist von Magie nicht mehr zu unterscheiden.” - Arthur C. Clark Die JAX 2019 ist gerade erst vorbei, da steht Christoph auch schon für den nächsten Vortrag auf dem Podium. Auf der Fachtagung des Bundesverbandes der Photo-Großlaboratorien geht es in seinem Vortrag um “KI und Magie – Wie funktioniert Künstliche Intelligenz?”
weiterlesen
29 Apr. 2019
Jax 2019 Recap
Die JAX in Mainz rückt näher und auch Christoph ist wieder als Speaker mit an Bord. Dieses Jahr spricht er in seinen Vorträgen über Neuronale Netze und das TensorFlow-Training auf der JVM.
weiterlesen
08 Apr. 2019
KI leicht erklärt - Teil 3: Methoden der klassischen KI
Im vorherigen Beitrag haben wir unsere anfängliche Definition von künstlicher Intelligenz um zwei Unterscheidungen erweitert: Unterschieden wird einerseits zwischen starker und schwacher KI (Terminator & Science Fiction vs. Status Quo), sowie zwischen klassischer KI und dem Machine Learning.
weiterlesen
21 März 2019
KI leicht erklärt - Teil 2: Klassische KI, Neuronale Netze und Deep Learning
Die Künstliche Intelligenz (KI) ist so alt wie die Informatik selbst. Rechnen, das Ziehen logischer Schlüsse, das Durchführen komplexer Anweisungen… all das war vor der Erfindung des Computers dem Menschen vorbehalten.
weiterlesen
07 März 2019
KI leicht erklärt - Teil 1: Was ist KI?
Was ist Künstliche Intelligenz? Oder vielmehr: Wie funktioniert eigentlich KI? Vom Haushaltshelfer bis zum Endzeitszenario - bei kaum einem Thema klaffen öffentliche Wahrnehmung, Forschungsstand und Realität so weit auseinander wie bei der KI.
weiterlesen
06 Aug. 2018
DL4J Workshop auf dem ML Summit in Berlin
Am 1. und 2. Oktober findet in Berlin der erste ML Summit statt. In 12 Worshops in drei parallelen Tracks vermitteln Experten Praxiswissen zu den Themen Applications for Business, Machine Learning Basics & Tools und Specialized Topics.
weiterlesen
23 Apr. 2018
JAX 2018 - Recap | Deeplearning4Java
Christoph hält auf der diesjährigen JAX in Mainz zwei Vorträge zum Thema maschinelles Lernen und Java.
weiterlesen
29 Jan. 2018
Enterprise TensorFlow 4 - Eine TensorFlow Session in Java ausführen
Eine TensorFlow Session wird in Java genauso ausgeführt wie in Python. Dieser Post zeigt wie.
weiterlesen
23 Jan. 2018
Enterprise TensorFlow 3 - Ein SavedModel in Java laden
Teil in der Serie über Java / TensorFlow Interoperabilität, der zeigt, wie man ein TensorFlow SavedModel in Java lädt.
weiterlesen
23 Jan. 2018
Enterprise Tensorflow: Code Beispiele
Ein Überblick über die Beispielprojekte zum Thema TensorFlow / Java Integration
weiterlesen
22 Jan. 2018
Enterprise TensorFlow 2 - Wie man ein trainiertes Modell speichert
Teil 2 in der Serie über Java / TensorFlow Interoperabilität, in dem es darum geht ein Modell so zu speichern, dass es in anderen Umgebungen wiederverwendet werden kann.
weiterlesen
11 Jan. 2018
TensorFlow und Java - Ein Interview mit entwickler.de
Auf der ML Konferenz 2017 in Berlin ist unser CTO zum Thema TensorFlow / Java Interoperabilität interviewt worden.
weiterlesen
30 Nov. 2017
Enterprise Tensorflow Teil 1 - Python vs. Java
Dies ist der erste Teil einer Reihe von Posts über Java und Tensorflow Interop. Es ist eine ausführlichere Version meines Vortrags auf der ML Conference 2017 in Berlin.
weiterlesen
15 Nov. 2017
ML Konferenz 2017 in Berlin
Eine Ankündigung für meine Präsentation auf der ML Konferenz 2017 in Berlin
weiterlesen

Die Grundlagen des Machine Learning

Die wichtigsten ML Begriffe, einfach erklärt

Ablauf eines Machine Learning Trainings

Machine Learning anhand eines Beispiels - Schritt für Schritt

Der wichtigste ML Algorithmus: Lineare Regression

ML in der Praxis - Lineare Regression Schritt für Schritt erklärt

Schritt 1 - Die Wahl des richtigen ML Verfahrens

Schritt 2 - Trainings- und Testdaten für den Trainingsalgorithmus

Schritt 3 - Das Trainings des ML Modells

Schritt 4 - Überprüfung anhand der Testdaten

Lineare Regression und ML bei “hochdimensionalem Input”

ML in der Praxis: So einfach wie möglich, so kompliziert wie nötig

Python Dependency Management ohne Kopfschmerzen

Arbeiten mit Ollama, Teil 2

Arbeiten mit Ollama, Teil 1

Whisper 3 Large für JAVA

ChatGPT für Teams: Datenschutzkonforme Nutzung im Unternehmen

Git als Verwaltungstool für Trainingsdaten und Experimente beim ML

MLOps: Etablierung und Betrieb einer KI

NLP, NLU und NLG: KI und Text

Deep Java Learning Einführung - Teil 1: NDManager & NDArray

Amazon DJL – ein neues Deep Learning Framework für Java

Arten von Künstlichen Neuronalen Netzen

Die häufigsten Irrtümer über Neuronale Netze

Was sind Neuronale Netze und wie funktionieren sie?

Deep Fakes - Woran man Fake-Bilder erkennen kann

Recap zur ML Konferenz 2019 in München

KI leicht erklärt - Teil 5: Überwachtes & unüberwachtes Lernen im ML

Fachtagung des BGL 2019 – Vortrag 'KI und Magie'

Jax 2019 Recap

KI leicht erklärt - Teil 3: Methoden der klassischen KI

KI leicht erklärt - Teil 2: Klassische KI, Neuronale Netze und Deep Learning

KI leicht erklärt - Teil 1: Was ist KI?

DL4J Workshop auf dem ML Summit in Berlin

JAX 2018 - Recap | Deeplearning4Java

Enterprise TensorFlow 4 - Eine TensorFlow Session in Java ausführen

Enterprise TensorFlow 3 - Ein SavedModel in Java laden

Enterprise Tensorflow: Code Beispiele

Enterprise TensorFlow 2 - Wie man ein trainiertes Modell speichert

TensorFlow und Java - Ein Interview mit entwickler.de

Enterprise Tensorflow Teil 1 - Python vs. Java

ML Konferenz 2017 in Berlin