Sokratext – Deutsche Texte verstehen und erzeugen

Keine Lust auf lange Erklärungen? Hier gehts direkt zu den interaktiven Beispielen:

State-of-the Art Deep Learning, angepasst auf die Eigenheiten der deutschen Sprache

Sokratext ist ein Deep Learning System, das auf aktuellesten Technologien beruht, wie Sie auch von Google, Facebook, Amazon und anderen eingesetzt werden. Im Gegensatz zu existierenden Systemen wurde bei Sokratext aber nicht einfach eine bestehende Architektur mit deutschen Texten trainiert, sondern das gesamte System auf die Besonderheiten der deutschen Sprache angepasst. Dadurch erreicht Sokratext die gleiche Performance wie die Systeme großer US-Konzerne, braucht aber wesentlich weniger Rechenpower und ist schneller und kostengünstiger im Betrieb.

Anpassung an Ihren use case mittels Transfer Learning

Mit Transfer Learning können vortrainierte KI-Systeme auf neue Aufgaben angepasst werden. Somit können Sie auch mit wenigen Daten erstaunliche Ergebnisse erzielen. Sokratext wurde sorgfältig auf die Besonderheiten der deutschen Sprache trainiert und kann dadurch schnell und genau auch die Lösung Ihrer Probleme erlernen. Dabei profitieren Sie von dem monatelangen Training der Sokratext-Engine auf Gigabytes von Daten, auch wenn Ihnen nur einige hundert Beispiele für das Training zur Verfügung stehen. Wir analysieren Ihre Daten, bereinigen Sie und passen Sokratext genau an Ihrer Bedürfnisse an, so dass Sie ein maßgeschneidertes System zur Lösung Ihres Problems bekommen.

Einsatz als SAAS-Lösung oder on site

Ihr auf individuelle Ansprüche angepasstes Sokratext System können Sie entweder bei uns an unserem Standort in Köln als Software-as-a-Service (SAAS) Lösung oder aber auf Ihrer eigenen Infrastruktur (on site) betreiben. Durch ressourcenschonende und effiziente Programmierung ist auch der Einsatz auf CPU-Systmene möglich. Möchten Sie das Extra-Plus an Performance, so können Sie Sokratext sogar auf kostengünstigen Consumer GPUs betreiben. So können Sie schnell Kosten in sechsstelliger Höhe einsparen. Gerne beraten wir Sie auch beim Einkauf der richtigen Hardware für Ihren Anwendungsfall.

Damit können Sie absolut DSGVO konform und rechtssicher modernste Sprach-KI nutzen, ohne Ihre wertvollen Daten in die Hände außereuropäischer Konzerne zu geben. Bereiten Sie sich keine Kopfschmerzen beim Einsatz externer Services und Dienstleistungen mehr. Ganz zu schweigen von der deutlichen Kostenersparnis, die Sie gegenüber einer einer Cloud-Lösung haben.

Enterprise Ready

Sokratext ist auf den Einsatz auf der Java Virtual Machine ausgelegt. Sie bekommen – je nach Wunsch – entweder eine fertige Java Bibliothek (JAR-Archiv) zur Integration in Ihre bestehende Enterprise Software oder eine fertige, allein lauffähige REST-Schnittstelle (z.B. als Boot-JAR oder as WAR-Archiv). So brauchen Sie keine neuen Server Systeme sondern können ihre bestehende Enterprise-Software-Umgebung weiter nutzen. Eine kostspielige und langwierige Anpassungen Ihrer Infrastruktur und Software entfällt.

Auch nach der Fertigstellung sind sie nicht auf sich gestellt. Wir verbessern Sokratext kontinuierlich und mit jeder neuen Generation des Basis-Modells trainieren wir auch Ihre Sprach-KI neu, so dass sie sich kontinuierlich verbessert. Darüber hinaus bieten wir selbstverständlich auch Wartung und Support für Ihr Modell. Auch trainieren wir Ihr System regelmäßig für Sie neu, wenn Sie neue Daten sammeln, damit es sich kontinuierlich an neue Aufgaben und Daten anpassen kann.

Energie (und Geld) sparen mit Green AI

Der Betrieb behäbiger und großer Deep Learning Modelle kann schnell viel Rechezeit und damit Strom kosten.
Dies verursacht neben einem gesteigerten CO2-Ausstoß auch gesteigerte Kosten. Sokratext ist darauf optimiert, schlank,
effizient und resourcenschonend zu sein. Dadurch kann es auf herkömmlichen Rechnern ohne GPU betrieben werden.
Werden GPUs benutzt, so können kostengünstige Modelle genutzt werden, von denen nur wenige benötigt werden.

Sokratext NER

„Named Entity Recognition”, zu Deutsch etwa: „Erkennung von Entitäten mit Eigennamen“ bezeichnet die Aufgabe, in Texten Begriffe zu finden, die individuelle Objekte bezeichnen, die einen Namen haben. Gleichzeitig sollte ein NER-System auch sagen können, um was für eine Entität es sich handelt. Dies dient dazu, allgemeine Begriffe, wie z.B. „Fluss“ von einem ganz bestimmten Begriff wie „Rhein“ zu unterscheiden. Mit NER können Dokumente nach Firmennamen, Produktnamen, Personen, Orten usw. durchsucht werden – auch wenn diese im Vorfeld nicht bekannt sind oder kleinere Schreibfehler enthalten!

Das Sokratext NER System ist auf Personen, Orte, Organisationen und Sonstiges (z.B. Produktnamen) trainiert, kann aber für Sie individuell auf beliebige andere Begriffsgruppen trainiert werden. Sie können das Sokratext NER System hier interaktiv mit Ihren eigenen Texten testen:

Sokratext POS

Beim „Part-of-Speech-Tagging“ (POS, „das Bestimmen von Sprachbestandteilen“) wird ein Text auf grammatische Funktion analysiert. Das Sokratext POS System zerlegt einen Text in grammatische Fälle und Prädikatbestandteile. Innerhalb dieser werden dann die grammatischen Eigenschaften von Wörtern und Begriffen bestimmt.

Dies ist nützlich als Vorverarbeitungsschritt für andere Sprachaufgaben, z.B. benutzt das Sokratext NLG System diesen Schritt zur Erzeugung von Templates, die organisch Daten in Text integrieren und Formulierungen korrekt wählen können. Probieren Sie es doch einfach interaktiv aus:

Sokratext NLG

Der englische Begriff „Natural Language Generation“ („erzeugung natürlicher Sprache“) bezeichnet die Erzeugung von menschenlesbarem Text durch ein KI-System. Das Sokratext NLG System kann aus Daten automatisiert Texte für beliebige Themenbereiche erzeugen und so automatisch Landingpages, Produktkataloge und andere Texte erstellen.

In unserem interaktiven Beispiel wird ein Text mit einer Zusammenfassung der Kursbewegungen eines Wertpapieres für einen
bestimmten Handelstag erstellt.

Die Sokratext NLG Engine ist trotz Einsatz eines Transformer-basierten Deep Learning Modells kein stochastischer Texterzeuger wie z.B. GPT. Stattdessen wird Deep Learning basierte Analyse von Templates mit klassischer, regelbasierter Sprachgenerierung kombiniert. Die hieraus entstehenden smarten Templates ermöglichen das schnellere Erzeugen von Robotexten und erlauben mehr sprachliche Variation – dabei behalten Sie aber dennoch volle Kontrolle über den Inhalt.

Dabei ist die Sokratext NLG-Engine nicht auf einen Themenbereich (z.B. Finanzen) festgelegt – sie können Texte über jedwedes Thema damit erzeugen.

Haben wir Ihr Interesse für die DIVISIO Sokratext Text Engine geweckt? Gerne beantworten wir Ihnen weiter Fragen unter sales@divis.io!