Embedded Vision kombiniert Kameras, Edge- oder Cloud-Computing, Software und künstliche Intelligenz (KI), damit Systeme Objekte „sehen“ und erkennen können. Intel verfügt über ein umfangreiches Angebot, um KI-Lösungen Realität werden zu lassen. Dazu gehören CPUs für allgemeine Berechnungen und Computer Vision sowie Vision Processing Units (VPUs) zur Beschleunigung. Für den Einsatz in einer Vielzahl von Umgebungen können Computer-Vision-Systeme schnell Objekte und Personen erkennen, audiodemografische Merkmale analysieren, hergestellte Produkte überprüfen und vieles mehr. Computer Vision nutzt Deep Learning, um neuronale Netze zu bilden, die dann die Systeme bei der Bildverarbeitung und Analyse leiten. Umfassend trainierte Computer Vision Modelle können für die Objekterkennung, Menschenerkennung und sogar die Bewegungsverfolgung verwendet werden.
Month: February 2023
Machine Learning (ML)
Maschinelles Lernen (ML) ist eine Sammlung von mathematischen Methoden zur Mustererkennung. Diese Methoden erkennen Muster, zum Beispiel durch die bestmögliche Zerlegung von Datensätzen in hierarchische Strukturen, die auf die bestmögliche Entropie ausgerichtet sind. Oder es werden Ähnlichkeiten zwischen Datensätzen über Vektoren ermittelt und daraus trainiert oder untrainiert Muster abgeleitet. Algorithmen des maschinellen Lernens sind in der Tat in der Lage, viele alltägliche oder sogar sehr spezielle Probleme zu lösen. In der Praxis eines Entwicklers für maschinelles Lernen treten jedoch häufig Probleme auf, wenn entweder zu wenig Daten vorhanden sind oder die Daten zu viele Dimensionen haben. Entropiegesteuerte Lernalgorithmen wie Entscheidungsbäume werden zu komplex, wenn es viele Dimensionen und Vektoren gibt.
Natural Language Processing (NLP)
Die Abkürzung NLP steht für Natural Language Processing und beschreibt Techniken und Methoden zur maschinellen Verarbeitung natürlicher Sprache. Das Ziel ist die direkte Kommunikation zwischen Mensch und Computer. Natural Language Processing (NLP) versucht, natürliche Sprache zu erfassen und mit Hilfe von Regeln und Algorithmen computerbasiert zu verarbeiten. NLP nutzt verschiedene Methoden und Ergebnisse der Linguistik und kombiniert sie mit moderner Informatik und künstlicher Intelligenz. Das Ziel ist es, eine möglichst hohe Kommunikation zwischen Menschen und Computern über Sprache herzustellen. Dies soll es sowohl Maschinen und Anwendungen ermöglichen durch Sprache gesteuert und bedient zu werden.
Tet-to-Speech
Bei der Sprachsynthese geht es darum, die menschliche Sprache künstlich zu erzeugen und sie für kommunikative Zwecke zu nutzen. Die Sprachsynthese ermöglicht eine Mensch-Maschine-Kommunikation. Technisch gesehen handelt es sich bei der Sprachsynthese um die Umwandlung und Ausgabe kodierter Daten in Form von Sprache, wobei Sprachsynthesesysteme entsprechende Wörter oder Wortfragmente speichern und phonetisch klassifizieren. Bei der Sprachsynthese kommen zwei Verfahren zum Einsatz: die Verwendung von zuvor aufgezeichneter natürlicher Sprache in Form von Phonemen, Wörtern und Satzfragmenten und die Generierung von synthetischer Sprache aus Daten und Text, wobei das erste Verfahren bei einem begrenzten Wortschatz eingesetzt werden kann, die synthetische Erzeugung funktioniert mit einem unbegrenzten Vokabular. Solche Sprachsynthesesysteme werden in der Computer-Telefonie Integration (CTI), Bildschirm Lesegeräten, Text-to-Speech, … eingesetzt.
Speech-to-Text
Unter Spracherkennung versteht man die Fähigkeit einer Maschine oder eines Programms, gesprochene Wörter und Sätze zu erkennen und in ein maschinenlesbares Format umzuwandeln.
Spracherkennung wird beispielsweise in der Anrufweiterleitung, Sprachwahl und Sprachsuche eingesetzt. Die Spracherkennung muss von der Stimmerkennung unterschieden werden, welche eine biometrische Methode zur Identifizierung einer Person anhand ihrer Stimme ist.