Was ist Künstliche (maschinelle) Intelligenz?

Künstliche (maschinelle) Intelligenz (KI bzw. AI - Artificial Intelligence) ist ein Teilgebiet der Informatik. Es geht um Computer und spezielle Programme (Software), die menschliche kognitive Fähigkeiten wie das Erkennen von Mustern, logisches Denken, Zusammenfassen, Planen und Kreieren imitieren.

Bisherige Entwicklung

Erste solche Programme wurden schon vor über einem halben Jahrhundert entwickelt:

Heute nutzen wir viele Anwendungen derartiger Software in unserem Alltag:

Beispiele: Gesichtserkennung PimEyes, Sprachübersetzung Rätoromanisch-Deutsch, Roboter Nao

Was ist neu?

Im Zentrum des aktuellen Hypes ("Rummel") um KI stehen Dialogsysteme wie ChatGPT, Gemini, Copilot, Claude, DeepSeek, Apertus, usw. Einen ähnlichen (etwas gemässigteren) Hype um Dialogsysteme (Chatbots) gab es bereits in den Neunzigerjahren des letzten Jahrhunderts. Viele Unternehmen nutzten Chatbots für die Kundenkommunikation und als Auskunftssysteme (Q&A, Questions and Answers, Fragen und Antworten).

"Eliza" war der erste bekannte Chatbot (1966). Er imitierte einen Psychotherapeuten.

Talk to ELIZA online - Emulation des ersten Chatbots "Eliza"

Die Chatbot-Programme der Neunzigerjahre basierten auf der Artificial Intelligence Markup Language (AIML). Menschen speicherten deren "Wissen" in "templates" (z.B. <template>In unserem Sonnensystem gibt es 8 Planeten.</template>). Die Fragen, die der Chatbot beantworten konnte, waren in "patterns" gespeichert (z.B. <pattern>Wieviele Planeten *</pattern>). Die "patterns" und nötigenfalls auch die "templates" mussten von Menschen laufend aktualisiert werden, um den von Nutzenden tatsächlich gestellten Fragen gerecht zu werden. Das war in der Folge bei vielen Chatbots zu aufwendig (zu kostspielig).

Die aktuellen Dialogsysteme (ChatGPT, Gemini, Copilot, usw.) basieren auf künstlichen neuronalen Netzen und sie sind ohne Hilfe von Menschen lernfähig (maschinelles Lernen). Ausserdem hat die beeindruckende Entwicklung der Computerlinguistik dazu geführt, dass aktuelle Dialogsysteme die Eingabe-Texte der Nutzenden viel besser interpretieren können.

Künstliche neuronale Netze und maschinelles Lernen am Beispiel der Ziffernerkennung

https://www.3blue1brown.com/lessons/neural-network-analysis/

Large Language Models (LLM)

Ein Large Language Model (grosses Sprachmodell) ist die softwaretechnische Realisierung eines computerlinguistischen Wahrscheinlichkeitsmodells, das durch einen maschinellen Trainingsprozess aus einer Vielzahl von Textdokumenten erlernt hat, welche statistischen Beziehungen zwischen Wort- und Satzfolgen in diesen Texten auftreten. Das Training erfolgt entweder überwacht (supervised learning), unbeaufsichtigt (unsupervised learning) oder unter Einbezug von "Belohnung" (reinforcement learning).

Grosse Sprachmodelle sind im weiteren Sinne künstliche neuronale Netze und dadurch in der Lage, aus einem Eingangstext (prompt) einen Ausgangstext zu generieren.

[frei nach Wikipedia - Large Language Model]