Mit KI 300 Millionen Menschen unterrichten
Wahrscheinlich war das Erlernen einer Fremdsprache eines Ihrer Ziele im letzten Jahr. Und das Jahr davor und das Jahr davor. Wie bei Mitgliedschaften in Fitnessstudios halten unsere besten Vorsätze oft nicht lange an. Abgesehen von der Zeit, die benötigt wird, um eine neue Sprache zu beherrschen, haben die meisten Menschen Schwierigkeiten mit traditionellen Lernansätzen. Selbst viele webbasierte Sprachtools können eintönig und umständlich sein.
Das in Pittsburgh ansässige Startup Duolingo ändert all das mit seiner KI-basierten Sprachlernplattform. Das Unternehmen erreicht mit mehr als 32 Sprachkursen über 300 Millionen Benutzer – von Französisch und Tamil bis hin zu seltenen Sprachen wie Hawaiisch und Navajo.
Das Besondere an Duolingo ist sein personalisierter Lernansatz, der das Lernerlebnis durch ein punktebasiertes Belohnungssystem spielerisch gestaltet, um die Benutzer zu motivieren und ihre Kenntnisse weiterzuentwickeln. Das US- Außenministerium schätzt, dass es 600 Stunden dauert, eine Sprache der ersten Kategorie wie Französisch oder Italienisch zu lernen. Duolingo hofft, dass Sie dies mit nur 15 Minuten am Tag tun können.
Benutzer beginnen mit dem KI-gesteuerten adaptiven Einstufungstest von Duolingo, der sie mit realen Übungen überprüft, die sie während des Kurses absolvieren würden. Wenn Sie also vier Jahre lang Französisch in der Oberstufe gelernt haben, müssen Sie in den meisten Fällen nicht ganz am Anfang des Grundkurses beginnen. Jede Frage oder Herausforderung im Test wird adaptiv basierend auf der vorherigen Frage und der Frage, ob Sie sie richtig oder falsch beantwortet haben, ausgewählt.
„Der Schwierigkeitsgrad der Wörter, die Grammatik und die Art und Weise, wie wir sie Ihnen im Test präsentieren, spielen alle eine Rolle bei der Auswahl der genauen Konfiguration. So können wir in weniger als fünf Minuten sehr gut einschätzen, wo Sie den Kurs beginnen werden“, erklärt Burr Settles, Research Director bei Duolingo.
Mithilfe eines Konzepts, das als „verteilte Wiederholung“ bezeichnet wird, ist der Sprachunterricht so konzipiert, dass Benutzer personalisierte Aufgaben in immer längeren Abständen üben. Das hat sich als effektiver erwiesen, als das Pauken in kurzer Zeit.
Mit zunehmender Kompetenz interagieren Sie auf unterschiedliche Weise mit den Inhalten. Duolingo zeichnet beispielsweise für jedes Wort im Lehrplan auf, wie oft Sie es gesehen haben, wie oft Sie es richtig verstanden haben, in welchen Modi Sie es richtig verstanden haben und wie lange es her ist, seit Sie es geübt haben.
„Mithilfe von KI können wir jederzeit die Wahrscheinlichkeit vorhersagen, mit der Sie sich dieses Wort in einem bestimmten Kontext merken können“, erklärt Burr. „Und wir können das einsetzen, was Sie zum Weiterüben benötigen, genau dann, wenn Sie es brauchen.“
„Wir können das einsetzen, was Sie zum Weiterüben benötigen, genau dann, wenn Sie es brauchen.“
Burr Settles
Research Director
Duolingo
„Wir können das einsetzen, was Sie zum Weiterüben benötigen, genau dann, wenn Sie es brauchen.“
Burr Settles
Research Director
Duolingo
Das Lernen hinter dem Lingo
Um diese KI zum Einsatz zu bringen, verwendet Duolingo Deep Learning, eine Untergruppe von KI und Machine Learning, die neuronale Netzwerke verwendet, um das Verhalten des Gehirns nachzuahmen. Somit können Daten schnell analysiert und intelligente Vorhersagen getroffen werden. Mithilfe von Deep-Learning-Algorithmen für die Verarbeitung natürlicher Sprache kann das Unternehmen Benutzerprotokolldaten analysieren, um die Wahrscheinlichkeit vorherzusagen, dass Benutzer eine richtige Antwort erhalten. Diese Vorhersagen sind die Grundlage für die Personalisierung sowohl des adaptiven Lerntests als auch der Inhalte für die Lern-App.
Doch das war nicht von Anfang an so. Das Unternehmen entstand 2009 mit einem Übersetzungsprojekt an der Carnegie Mellon University (CMU) namens Monolingo. Ziel war es, Benutzern eine Fremdsprache beizubringen, indem man sie Dokumente wie Artikel aus Wikipedia oder Nachrichtenseiten übersetzen ließ. Zu dieser Zeit verwendete Monolingo (und sogar das frühe Duolingo) herkömmliche kognitionswissenschaftliche Algorithmen. Basisalgorithmen verwendeten beispielsweise handverlesene Parameter – das heißt, sie lernten nicht unbedingt aus echten Daten. Die Duolingo-Forscher führten A/B-Tests an verschiedenen Ansätzen mit Benutzern durch. Daraufhin war klar, dass für den Grad der Personalisierung, auf den sie abzielten, ausgefeiltere und individuellere Modelle für Machine Learning erforderlich waren.
„Da es sich um sehr maßgeschneiderte Probleme handelt, mussten wir alles von Grund auf neu erfinden“, sagt Burr. „Es ist ein normaler Lebenszyklus für diese Anwendungsfälle, zuerst einen rudimentären kognitiven Ansatz auszuprobieren, um mit der Erfassung von Daten zu beginnen, und diese dann, sobald die Daten vorliegen, mit Deep Learning zu verfeinern.“
Für die Entwicklung dieser benutzerdefinierten Algorithmen (von der Spracherkennung für Nicht-Muttersprachler bis zur Klassifizierung für die automatische Auswertung) verwendet Duolingo das PyTorch Deep Learning Framework in Amazon Web Services (AWS). Diese Deep-Learning-Modelle werden trainiert und dann mithilfe von Hochleistungs-GPU-Instances von Amazon EC2 P3 in der Produktion bereitgestellt. Geschwindigkeit und Skalierbarkeit sind für das Training von entscheidender Bedeutung, da die Modelle je nach Problem zwischen 100 000 und 30 Millionen Datenpunkte gleichzeitig verwenden können, um täglich mehr als 300 Millionen Vorhersagen zu treffen.
„Wir werden ein gleitendes Fenster verwenden, da angesichts der Anzahl der Benutzer, der Tests und der Anzahl der Sprachen bereits zwei Wochen an Daten ausreichen, um unsere Modelle zu trainieren“, sagt Burr. Für die Verwaltung von Datenpipelines für Machine Learning verwendet das Unternehmen Amazon DynamoDB für die Datenverwaltung, Amazon EMR mit Amazon EBS als temporärem Speicher, Amazon S3 für permanenten Speicher und Spark zur Durchführung von Berechnungen für regelmäßige Batch-Vorhersagen.
Um seine Anwendungen zum Leben zu erwecken, verwendet Duolingo Amazon Polly. Dabei handelt es sich um ein auf Deep Learning basierendes Text-to-Speech-Tool, das sich leicht in seine Anwendungen integrieren lässt, um dem Test und zahlreichen Kursen eine Stimme zu verleihen.
Durch den Einsatz dieser Deep-Learning-Tools konnte das Unternehmen sowohl die Voraussagegenauigkeit als auch die Benutzereinbindung verbessern. Die Anzahl der Benutzer, die Duolingo nutzten und am zweiten Tag zurückkamen, verbesserte sich sofort um 12 Prozent.
Burr und das Duolingo-Team testen weiterhin neue Möglichkeiten mit Deep Learning und untersuchen Modelle für Testsicherheit, Betrugserkennung, Biometrie und das Verständnis von Kontexten. Es kann beispielsweise sein, dass Sie eine Frage falsch beantworten, aber warum Sie sie falsch beantwortet haben, ist nicht so klar. Haben Sie sie falsch beantwortet, weil Sie das Wort vergessen haben? Oder vielleicht haben Sie es falsch konjugiert.
„Aus dem Signal, das wir zurückerhalten, ist nicht immer klar, was die Ursache war“, sagt Burr. „Es gibt noch viel KI zu erarbeiten.“
Da Duolingo sein Sprachangebot mithilfe von Deep Learning verbessert, ist es möglich, dass Sie mindestens ein Ziel Ihrer Neujahrsvorsätze erreichen können.