Aiko – App für KI unterstützte Transkription

Dies ist ein Studierendenbeitrag von Manuel Juon aus dem Modul Medien & Informatik im HS 2024.

Aiko ist eine Transkriptions-App, die Sprache in Text umwandelt und dabei das Whisper-Modell von OpenAI nutzt. Die App verarbeitet Audio in 100 verschiedenen Sprachen und führt alle Transkriptionen direkt auf dem Gerät aus. Dadurch ist Privatsphäre für sensible Aufnahmen gewährleistet. (Sorhus, 2024)

Aiko bietet deutlich bessere Genauigkeit als die integrierte Transkription auf Apple-Geräten und ermöglicht zusätzlich das Transkribieren von Audio- und Videodateien. Die App steht im Apple Appstore gratis zur Verfügung. Sie ist sehr übersichtlich und einfach gestaltet, wodurch sich die App im Einsatz auch bei Schülerinnen und Schülern mit Lernschwierigkeiten oder bei jüngeren Kindern bewährt.

Beispielsweise gelingt es mit Aiko Lernenden mit einer Rechtschreibschwäche, fehlerfreie Versionen ihrer Originaltexte zu produzieren. Oft ist das Verfassen einer Reinschrift besonders bei Texten mit vielen Korrekturen ein sehr mühsamer Prozess, bei dem sich auch beim Abschreiben der von der Lehrperson korrigierten Texte Fehler einschleichen.

Kinder lesen nach dem Üben ihren Text in Abschnitten Aiko vor und kopieren den erzeugten Text in ein neues Dokument. So kann individuell auf die Stärken und Schwächen Rücksicht genommen werden. Durch dieses adaptive Lernsystem gelingt es auch Kindern mit Schwierigkeiten in diesem Bereich, wie von Sabitzer et al. (2024) beschrieben, zum persönlichen Produkt auf Stand der Klasse zu kommen.

Besonders der Prozess des kritischen Prüfens der auf KI basierenden Produkte lässt sich an diesem Beispiel sehr leicht und niederschwellig üben. Nach der erfolgreichen Transkription muss der generierte Text nochmals gelesen und mit dem Original beziehungsweise mit der eigenen Vorstellung des Texts abgeglichen werden. Dabei fallen auch schwächeren Kindern rasch Fehler und Unterschiede auf.

Persönliche Erfahrungen:

  • Nebengeräusche werden gut ignoriert (muss nicht in einem stillen Raum aufgenommen werden)
  • sehr leichte Handhabung
  • Satzzeichen (v.a. Anführungszeichen) oft mangelhaft
  • Namen werden teils nicht verstanden

Einteilung in Abschnitte sehr lohnenswert, sowohl zum Vorlesen als auch beim Überprüfen (evtl. mit Unterstützung durch LP). Je nach Zielen und Umfang des Projekts kann der eigene Text und die Transkription zum Lerngegenstand gemacht werden. In einer 6. Klasse hat sich beispielsweise bewährt, dass die Schülerinnen und Schüler für sie relevante Wörter markiert haben, die die KI anders geschrieben hat als sie. Bei diesen persönlichen Lernwörtern kann auf die korrekte Rechtschreibung eingegangen werden. Beispielsweise können sie anschliessend in die persönliche Sammlung des Schabi-Lernwörtertrainings aufgenommen und dort mit einem von KI generierten Satz und Audiofile ergänzt werden.

Das Bild zeigt eine bebilderte Schritt für Schritt-Anleitung: 1. Öffne "Aiko". Beginne mit der Aufnahme. 2. Mache nach jedem Abschnitt eine Pause. 3. Die Aufnahme wird in Text umgewandelt. 4. Warte kurz. Dein Text wird erstellt. 5. Kopiere deinen Text. Öffne "Notizen". 6. Füge deinen Text ein. Lies ihn durch: Umbrüche vorhanden? Text vollständig? 7. Drucke deinen Text im Schulzimmer aus.
Schritt-für-Schritt-Anleitung für die Schüler und Schülerinnen

Technische Details

Auf macOS verwendet Aiko das Whisper large v2 Modell, während auf iOS aufgrund von Speicherbeschränkungen das medium oder small Modell zum Einsatz kommt.

Die App unterstützt verschiedene Audio- und Videoformate wie .m4a, .wav, .mp3, .mp4 und .mov. Zudem ermöglicht die App das direkte Aufnehmen. Simultantranskription ist aktuell (noch) nicht möglich. (Sorhus, 2024)

Funktionen

  • Lokale Verarbeitung: Alle Audiodaten werden direkt auf dem Gerät verarbeitet
  • Sprachunterstützung: Unterstützung für 100 verschiedene Sprachen
  • Exportformate: Möglichkeit zum Export in verschiedene Formate wie JSON, CSV und Untertitel
  • Shortcuts-Integration: Unterstützung für iOS/macOS Shortcuts zur Automation
    (Sorhus, 2024)

Literaturverzeichnis:

Sorhus, S. (2024). Aiko. https://sindresorhus.com/aiko (Abgerufen am 29.11.2024)

Sabitzer, B., Hörmann, C. & Kuka, L. (2024). Künstliche Intelligenz (KI) in der Bildung – Ein Kinderspiel?. Medienimpulse62(3). https://doi.org/10.21243/mi-03-24-22

Vorheriger Beitrag Nächster Beitrag