Donnerstag, 9. September 2021

Schrecklicher Verdacht: Spitzenkandidatin ein Sprachassistent?

Die Bitterfelder Gebärdendolmetscherin Frauke Hahnwech gilt als eine der führenden Koryphäen ihres Faches, sie hat bereits für die Uno, die WHO, das IPPC und Martin Schulz gearbeitet und ihre Expertise vor allem zu unterhaltenden politischen Botschaften eingebracht, die sich im gedruckten Wort häufig unter Adjektivattacken und hinter zusammengesetzten Subversiven versteckt. Hahnwech, eine intime Kennerin der Berliner Bühne, übersetzt traditionell wegweisende EU-Papiere etwa zur "Just-Transition-Strategy", aber auch Formulierungen aus der Bundesworthülsenfabrik, die auf den Gebrauch im politischen Alltagsgeschäft zielen. Hahnwech hat in Lyon und Klagenfurt Körpersprache studiert, sie versteht sich jedoch auch auf Simultanübersetzungen aus dem Propagandistischen. Gemeinsam mit dem Kryptiker Alexander Langenbach ist die alleinerziehende Wahlskeptikerin jetzt einem ungeheuerlichen Verdacht nachgegangen, der dem Wahlkampf ums Kanzleramt noch einmal neuen Schwung geben könnte.  

PPQ.li-Reporterin Svenja Prantl hat mit Hahnwech über Künstliche Intelligenz, Sprachsteuerungsalgorithmen und verräterische Muster in der Sprachmelodie gesprochen.

PPQli: Frau Hahnwech, Sie haben sich an uns gewandt, weil Sie, wie Sie sagten, mit einer Erkenntnis nicht mehr leben können, von der sie glauben, dass sie vielleicht ungeheuerlich ist, von der Sie aber nicht schlüssig nachweisen können, ob sie wirklich zutrifft. Sie sprachen von "Seelenpein" - erklären Sie es uns.

Hahnwech: Es geht um ein paar einfache Beobachtungen, die ich als erfahrene Gestalttrainerin, Gebärdendolmetscherin und Kennerin auch der aktuellen technischen Möglichkeiten im Bereich Künstlicher Intelligenz in den zurückliegenden Monaten gemacht habe, ja, machen musste, denn wenn Sie seit Jahrzehnten mit Leib und Seele und vollem Herzen aus dem Politischen und aus dem Propagandistischen ins Deutsche übersetzen, Körpersprache lesen und in Wahlkämpfen schon so manche Angst gerochen und so manchen Trick aufgedeckt haben, dann reagiert ihr Körper reflexhaft auf Regelabweichungen, Musterbrüche und dergleichen.

PPQ.li: Das ging Ihnen diesmal wann so?

Hahnwech: Ich glaube, dass ich sagen kann, dass der Verdacht, den ich mit meinem KollegIn Alexander Langenbach, einer Kybernetiker vom An-Institut für angewandte Entropie bei der Bundeskulturstiftung in Cottbus, ja inzwischen auch geprüft habe, mir wohl schon vor Monaten kam. Das war, ich erinnere mich genau, beim Grünen-Parteitag, auf dem Annalena Baerbock zum Finale ihre vielbeachtete "Sch...."-Rede hielt. Ich muss jedoch gestehen, dass ich damals alles verdrängt habe, was sich mir aufdrängte. Ich hielt den Gedanken einfach für zu ungeheuerlich.

PPQ.li: Sie machen mich, aber Sie machen sicherlich auch unsere Leserinnen, Leser und Mitlesenden neugierig. Worum geht es?

Hahnwech: Nun, dazu muss ich erklären, wie Sprache funktioniert: Es geht dabei nie nur um Worte, Reihungen und Inhalte, sondern immer vor allem um Sprachmelodien, Rhythmus und Betonung. Sie können, um ein Beispiel aus dem Deutschen zu nennen, "Guten Morgen" auf unendlich viele Arten und Weisen sagen. Das kann eine Begrüßung sein, eine Beleidigung, eine Mahnung... alles. Im menschlichen Hirn wird das übersetzt, indem Inhalt und Darbietungsrat mit Mustern abgeglichen werden, die im Laufe der Lebenserfahrungsgewinnung eingeprägt wurden. Das ist wie bei einer Schallplatte und einer Abtastnadel, ein Ton erklingt und wenn Sie eine Resonanz verspüren, dann ist es derselbe Ton.

Frauke Hahnwech.

PPQ.li:
Was hat das aber mit dem engagierten Wahlkampf von Frau Baerbock zu tun?

Hahnwech: Das ist es ja: Ich habe von der professionellen Seite her anfangs eigentlich bewundert, wie beim Design der Kandidatin auch darauf geachtet worden ist, die Stimmlage auf den alarmistischen Inhalt abzustimmen. Wir müssen etwas tun, wir müssen handeln, Alarm, letzte Chance, die Welt geht unter, Frauen und Kinder in die Boote - das sind Mitteilungen, da erwartet der Empfänger, dass sie in einem schrillen, sehr obertonreichen Diskant hervorgebracht werden. Das ist bei Frau Baerbock bekanntlich gegeben, sie beherrscht dieses Sirenenhafte, dieses Aufgeregte sehr gut. Aber die Frage ist eben: Tut Sie das wirklich?

PPQ.li: Sie haben Zweifel?

Hahnwech: Sehr ernste. ich bin unwillkürlich, also ohne Forschungsauftrag von dritter Seite, darauf gestoßen. Eine deformation professionelle: Man hört und analysiert in meinem Beruf automatisch. Und bei Annalena Baerbock fiel mir auf, dass es keine natürliche Sprachmelodie in ihren Reden, in Interviews oder Wortmeldungen gibt. Vielmehr wirkt die Intonation künstlich. Das weckte in mir einen schlimmen Verdacht.

PPQ.li: Sie haben uns im Vorgespräch erzählt, dass Sie ein wenig fürchten, damit an die Öffentlichkeit zu gehen?

Hahnwech: Es sind für freie Gebärdenübersetzer wie mich keine leichten Zeiten. Wir leben von öffentlichen Aufträgen, fallen die weg, bleibt nur noch die Coronahilfe. Aber ich bin auch Staatsbürgerin und als solche verpflichtet, nicht zu schweigen.

PPQ.li: Sprechen Sie.

Hahnwech: Es geht um Sprachsteuerung, um künstliche Intelligenz und zwar hochentwickelte Systeme zur Simulation menschlicher Ausdrucksweise, aber eben nur so hoch, dass der normale Bürger*in auf der Straße darauf hereinfällt. Wenn ich Annalena Baerbock zuhöre, und ich habe in den zurückliegenden Wochen 712 Stunden akribisch zugehört, dann entdecke ich unendlich viele Hinweise auf kybernetische Systeme: Eine Betonung von völliger Beliebigkeit, eine Sprachmelodie, bei der in der Regel jedes Satzende einzeln nach oben gezogen wird, und einen Flickenteppich aus einzelnen Phonemen, die bei genauerer Betrachtung an eine weiterentwickelte Sprachassistentin wie die amerikanischen Alexa- und Cortana-Systeme denken lassen.

PPQ.li: Frau Hahnwech, Sie glauben nicht wirklich, dass Frau Baerbock eine Sprachassistentin ist?

Hahnwech: Das weiß ich nicht. Aber die Imitation menschlicher Stimmen ist keine Raketentechnik mehr. Die dafür notwendige Software ist allgemein verfügbar. Zusammen mit Herrn Langenbach konnten wir im Experiment nachweisen, dass sich mit einer überzeugenden digital Stimme alles machen lässt, was Frau Baerbock macht. Heutige Stimm-Synthesizer sprechen ja nicht  mehr offenkundig roboterhaft, sondern schon mit einer gewissen Geschmeidigkeit. Die gesprochenen Wörter werden in Echtzeit aus Phonemen zusammengesetzt, die blitzschnell abgerufen werden können. Wir denken, dass vieles darauf hindeutet, dass das bei Frau Baerbock so gemacht wird.

PPQ.li: Nach der Fälschung eines Buches nun die Fälschung einer Rednerin - wäre das denn verboten? 

Hahnwech: Ich glaube nicht, dass herkömmliche Methoden der Sprachsynthese, wir sagen "Software Automatic Mouth", gegen irgendwelche Wahlkampfregeln verstoßen. Sprachsynthesizer sind da gar nicht erfasst, weil der Gesetzgeber das Problem nicht sieht. Aber die künstlichen Stimmen begleiten uns heute natürlich überall, im Navi, bei den häuslichen Assistenten, beim Handy. Diese künstlichen Stimmen haben gemeinsam, dass sie möglichst generisch klingen sollen, dabei aber gemeinsam haben, dass sie über die Hürde der menschlichen Betonung nicht hinwegkommen. Ein "Guten Morgen" aus einer zusammengestückelten Sprachausgabe klingt eben monothematisch, es ist ein Wunsch, einen guten Morgen zu haben. Die Machine-Learning-Systeme stoßen hörbar hier an ihre Grenze.

PPQ.li: Und Sie sagen, diese Hörbarkeit ist bei Frau Baerbock gegeben?

Hahnwech: Sie klingt zumindest, als arbeite sie mit einer vorproduzierten Stimme. Da ist aus meiner professionellen Sicht mit umfangreichen Audioaufnahmen eine Person trainiert worden, die nun bei der Sprachausgabe Phoneme aneinanderreiht, die dann Sätze wie "Die Sonne schickt keine Rechnung", "Grün bedeutet Gerechtigkeit" oder "es gibt genug Energie, wir müssen sie nur nutzen" hervorbringt. Unabhängig vom jeweiligen Kontexten klingen die einzelnen Bausteine immer gleich: Hinten im Satz geht die Lautstärke hoch, die Geschwindigkeit runter und die Tonhöhe steigt. Kurz gesagt: Eine geklonte Stimme, die recht überzeugend wirkt, aber das typische Unwohlsein beim Zuhörer erzeugt, das sogenannte "Custom Neural Voices" immer mit sich bringen.

PPQ.li: Wieso das?

Hahnwech: Der Mensch spürt, dass eine Maschine zu ihm sprich. Wie eine Katze, der man ein Stück Apfel hinwirft - sie muss nicht schnuppern, sie weiß, dass das weder Käse noch Wurst ist. Eine Kanzlerkandidatin aus der Cloud funktioniert ähnlich, denke ich, obwohl uns da noch wissenschaftliche Erkenntnisse fehlen. Doch Endanwender haben uns gegenüber von Unwohlsein, Genervtheit und plötzlicher Unkonzentriertheit berichtet. Da müssen wir noch weiter forschen, das gebe ich zu.

PPQ.li: Ich muss Ihnen gestehen, dass ich als ganz normale Frau nie auf die Idee gekommen wäre, dass ich bei Frau Baerbock etwas anderes höre als einen Menschen, der nicht unbedingt sehr redebegabt ist. Könnte nicht auch das der Grund sein, dass man sich ein bisschen fremdschämt beim Zuhören?

Hahnwech: Ich sage ja nicht, dass es um Stimmdiebstahl geht, dass zwingend eine geklonte Stimme zum Einsatz kommt. Aber schauen Sie mal: Es gibt in unserem Fall fast nie ein Räuspern und überhaupt keine Störgeräusche! es wird auf geheimnisvolle Weise, auf unnatürliche Weise wie gedruckt gesprochen, und das eben mit dem Chatbot-Effekt der intrinsischen Gefangenheit der Stimme in einzelnen Sätzen, die nach einem Algorithmus aus dem Würfelbecher ihre Betonung finden.


11 Kommentare:

Die Anmerkung hat gesagt…

Oha. Es fehlt der Hinweis. Das hieße ja, Svenja ist jetzt verwandt oder verschwägert. Oder könnte es zumindest sein.

Anonym hat gesagt…

Sorry, da liegt ihr ausnahmsweise völlig falsch. Annalena Baerbock ist eine Waschmaschine.

https://www.kostenlosonlinelesen.net/kostenlose-die-waschmaschinentragoedie

Anonym hat gesagt…

-die-waschmaschinentragoedie ...


Herrlich Erinnerungen an die Jugendzeit. --- unter dem Vorwand, sich gemeinsam Briefmarken anzusehen ... und beging an ihnen perverse Handlungen ...

Ja, Phantasie haben (((die))) für zehn. Auch Leo Perutz, Primo Levi ...

Anonym hat gesagt…

Anna-Lehner eine Politböttin ?

würde mich nicht überraschen

Anonym hat gesagt…

So schlecht ist KI heute nicht mehr. Und 'n Autoencoder, der Grünsprech produziert, sollte die Grafikkarten kaum beim Minen stören.

Anonym hat gesagt…

https://www.youtube.com/watch?v=ft0vkKCadgk&t=122s

Sprachpolitik : usa for ever auf allen Kanälen .Ab 11.9 : kollektives Weinen . die tobende Großmacht hat kassiert . nicht viel . zwei Türme . ist wie Schach - zwei Türme sind weg - neues Spiel , neues Pech ; Fluten , brennende Ghettos , rabiate Negerburschen , in Europa : ganz liebe SprachassistentInnen erläutern"" die pol. Realität. Das dumme Importmädchen ausm Balkan erklärt dem Hauptmann der Reserve die Welt . ("kulturzeit")

ich lach mich schlapp .

ohne weiße Männer kein Nagel in der Wand - geschweige denn Krieg dem Terror - dann immer wieder Merkel . dazu die Intelligenznegerin mit Mikro - sie rollt die Augen wie eine Maischberger - aber : da kommt nur dummes Zeug ausm Negermund .

20 Jahre nein älleven .

wir sagen :nein älleven .


Anonym hat gesagt…

https://www.youtube.com/watch?v=M3f-JwOGO1A&list=RDGMEMJQXQAmqrnmK1SEjY_rKBGA&start_radio=1

mein Sprachassistent spricht wie Kraftwerk.

Anonym hat gesagt…

Naja, künstliche Intellijenz. Gugel tränsläht übersetzt penetrant Arsch mit Esel, Frühling mit Quelle, und ümgekiehrt, auch dann, wenn man primär in ganz anderen Sprachen unterweg war. Oder lane als Fahrspur mit plane als Fläche, usw.usw.

Anonym hat gesagt…

>> Nuada 9. September 2021 at 14:05

@lorbas 9. September 2021 at 13:15

„Durch die Aufspaltung der Wähler in das politische Parteiensystem, können wir sie dazu bringen ihre Energie für Kämpfe aufzubrauchen, für Fragen die keinerlei Bedeutung haben….“
Montagu Norman, Gouverneur der Bank von England 1920 bis 1944, bei einer Ansprache vor der Bankiersveranstaltung der Vereinigten Staaten von Amerika in New York 1924

Sehr interessantes Zitat.
Es ist vielleicht kein Fehler, sich einmal Gedanken zu machen, welche Fragen ein Gouvrneur der Bank of England stattdessen für bedeutsam halten könnte. Vielleicht SIND die es ja sogar wirklich? <<
------------------------------------------------------------------------------------

Wohl wahr. But it will never catch on.

Anonym hat gesagt…

Wenn dem so wäre, dann versteh ich nicht, warum ihr dauernd so viele Fehler bei der Aussprache unterlaufen (gebaerbockt)? ein bot würde das ja wohl richtig hinbekommen oder?

ppq hat gesagt…

du hast keine alexa