Warum Amazon Polly ein potentieller Wendepunkt für die Verlagsbranche ist

Esra Celebi

Die Art und Weise, wie Nutzer mit Inhalten interagieren, verändert sich. Wir befinden uns mitten in einem Paradigmenwechsel. Denn schon jetzt konsumieren Nutzer mehr Video- und Audioinhalte als Text. Eine der spannendsten Entwicklungen ist Text-to-Speech.

Die Art und Weise, wie Nutzer mit Inhalten interagieren, verändert sich. Wir befinden uns mitten in einem Paradigmenwechsel. Denn schon jetzt konsumieren Nutzer mehr Video- und Audioinhalte als Text. Eine der spannendsten Entwicklungen ist Text-to-Speech.

Dabei ist Text-to-Speech nicht gerade eine neue Technologie. Text-to-Speech gibt es schon seit mehr als zwei Jahrzehnten. Der langersehnte Durchbruch blieb jedoch aus, da es bis dato noch keine natürliche und realistische Modulation gab.

Nutzer sehen das genauso. So sind beispielsweise Nachrichten auf Smart Speakern nicht sehr beliebt, weil sie auf künstliche Stimmen angewiesen sind.

Jedoch hat die Text-to-Speech-Technologie aufgrund eines bestimmten Unternehmens einen großen Sprung nach vorne gemacht: Dieses Unternehmen heißt Amazon.

Amazon Polly verändert alles, weil es beim Vorlesen von Texten endlich nah an den Klang der menschlichen Stimme herankommt. Kleine und große Verlage sollten Amazon Polly Beachtung schenken, da es ihnen viele spannende Möglichkeiten bietet.


Warum Audio eine große Chance für Verlage ist

Im Vergleich zu anderen Branchen neigen Verlage dazu, Trends etwas zeitverzögerter zu entdecken. Laut Paul DeHart, dem CEO von Blue Toad, „entwickeln sich Verlage langsam zu Medienunternehmen“. Im heutigen Umfeld müssen Verlage „weiterhin neue Wege gehen, um Inhalte zu erstellen und an ihre Leser zu liefern“.

Eine dieser neuen, aufregenden Möglichkeiten, Inhalte bereitzustellen, ist Audio. Laut einer aktuellen Studie von Infinite Dial konsumieren US-Nutzer durchschnittlich 17 Stunden Audio pro Woche.

Average time spend listening to audio according to a infinite dial study

Ja, es wird den Text- oder Videokonsum nicht sofort überholen. Es stellt jedoch eine bequeme Möglichkeit für Nutzer dar, Inhalte überall zu konsumieren. Einer der spannendsten Trends im Audiobereich ist der Aufstieg von intelligenten Lautsprechern.

Laut einem Bericht des Reuters Institute mit dem Titel The Future of Voice and the Implications for News wachsen sprachaktivierte Lautsprecher wie Amazon Alexa und Google Assistant schneller als Smartphones und Tablets zuvor in einem ähnlichen Stadium. Auch der Einsatz von Smart Speakern in den USA, Großbritannien und Deutschland hat sich im vergangenen Jahr etwa verdoppelt.

“Voice könnte in Zukunft zu einem wichtigen Portal für Medien werden.”

Nic Newman, Senior Research Associate am Reuters Institute

Verlage haben dabei natürlich auch Monetarisierungsstrategien für Audio im Blick. Ein Weg könnte darin bestehen, zu Beginn des Hörerlebnisses eine Sponsorennachricht einzubauen. Solch eine 15 oder 30 Sekunden lange Anzeige könnte ein schneller und einfacher Weg sein, um mit Audioinhalten Geld zu verdienen.



Amazon Polly: Was ist so besonders?

Voice ist also ist ein Werkzeug, das für Verlage immer wichtiger wird. Einige Nutzer waren jedoch gegenüber der Text-to-Speech-Technologie bisher zurückhaltend, weil die pseudo-menschliche Stimme völlig unmenschlich schien. Bisher waren die Hörerlebnisse nämlich überhaupt nicht angenehm.

Amazon Polly ist die spannendste Entwicklung im Bereich Text-to-Speech. Amazon Polly, so schreibt das Unternehmen selbst, „ist ein Text-to-Speech-Service, der Text durch Deep Learning in lebensechte Sprache verwandelt.“ Im Wesentlichen handelt es sich bei  TTS um die Erzeugung von künstlicher Sprache aus Text.

Es ermöglicht Benutzern, einschließlich Verlagen, „Anwendungen zu erstellen, die sprechen, und völlig neue Kategorien von sprechfähigen Produkten zu entwickeln“. Amazon bietet Dutzende von lebensechten Stimmen in verschiedenen Sprachen. Dazu gehören Englisch, Dänisch, Französisch, Japanisch, Spanisch und sogar Mandarin.

Languages that are included in Amazon Polly

Neben den Standard-TTS-Stimmen hat Amazon Polly aber auch zwei neue Funktionen. Sie zeigen die großen Fortschritte in der Text-to-Speech-Technologie.



#1 Neural Text-to-Speech (NTTS)

Die erste ist Neural Text-to-Speech (NTTS). NTTS bietet fortschrittliche Verbesserungen in der Sprachqualität, indem es die Unterschiede in Sprechstilen versteht und somit Sprache ausdrucksstark und lebensecht wirken lässt.

NTTS lernt zu sprechen, indem es aufgezeichnete menschliche Sprache hört und sie dann kopiert. Im Grunde genommen ist das Tool so konzipiert, dass es das Sprechen genauso erlernt, wie es Kinder tun.

Laut Julien Simon, dem Global Tech Chief Evangelisten bei Amazon, ist NTTS ein wahrer Wendepunkt, „weil es Natürlichkeit und Ausdruckskraft erhöht„. Es bringt uns automatisierten Stimmen, die wie echte Menschen klingen, immer näher.

Derzeit ist NTTS für elf Stimmen verfügbar, die U.S. und U.K. Englisch unterstützen.



#2 Newscaster Style

Amazon Polly hat mit seinem sogenannten Newscaster Stil (auf deutsch Nachrichtensprecher-Stil) einen großen Schritt nach vorne gemacht.


Falls Sie direkt in ein Beispiel reinhören möchten:

Amazon Polly’s NTTS unterstützt einen Vorlese-Stil, der auf verschiedene Typen von Erzählungen zugeschnitten ist. Dies ist perfekt für Verlage, die nach neuen Arten der Präsentation ihrer Inhalte suchen.

Amazon Polly’s Newscaster-Stil lässt Erzählungen sehr realistisch klingen. Er ist so fortschrittlich, dass die Stimme moduliert wird, je nachdem, ob eine Nachrichtensendung, eine Sportsendung oder sogar eine College-Vorlesung vorgelesen wird.

Amazon Polly Nutzer können auch die Vorteile von Amazon Translate nutzen. Diese zwei Programme, die zusammenarbeiten, übersetzen die Inhalte der Verlage in die bevorzugte Sprache des Nutzers. Was bedeutet das für Sie? Sie können Ihre Inhalte so einem viel größeren Publikum zugänglich machen.



Welche Verlage nutzen Amazon Polly bereits?

Amazon Polly ist extrem spannend für große und kleine Verlage gleichermaßen.

Obwohl die Technologie noch sehr jung ist, verwenden einige Pioniere Amazon Polly bereits. Einige dieser Verlage sind Gannett, The Globe and Mail, Ringier, Success Magazine, TIM Media, Encyclopedia Britannica und CommonLit.



Audio Now von The Globe and Mail

The Globe and Mail ist eine der meistgelesenen Print- und Digitalzeitungen Kanadas. The Globe and Mail hat Amazon Polly insbesondere dazu genutzt, um die Kundenbindung zu erhöhen.

Laut Greg Doufas, dem Chief Technical and Digital Officer bei The Globe and Mail, hat die Zeitung Amazon Polly genutzt, um Nutzern zu helfen, besseren Zugang zum preisgekrönten Journalismus von The Globe and Mail zu erhalten.

Das hauseigene Produkt heißt Audio Now und nutzt den Amazon Polly Newscaster. Laut Doufas ist Audio Now ein Novum für Kanada.

The-Globe-and-Mail-Leser können auf Audio Now zugreifen, indem sie einfach auf einen Artikel klicken, der sie interessiert. Da Kanada ein mehrsprachiges Land ist, bietet The Globe and Mail Audio Now auf Englisch und Französisch (männlich und weiblich) an.

Die Zeitung zieht ein weltweites Publikum an. Die Artikel können sogar auf Mandarinvorgelesen werden. Audio Now von The Globe and Mail ist ein Vorreiter. Es verändert jetzt schon die Art und Weise, wie The-Globe-and-Mail-Leser Inhalte konsumieren.



Gannett setzt Amazon Polly ein

Neben The Globe and Mail setzt Gannett Amazon Polly ein.

„Dienste wie Amazon Polly und die Newscaster-Stimme helfen uns, aktuelle und originelle Nachrichten schnell und seriös zu liefern, so wie es unserer Marke entspricht“.

Scott Stein, VP of Content Ventures bei Gannett

Amazon Polly in der Welt der Nachrichten extrem nützlich: Mit den sich sekundenschnell ändernden Nachrichten haben Journalisten einfach nicht die Zeit, in eine Aufnahmekabine zu gehen und ein Voiceover eines Artikels aufzunehmen.

Mit Amazon Polly verändert sich die Situation. Durch die Verwendung von Amazon Polly können Journalisten mehr Zeit mit der eigentlichen Berichterstattung verbringen und müssen trotzdem nicht auf ein Audioformat ihrer Artikel verzichten.



Fazit

Wir befinden uns noch in den Anfängen von Technologien wie Amazon Polly. Daher ist es sehr wahrscheinlich, dass noch mehr Innovationen vor uns liegen.

Ich glaube, dass es sich jetzt schon lohnt, Amazon Polly zu testen. Audio ist eine bewährte Art, Inhalte zu konsumieren. Ob wir zur Arbeit pendeln oder einfach nur einen entspannten Abend zu Hause genießen, Audio bietet eine großartige Möglichkeit, sich bei all diesen alltäglichen Dingen unterhalten zu lassen.

Der Konsum von Audioinhalten nimmt stetig zu. Dieser Trend wird sich noch einige Zeit fortsetzen. Was ist also das Fazit? Ganz einfach. Audio als Publikationskanal ist nicht wegzudenken. Audio ist hier, um zu bleiben. Deshalb sollten Verlage diesen Kanal unbedingt ernst nehmen.

Nicht sicher, ob Purple zu Ihnen passt?

Oder Sie haben individuelle Anforderungen?
Wir beraten Sie gerne.
Kevin Kallenbach
Head of Sales