Text-To-Speech-Synthesis - Vorlesen für Alle!

Synthetische Stimmen werden immer besser, automatisches Roboter-Vorlesen als Standard-Feature.

⛶  Fullscreen ↓  Download

Online-Lesen ist toll. Es ist aber mit signifikanten Barrieren verbunden. Von Textgrösse zu Navigation, viele Faktoren können die Zugänglichkeit des Contents für viele erschweren. Audio kann viele dieser Probleme lösen. Aber nicht nur wegen Barrierefreiheit ist Audio interessant, viele Nuter:innen äussern den Wunsch in gewissen Situationen - und vor allem längere Beiträge - auch mal hören zu können.

Zwar haben je länger je mehr Betriebssysteme und Browser eigene Vorlese-Funktionen - diese sind aber oft nicht sonderlich ansprechend und Verlangen gute Accessibility-Implementierungen. Es gibt Kompatibilitätsprobleme mit Reader-Ansichten einzelner Browser. Alle Beiträge professionell vorlesen zu lassen, wäre zu teuer.

Wie können auch kleinere Medien ein solches Feature anbieten?

In der Challenge werden gegenwärtige open-source Lösungen recherchiert und / oder eigene Lösungen zu skizzieret. Das Ziel ist ein einfaches, flexibles Modul, welches HTML parsed und anbieterunabhängig mit Text-To-Speech API's verknüpft werden kann (z.B. https://azure.microsoft.com/de-de/services/cognitive-services/text-to-speech/#features).

Verantwortlich: Olivier

Text-To-Speech Experiments for Rethink Journalism Hackathon 2021

Goals

  • Transforms HTML to SSML
  • Uses the Mircosoft Speech SDK for JavaScript on Node.js.

Prerequisits

Install

  • run npm install to install the dependencies.
  • Copy .env.exampleto .envand add the Azure SubscriptionKey.

Get a text sample from a URL

Example for netzpolitik.org: ./any-to-ssml.sh https://netzpolitik.org/2021/netzdg-novelle-mehr-rechte-fuer-nutzerinnen-nur-auf-schmalem-meldeweg/ > ssml.xml

Example for republik: ./any-to-ssml.sh https://www.republik.ch/2021/05/06/der-glaeserne-gast/ > ssml.xml

Example for woz: ./any-to-ssml.sh https://www.woz.ch/2118/auf-allen-kanaelen/auslaendische-agenten > ssml.xml

Run the sample

  • Add your text into ssml.xml
  • Run node index.js

This will create a file named YourAudioFile.wavin the folder.

References

This content is a preview from an external site.
 

Event finish

Repository updated

3 years ago ~ loleg

Edited

3 years ago ~ iovi

Start

Joined the team

3 years ago ~ iovi

Challenge shared
Tap here to review.

3 years ago ~ iovi
 
Contributed 3 years ago by iovi for Rethink Journalism Hackathon

#opendatach

All attendees, sponsors, partners, volunteers and staff at our hackathon are required to agree with the Hack Code of Conduct. Organisers will enforce this code throughout the event. We expect cooperation from all participants to ensure a safe environment for everybody. For more details on how the event is run, see the Guidelines on our wiki.

Creative Commons LicenceThe contents of this website, unless otherwise stated, are licensed under a Creative Commons Attribution 4.0 International License.