Open-source speech recognition and text-to-speech potentially usable with the Poppy robots

Hi there,
Here a feedback from IntRoLab (university of Sherbrooke) : Interaction homme-robot par la voix : on se comprend mon ami ! http://cursus.edu/dossiers-articles/articles/27285/interaction-homme-robot-par-voix-comprend/

They have used : (open source)

and non open source :
Google speech API

More information about open source component used can be found in https://introlab.3it.usherbrooke.ca/mediawiki-introlab/index.php/ManyEars

1 Like

Hi there,

meSpeak.js is a Text-To-Speech solution on the Web ."speak.js is 100% clientside JavaScript. “speak.js” is a port of eSpeak, an open source speech synthesizer, which was compiled from C++ to JavaScript using Emscripten."
The project is under GPL. (thanks to Johann, who have quoted about meSpeak.js on a framapad, Johann makes nice open source SVG tests for children, including programming http://jlodb.poufpoufproduction.fr/tibibo.html?id=prog )

French is available. It’s look like “robot voice”, but as it’s used for robot, it’s maybe not a big problem.

Do you think it’s could be interesting for Poppy robots ?

And easily usable with ardiuno+wifi or nodemcu ?

Article published today about MyCroft, by Ubuntu team https://insights.ubuntu.com/2016/07/07/mycroft-the-open-source-answer-to-natural-language-platforms/

Very interesting the Mycroft project !!
Here is the community
Here is the code !!

Navigating in the forum, I also saw the very sexy AI samurai
But it seems to be NOT open source.

1 Like

Hello,

Top 5 Open Source Speech Recognition Toolkits : http://blog.neospeech.com/2016/07/08/top-5-open-source-speech-recognition-toolkits/ (thanks to guildem to share it in http://linuxfr.org/nodes/110556/comments/1682139 )

1 Like

And here the solutions mentioned in the wiki for kalliope (https://www.youtube.com/watch?v=t4J42yO2rkM amazing - : http://linuxfr.org/news/kalliope-votre-assistant-personnel-vocal )

Hello,

On Kalliope, votre assistant personnel vocal - LinuxFr.org, Sylvain Chevalier talk about http://kaldi-asr.org/ :

Depuis dĂ©jĂ  plusieurs annĂ©es, le “standard” pour la reconnaissance vocale libre c’est kaldi,
en particulier grñce à ses modules pour l’apprentissage profond (Deep
Learning en anglais, d’ailleurs en passant je trouve le concept de
“neuron” pas bien choisi pour un projet dans ce domaine, oĂč les “neural
nets” sont partout). La plupart des systùmes commerciaux l’utilisent.

Someone has already tried it for speech recognition ?

Bonsoir,
Je viens de m’inscrire ici.
A ce sujet, j’utilise la reconnaissance vocale avec Snowboy (sur Pcduino et odroid x4) c’est du python,
https://snowboy.kitt.ai/
Ca marche plutĂŽt bien.
Amusez-vous bien

kookic

ça n’a pas l’air open source, non ? on cherche à mutualiser sur des solutions open source


exact, mais pour moi c’est “version free”

Mycroft : nouveau financement collaboratif, avec la part belle Ă  l’open source pour les technos, oĂč les solutions retenues sont mis en avant dans la campagne. En anglais. Une version open source gĂ©rant le français sera-t-elle portĂ©e par la communautĂ© en Ă©tant catalysĂ© par ce nouveau modĂšle de Mycroft ? Ă  suivre
 https://www.kickstarter.com/projects/aiforeveryone/mycroft-mark-ii-the-open-voice-assistant

Sur primtux, Stéphane parle de gspeech pour du TTS : https://forum.primtux.fr/viewtopic.php?pid=14553#p14553 : https://github.com/lusum/gSpeech

Philippe nous indique “AccessDV Linux, une distribution destinĂ©e aux dĂ©ficients auditifs, qui intĂšgre de nombreux outils intĂ©ressants, notamment leur machine Ă  lire, un ensemble de scripts bash permettant la lecture automatique depuis de nombreuses sources.”

1 Like

De nouveaux liens :