Make talk

RU / День 2 / 17:15 / Зал 4

Какие возможности нам дают стандартные библиотеки распознавания речи и озвучки текста?

Вы узнаете, как с минимальным количеством кода научить ваше приложение проговаривать текст и как можно кастомизировать озвучку. Затем Роман рассмотрит API распознавания речи, его ограничения и особенности, lifecycle запроса на распознавание и методы работы в офлайн-режиме. Также слушателей ждут примеры хорошего UX, обход существующих багов и особенности работы с аудио-сессией.

Комментарий программного комитета

Может показаться, что заставить наше приложение проговаривать текст — задача несложная: выбрал язык и передал строку для озвучки. Но как только сталкиваешься с ней, понимаешь, насколько много там мелочей, о которых нельзя забывать. Аналогичная ситуация с обратной задачей — превращением звука в печатный текст. Роман Волков расскажет про все грабли, подводные камни и незадокументированные особенности решения обеих этих задач в iOS-приложении нативными средствами.