Искусственный интеллект превращает сигналы мозга в человеческую речь — послушайте сами
В будущем немые люди смогут свободно и внятно произносить слова благодаря устройствам, превращающим их мозговую активность в синтезированный голос...
Исследователи из Калифорнийского университета в Сан-Франциско недавно сделали большой шаг в улучшении этой технологии, позволив искусственному интеллекту воспроизводить голос не читая мысли, а анализируя движения губ человека. Результат оказался впечатляющим — синтезированный голос можно послушать прямо сейчас.
Ожидается, что устройство будет работать, когда человек мысленно или физически будет воспроизводить движения рта, даже если он не будет выдавать никаких звуков. Чтобы понять, какие области человеческого мозга активизируются при определенных движениях рта, исследователи вовлекли в испытание пять добровольцев. Им были прочитаны небольшие отрывки из детских рассказов — в ходе этого процесса внедренные в их мозги электроды считывали их активность.
В конечном итоге у исследователей получились две нейронные сети: первая согласовывала сигналы мозга с движениями губ, а вторая превращала эти движения в синтезированную речь. Добровольцы действительно смогли повторить отрывки предложений — на записи можно легко распознать около 69% синтезированных слов. Как и в других исследованиях, чем короче были предложения, тем точнее получался результат.
Исследователи могут улучшить технологию путем использования мозговых имплантатов с более плотным расположением электродов и сложных алгоритмов машинного обучения. Между реакцией мозгов разных участников исследования были найдены общие черты, что говорит о том, что будущие устройства для синтеза речи можно будет легко настраивать под каждого человека. Также исследователи заметили, что искусственный интеллект порой распознает и не использованные при обучении звуки, что тоже вселяет большие надежды.
Источник: hi-news.ru
Исследователи из Калифорнийского университета в Сан-Франциско недавно сделали большой шаг в улучшении этой технологии, позволив искусственному интеллекту воспроизводить голос не читая мысли, а анализируя движения губ человека. Результат оказался впечатляющим — синтезированный голос можно послушать прямо сейчас.
Ожидается, что устройство будет работать, когда человек мысленно или физически будет воспроизводить движения рта, даже если он не будет выдавать никаких звуков. Чтобы понять, какие области человеческого мозга активизируются при определенных движениях рта, исследователи вовлекли в испытание пять добровольцев. Им были прочитаны небольшие отрывки из детских рассказов — в ходе этого процесса внедренные в их мозги электроды считывали их активность.
В конечном итоге у исследователей получились две нейронные сети: первая согласовывала сигналы мозга с движениями губ, а вторая превращала эти движения в синтезированную речь. Добровольцы действительно смогли повторить отрывки предложений — на записи можно легко распознать около 69% синтезированных слов. Как и в других исследованиях, чем короче были предложения, тем точнее получался результат.
Исследователи могут улучшить технологию путем использования мозговых имплантатов с более плотным расположением электродов и сложных алгоритмов машинного обучения. Между реакцией мозгов разных участников исследования были найдены общие черты, что говорит о том, что будущие устройства для синтеза речи можно будет легко настраивать под каждого человека. Также исследователи заметили, что искусственный интеллект порой распознает и не использованные при обучении звуки, что тоже вселяет большие надежды.
Источник: hi-news.ru
1
Другие новости
Оставить комментарий
Написать комментарий: