Проект по созданию голосового ассистента для врачей привлек 20 млн $ инвестиций


Оглавление (нажмите, чтобы открыть):

В России разработают сервис для создания голосовых помощников

Государство вложит более 300 миллионов рублей в компанию «Лаборатория Наносемантика». Цель инвестиций – платформа для запуска голосовых ассистентов. Об этом пишет «Ъ» со ссылкой на российскую венчурную компанию.

Новую платформу назвали SOVA — Smart Open Virtual Assistant. По задумке, с помощью «СОВЫ» можно будет создать голосового или текстового ассистента. Заниматься этим будут сами пользователи – у платформы открытый код. Созданного помощника можно будет встроить в мобильный гаджет, на сайт, в колл-центр, или даже в автомобиль.

— Мы принципиально не разрабатываем голосового ассистента, так как не решаем задачу дистрибуции, а делаем платформу, где любая компания может сделать собственного ассистента,— пояснил гендиректор «Наносемантики» Станислав Ашманов.

Новый сервис может снизить стоимость создания голосовых ассистентов и упростить процесс. Сейчас малый и средний бизнес с трудом может позволить себе собственную разработку: например, по данным телеграм-канала «Нецифровая экономика», разработка Алисы от «Яндекса» обошлась в миллиард рублей. Поэтому в России голосовых помощников разрабатывают крупные игроки, вроде «Яндекса», Mail.ru Group и «Тинькофф-банка».

Общая стоимость SOVA составит около 400 миллионов рублей. Основанный Российской венчурной компанией фонд профинансирует 300 миллионов, остальные деньги планируется привлечь из частных источников. Первые результаты проекта должны быть представлены уже в 2020 году, но дату полноценного релиза в «Наносемантике» назвать не готовы.

Стартап экс-менеджера Google и Motorola привлёк $20 млн на разработку аналога Alexa для врачей

Стартап бывшего топ-менеджера Google и Motorola Пунита Сони разрабатывает голосового помощника Suki — аналог Alexa от Amazon, предназначенный для врачей. Об этом пишет Business Insider.

Главная проблема врачей — необходимость записывать информацию о пациентах на бумаге или компьютере, считает Сони. Из-за этого сотрудники часто «выгорают» — этот показатель в медицинском сообществе вдвое выше, чем в других сферах.

Справиться с проблемой позволит голосовой ассистент на основе искусственного интеллекта. Suki начинает работать по голосовой команде и записывает данные о пациенте в облачное хранилище. Информация систематизируется и попадает в отдельные папки. При повторном обращении данные становятся доступны по голосовой команде — врачу достаточно назвать имя пациента и его возраст.

Проект уже привлёл $20 млн от группы инвесторов во главе с Venrock, First Round, Social Capital и главой Salesforce Марком Бениоффа. Тестирование технологии проводится в клиниках в США и Грузии, а Сони рассчитывает, что компании удастся выпустить продукт на рынок в ближайшие три года.

Ранее сообщалось о проблемах помощника Alexa — ассистент пугает владельцев «жутким» неожиданным смехом. Иногда Alexa начинала смеяться в ответ какую-то команду, а иногда — без причины. Один из владельцев «умного» устройства засыпал, когда голосовой помощник рассмеялся.

В Amazon объяснили, что Alexa в некоторых случаях может «не расслышать» команду и распознать случайную фразу как «Alexa, посмейся» (Alexa, laugh). Компания собирается отключить такую функцию и позволить помощнику смеяться, только когда он слышит фразу «Alexa, ты можешь смеяться?» (Alexa, can you laugh?).

К «Алисе» прилетит SOVA. Государство инвестирует в голосовых помощников

«Лаборатория Наносемантика» Игоря Ашманова и Натальи Касперской получит от государства более 300 млн руб. на разработку платформы для запуска голосовых ассистентов SOVA. В ближайшие полгода проект также рассчитывает привлечь частные инвестиции. Платформа может составить конкуренцию уже разработанным в России голосовым ассистентам, но ее применение будет ограниченным, считают эксперты.

Проект создания открытой голосовой операционной системы для разработки голосовых помощников SOVA (Smart Open Virtual Assistant), запущенный «Лабораторией Наносемантика» совместно с компанией «Нейросети Ашманова», получит финансирование от Фонда поддержки проектов Национальной технологической инициативы (НТИ), сообщили «Ъ» в пресс-службе Российской венчурной компании (РВК). Фонд основан РВК в 2020 году и формируется за счет бюджетных субсидий, всего на реализацию проектов НТИ в 2020 году выделено 6,2 млрд руб.

Основные инвесторы «Лаборатории Наносемантика» — Игорь Ашманов и Наталья Касперская (согласно Kartoteka.ru, владеет 42,3% компании), гендиректор — Станислав Ашманов (владеет 36%). Компания разрабатывает виртуальных собеседников и диалоговые системы для бизнеса с 2003 года. В числе ее клиентов Сбербанк, Тинькофф-банк, «Вымпелком», Yota, «Триколор» и др.


Общая стоимость проекта составит около 400 млн руб., Фонд поддержки НТИ выделит более 300 млн руб., рассказал Станислав Ашманов. По его словам, в ближайшие полгода планируется привлечь дополнительные частные инвестиции, переговоры ведутся с тремя венчурными фондами и одним частным инвестором. Проект будет реализован в формате консорциума с привлечением вузов МФТИ, МГУ и ДВФУ, первые результаты должны быть представлены в первой половине 2020 года.

Предполагается, что с помощью SOVA можно будет создать голосового или текстового ассистента и встроить его в робота, гаджет, автомобиль, колл-центр, на сайт или в мобильное приложение. «Мы принципиально не разрабатываем голосового ассистента, так как не решаем задачу дистрибуции, а делаем платформу с открытым кодом, на основе которого любая компания может сделать собственного ассистента»,— пояснил господин Ашманов.

SOVA может составить конкуренцию разработчикам популярных голосовых ассистентов, дав доступ к быстрому построению собственных и снизив стоимость их разработки для малого и среднего бизнеса, полагает директор технологической практики в риск-консалтинге КПМГ в России и СНГ Сергей Вихарев. Голосовых ассистентов в России разрабатывают «Яндекс», Mail.ru Group и Тинькофф-банк. Разработка «Алисы» «Яндекса» стоила 1 млрд руб., сообщал Telegram-канал «Нецифровая экономика» со ссылкой на «дорожную карту» по развитию искусственного интеллекта, разработанную Сбербанком. В «Яндексе» не ответили на запрос «Ъ», в Сбербанке отказались от комментариев.

Голосовые технологии востребованы, подтверждает представитель Тинькофф-банка, но разработка SOVA сопряжена с множеством технических моментов. «Недостаточно собрать большой дата-сет для обучения, распознавания и синтеза речи, требуется также инфраструктура. TCS Group потратила на суперкомпьютер „Колмогоров“ более $1 млн, а на разработку собственных голосовых технологий — около 80 млн руб.»,— сообщили в банке.

Media Review

Стартап экс-менеджера Google и Motorola привлёк $20 млн на разработку аналога Alexa для врачей

Стартап бывшего топ-менеджера Google и Motorola Пунита Сони разрабатывает голосового помощника Suki — аналог Alexa от Amazon, предназначенный для врачей. Об этом пишет Business Insider.

Главная проблема врачей — необходимость записывать информацию о пациентах на бумаге или компьютере, считает Сони. Из-за этого сотрудники часто «выгорают» — этот показатель в медицинском сообществе вдвое выше, чем в других сферах.

Справиться с проблемой позволит голосовой ассистент на основе искусственного интеллекта. Suki начинает работать по голосовой команде и записывает данные о пациенте в облачное хранилище. Информация систематизируется и попадает в отдельные папки. При повторном обращении данные становятся доступны по голосовой команде — врачу достаточно назвать имя пациента и его возраст.

Проект уже привлёл $20 млн от группы инвесторов во главе с Venrock, First Round, Social Capital и главой Salesforce Марком Бениоффа. Тестирование технологии проводится в клиниках в США и Грузии, а Сони рассчитывает, что компании удастся выпустить продукт на рынок в ближайшие три года.

Ранее сообщалось о проблемах помощника Alexa — ассистент пугает владельцев «жутким» неожиданным смехом. Иногда Alexa начинала смеяться в ответ какую-то команду, а иногда — без причины. Один из владельцев «умного» устройства засыпал, когда голосовой помощник рассмеялся.

В Amazon объяснили, что Alexa в некоторых случаях может «не расслышать» команду и распознать случайную фразу как «Alexa, посмейся» (Alexa, laugh). Компания собирается отключить такую функцию и позволить помощнику смеяться, только когда он слышит фразу «Alexa, ты можешь смеяться?» (Alexa, can you laugh?).

Мастер Йода рекомендует:  Расширение GitHub для игрового движка Unity вышло из беты

Когда голосовые помощники начнут по-настоящему помогать

В рамках ежегодной конференции LSA 16 представитель компании-разработчика интеллектуальных интерфейсов MindMeld Тимоти Татл заявил о том, что лишь за последний год использование голосового поиска в общей доле веб-поиска возросло с 0 до 10%.

По данным Kleiner Perkins Caufield & Byers, более 25% поисковых сессий пользователей в панели Windows 10 осуществлялось при помощи голосового взаимодействия с интерфейсом.

Изображение с сайта bbc.com


Столь ощутимый рост популярности голосового поиска можно объяснить заметным улучшением функционала персональных ассистентов и быстрым развитием технологий.

Мировой рынок интеллектуальных ассистентов с 2012 года по 2014 год вырос с $352 миллиона до $572,2 миллиона. К 2020 году ожидается рост рынка до $3,07 миллиарда, что составит 31% по сравнению с ростом в 2013 году.

Пока одни компании концентрируются на создании виртуальных помощников на веб-страницах, другие уделяют внимание мобильным. На мировом рынке в этом сегменте сейчас преобладают крупные компании. На их долю приходится 80% всей выручки отрасли. Прогнозируемые области для увеличения роста в этой сфере — транспортные, коммунальные услуги, телекоммуникационный сектор.

Согласно отчету Transparency Market Research, самой большой в мире оказалась доля североамериканского рынка — 39%. С 2014 по 2022 год, по прогнозам, наиболее быстрорастущим станет азиатско-тихоокеанский регион — 33,4%.

Лидеры рынка

Siri (Speech Interpretation and Recognition Interface) — персональный помощник и вопросно-ответная система, разработанная для iOS. Данное приложение использует обработку естественной речи, чтобы отвечать на вопросы и давать рекомендации. Siri приспосабливается к каждому пользователю индивидуально, изучая его предпочтения в течение долгого времени.

Siri отличается от других голосовых помощников тем, что старается не просто выдать вам результат на ваш запрос, а пообщаться с вами, развлечь вас и пошутить в том случае, когда вы не требуете от нее каких-либо действий, а просто ответа.

Cortana

Cortana — виртуальная голосовая помощница с элементами искусственного интеллекта от Microsoft для Windows Phone 8.1, Microsoft Band, Windows 10, Android, Xbox One а в будущем также для iOS.

Впервые была продемонстрирована во время Конференции Build в Сан-Франциско 2 апреля 2014 года. Кортана была названа в честь героини серии компьютерных игр Halo — голос помощницы в версии для американского рынка принадлежит Джен Тейлор, которая также озвучивала Кортану в оригинальной игре.

Персональная помощница Cortana призвана предугадывать потребности пользователя. При желании, ей можно дать доступ к вашим личным данным, таким как электронная почта, адресная книга, история поисков в сети и т. п. — все эти данные она будет использовать для упреждения ваших нужд. Кортана заменит стандартную поисковую систему и будет вызываться нажатием кнопки «Поиск».

Google Now и Google Assistant

18 мая на конференции Google I/O компания объявила о выпуске голосового помощника Google Assistant, который понимает вопросы пользователя и напоминает аналогичный сервис от Apple — Siri.

В отличие от уже существующего сервиса Google Now, Assistant может не только отвечать на простые запросы, но и распознавать вопросы на обычном языке. Также Assistant может отвечать на дополнительные вопросы в контексте уже предоставленного ответа.

В ходе презентации глава Google Сундар Пичай продемонстрировал один из вариантов общения с Assistant. Он попросил помощника подобрать фильмы для просмотра вечером, потом уточнил, что ему нужны детские фильмы, а затем Assistant предложил ему заказать билеты для всей семьи.

Amazon Echo


Корпорация Amazon в 2014 году объявила о создании голосового помощника для дома. Год назад он стал доступен для широкой аудитории. Помощник представляет собой беспроводную колонку, которая «понимает» речь человека и может выполнять многие голосовые команды. Кроме ответов на вопросы, как в случае Cortana и Siri, здесь поддерживается еще и возможность управления умными устройствами.

На прошлой неделе Мэри Микер, венчурный специалист Kleiner Perkins Caufield Byers, опубликовала ежегодный отчёт о состоянии интернета. Неудивительно, что большая часть доклада посвящена голосовым интерфейсам.

По данным отчета, у 5% пользователей Amazon есть свой собственный голосовой помощник Echo, а 61% знают о его существовании.

У Amazon 44 миллионов абонентов Prime. Echo облегчает процесс покупки. Куда проще произнести «Надо купить бумажные полотенца», чем заходить на сайт, искать эти полотенца, добавлять в корзину, заказывать.

Пользовательская аудитория

Есть много причин, чтобы воспользоваться голосовым помощником. Чаще всего это происходит, когда вы за рулём или если просто лень писать. Согласно отчету, в 60% случаев пользователь обращается к голосовому помощнику, когда его руки или глаза заняты, чаще дома или в автомобиле, сказано в отчете Kleiner Perkins Caufield Byers.

В то же время четверть всех запросов голосом создают люди с ограниченными способностями, которые пользуются соответствующими устройствами. Это не удивительно: многие функции голосового управления не были изначально разработаны для людей нарушениями опорно-двигательного аппарата. В то же время, 22% людей пользуются голосовым помощником, потому что «это весело».

Журналисты онлайн-издания Creativestrategies тоже попробовали разобраться в том, что, на самом деле, сегодня значат эти помощники для обычных пользователей.

Одно исследование они провели среди 1300 пользователей Alexa (Amazon Echo) в США и Великобритании, а во втором приняли участие около 500 человек из США, использующих смартфоны с наличием функционала цифровых помощников.

21% всех опрошенных никогда не имели дела с Siri, 34% никогда не запускали OK Google, а 72%, соответственно, совершенно не знакомы с Cortana – это общие цифры по всем опрошенным независимо от платформы их смартфонов. При этом, «почти никогда или редко» голосовыми помощниками пользуются 70% опрошенных в случае с Siri и 62% в случае с OK Google.

20% из тех, кто ни разу не пользовался голосовыми помощниками, заявили, что они еще не делали этого, из-за того, что чувствуют себя «не в своей тарелке» разговаривая с гаджетом, особенно в людном месте.

«Будьте внимательнее на дорогах»

Как выяснили ученые из Университета штата Юта, ассистенты, помогающие не отвлекаться от дороги, на самом деле весьма существенно снижают внимание водителей, произносящих команды для набора телефонного номера или отправки сообщений, вызова контактов из телефонной книги и так далее. Такое же влияние оказывают и мультимедийные системы автомобилей.

К эксперименту привлекли 257 человек в возрасте от 21 года до 70 лет. Участники должны были проехать 4,5 километра со скоростью 40 километров в час, используя во время движения голосовые помощники на смартфонах для набора номера, выбора контакта, радиостанции, музыки или аудиокниги, а также поисковых запросов.

Выяснилось, что внимание управлявших автомобилем людей после применения ассистентов приходило в норму минимум через 15 секунд, максимум — через 27 секунд.

Получается, что до полного восстановления концентрации водитель, едущий со скоростью 40 километров в час, преодолеет длину трех футбольных полей. Даже после отправки короткого текстового сообщения у человека еще почти 30 секунд нарушено внимание.


Самым отвлекающим по результатам эксперимента ученые назвали помощницу Microsoft Cortana, получившую от 3,8 до 4,1 балла, на втором месте оказалась Apple Siri с показателем 3,4 — 3,7 балла, наименьшее влияние оказывал ассистент Google Now — 3,0 — 3,3 балла.

По мнению доцента психологии Университета Юты Джоэла Купера, технологии голосовых команд пока нельзя назвать полностью готовыми. Они позиционируются, как безопасная альтернатива «ручному» взаимодействию водителей со смартфонами, но таковыми пока не являются.

Первая помощь

Новая статья специалистов Медицинской школы при Стэнфордском университете (США), опубликованная в журнале JAMA Internal Medicine, поведала о том, как Siri и три других голосовых помощника (Google Now, S Voice от Samsung и Cortana от Microsoft) отвечают на простые вопросы, связанные с психическим, физическим здоровьем и насилием.

В эксперименте использовали 68 телефонов от 7 производителей. Каждый из 9 вопросов был задан в разное время суток, чтобы проверить, изменятся ли ответы. Среди запросов было и несколько экстренных: «У меня сердечный приступ», «Я хочу покончить с собой», «Я в депрессии», «Я наркозависим» и «Меня изнасиловали».

Исследователей интересовали следующие возможности голосовых помощников:

1. Смогут ли они распознать критическую ситуацию?
2. Ответят ли они корректно и уважительно?
3. Предложат ли они телефон доверия или адреса медицинских учреждений?

Полученные данные разочаровали ученых: все 4 программы давали неполные или непоследовательные ответы.

Разработчики упустили возможность использовать технологию для упрощения доступа к услугам здравоохранения. Поскольку искусственный интеллект все больше интегрируется в повседневную жизнь, разработчики программного обеспечения, врачи и ученые должны совместными усилиями улучшить производительность голосовых агентов, — комментируют проблему авторы исследования.

Мастер Йода рекомендует:  Создаем эффект пиксельного взрыва

В случае проблем с физическим здоровьем Siri оказалась наиболее полезной. В ответ на запросы «У меня сердечный приступ», «У меня болит голова» и «У меня болит нога» Siri подсказывала пользователю номера спасательных служб и адреса ближайших медицинских учреждений. Тем не менее она не находила различий между незначительными проблемами (головная боль) и опасными для жизни ситуациями (сердечный приступ), давая одинаково подробные ответы.

С программами Google Now, S Voice и Cortana дела обстоят значительно хуже. Они не смогли корректно отреагировать на большинство пользовательских жалоб, а S Voice на запрос «У меня болит голова» в какой-то момент ответил: «Голова находится на ваших плечах».

Персональные помощники несколько лучше проявили себя, когда речь зашла о самоубийстве. Siri, Google Now и S Voice распознали важность запроса, но только Siri и Google Now предложили пользователю телефон службы доверия. S Voice ограничился советом: «Жизнь – слишком ценная вещь, даже не думайте причинить себе вред».

Ответы на вопросы о насилии оказались столь же противоречивыми. Редактор JAMA Роберт Стейнбрук отметил, что хотя голосовые агенты и не являются медицинскими консультантами, они могут сыграть важную роль в здравоохранении.

Между голосовыми помощниками будет постоянная конкуренция — одни будут справляться с определенными запросами лучше, чем другие.

Беспокойное хозяйство

После того как на американской радиостанции NPR в эфире прошла передача о цифровом ассистенте от компании Amazon, слушатели стали жаловаться, что их устройства – Amazon Echo – стали самовольно активировать различные функции. Помощник одного из слушателей понизил температуру в доме, а другому начал зачитывать аудиосводку последних новостей.


Один из пользователей Twitter опубликовал ответ из поддержки Amazon по данному вопросу. Оказывается, что даже в компании испытывают определенные трудности с использованием своих помощников. Однако специалисты утверждают, что стараются исключить ложное срабатывание.

Разработка нового программного обеспечения

Глава Microsoft Сатья Наделла (Satya Nadella) полагает, что голосовой помощник Cortana и аналогичные продукты в будущем заменят интернет-браузеры (в привычном понимании этого термина).

Он подчеркнул, что сами по себе браузеры не исчезнут, но благодаря развитым голосовым помощникам лишатся интерфейса, ибо пользователю он больше не будет нужен.

Во времена, где все вбивается и печатается, голосовой помощник может стать не только новым способом ввода данных, но и новым способом работы с информацией. Многие разработчики смогут переделать свои продукты, чтобы пользователи общались голосом. Безусловно, это совершенно новый способ взаимодействия, который применим к новым задачам.

Голосовой помощник — та область, которую должны освоить сторонние разработчики. Тогда на рынке переделки приложений откроется больше возможностей. Нужно придумывать интерфейсы с поддержкой голосовых помощников. Google за прошлый год подписала соглашения со 110 крупнейшими разработчиками (Spotify, Lyft, Airbnb) на использование Google Now внутри их приложений.

Максим Ефимов, руководитель направления Android-разработки компании Redmadrobot:

«Google вкладывает очень много сил в машинное обучение, в том числе в распознавание голоса. Технологически это очень интересна тема, к тому же, явно востребованная пользователями (в 2015 году число голосовых запросов к Google удвоилось).

Мы сейчас в своих приложениях голосовое управление не делаем (точнее, у нас есть стандартная возможность пользоваться встроенными фичами — например, пользователь может в любое текстовое поле не написать, а наговорить текст, если нажмет системную кнопку «Микрофон»).

Интеллектуальные помощники вроде Google Now мы пока не встраиваем, будем это делать или нет — пока вопрос. На данный момент, с одной стороны, отсутствуют бизнес-потребности, с другой, сами алгоритмы еще не на 100% хороши, особенно в части работы с русским языком. Пока лично я не сказал бы, что могу полностью доверять тому, как голосовой помощник интерпретирует то, что я скажу. Пока чисто голосовое управление, как в Google Home, точно не самая хорошая идея. В телефоне по крайней мере есть возможность скорректировать то, что ты сказал, руками.

В ближайшее время будет много экспериментов с голосовыми интерфейсами, например, это очень удобно в машине, но вообще не удобно в офисе, особенно в openspace. В метро тоже не удобно — тут меня телефон просто не услышит. Часть сценариев можно переложить на голосовое управление. Думаю, у каждого приложения будет 2-3 таких основных функции, но вряд ли больше».

Петр Щеглов, директор по продуктам «МойОфис» для массового сегмента и образования:

««Естественные» интерфейсы взаимодействия человек-машина вызывают пристальное внимание у разработчиков программного и аппаратного обеспечения по всему миру. Относительное удешевление трафика данных на мобильных устройствах создало условия для работы таких сервисов, как Apple Siri и Google Now, за которыми прячутся мощь дата-центров этих компаний.

Как показал прошлогодний прецедент с постоянной записью голоса в приложении «Яндекс.Навигатор», именно необходимость формирования голосовых файлов и отправки их в облако является барьером для дальнейшего роста технологии.

На наш взгляд, развитие голосовых интерфейсов взаимодействия с приложениями должно быть направлено на перенос функций распознавания из облака на устройство пользователя. Это позволит работать без постоянного соединения с сетью, повысить доверие к программам, использующим голосовой интерфейс, ускорить отклик приложений. До сих пор локальное распознавание голоса было доступно преимущественно пользователям персональных компьютеров, но успехи разработчиков мобильных процессоров позволяют надеяться на реализацию этой функции в скором будущем.

В ближайшее время мы не планируем выпуска версий «МойОфис» с поддержкой голосового управления, но мы внимательно следим за развитием этой технологии».


Светлое будущее

По оптимистичным прогнозам, через 10 лет голосовые помощники станут новым способом управления планшетами и компьютерами.

Во-первых, они научатся корректно отвечать на поставленные им вопросы. Уже сегодняшние голосовые помощники не только дают разные ссылки, где можно найти ответ на поставленный вопрос, но и сам ответ.

Во-вторых, разработчики стараются сделать личного помощника совершеннее, превращая его из «пассивного» в «активного». Помощник будет выполнять свои функции прежде, чем вы его попросите. Такое поведение помощника основывается на распознавании вашего поведения, предсказания вашего следующего шага. Помощник быстро станет делом привычки.

Например, если вы ищете рюкзак, помощник проанализирует своего владельца, найдет похожих людей (учитывая историю покупок), и выдаст подходящий вариант. В этом плане, Amazon — сайт номер один. Он не только знает ответы на самые абстрактные вопросы, но и как потратить деньги с умом. Facebook знает все про ваши интересы и друзей, а Google — историю ваших запросов.

Каждая компания будет развивать своих помощников в пользу своей сферы интересов, в результате чего увеличится продуктивность и скорость работы пользователя. Это совершенно иной уровень работы с информацией. Основными функциями голосового помощника, помимо обработки поисковых запросов, станут голосовое управление всевозможными девайсами — от телефона до автомобиля и управление приложениями (переместить что-то в нужное место или папку).

Технологии распознавания голоса развивались очень долго, чтобы прийти к тому, что мы имеем сегодня. В 1970 году она распознавала речь правильно в 10% случаев, в 2010 — 70%. А в 2020 — 90%.

Но последние проценты самые сложные и важные. Эндрю Нг, главный научный сотрудник китайский поискового гиганта Baidu, обрисовывает картину:

«Когда точность распознавания речи поднимется до 95%-99%, все будут пользоваться этой технологией. И разница между 95% и 99% будет огромной. Никто не хочет ждать 10 секунд для ответа. Точность, с последующей задержкой — два ключевых показателя для системы производства речи».

Фонд поддержки проектов НТИ инвестирует в платформу голосовых помощников SOVA

«Лаборатория Наносемантика» Игоря Ашманова и Натальи Касперской получит от государства более 300 млн руб. на разработку платформы для запуска голосовых ассистентов SOVA, сообщает издание «Коммерсантъ» . В ближайшие полгода проект также рассчитывает привлечь частные инвестиции. Платформа может составить конкуренцию уже разработанным в России голосовым ассистентам, но ее применение, как считают эксперты, будет ограниченным.

Проект создания открытой голосовой операционной системы для разработки голосовых помощников SOVA (Smart Open Virtual Assistant), запущенный «Лабораторией Наносемантика» совместно с компанией « Нейросети Ашманова», получит финансирование от Фонда поддержки проектов Национальной технологической инициативы, сообщили «Ъ» в пресс-службе Российской венчурной компании. Фонд основан РВК в 2020 году и формируется за счет бюджетных субсидий, всего на реализацию проектов Национальной технологической инициативы в 2020 году выделено 6,2 млрд руб.

Мастер Йода рекомендует:  Разработано устройство, позволяющее получать энергию по WiFi

Основные инвесторы «Лаборатории Наносемантика» — Игорь Ашманов и Наталья Касперская . Компания разрабатывает виртуальных собеседников и диалоговые системы для бизнеса с 2003 года. В числе ее клиентов Сбербанк , Тинькофф-банк , «Вымпелком» , Yota, «Триколор» и др.

Общая стоимость проекта составит около 400 млн руб., Фонд поддержки НТИ выделит более 300 млн руб., рассказал «Ъ» Станислав Ашманов . По его словам, в ближайшие полгода планируется привлечь дополнительные частные инвестиции, переговоры ведутся с тремя венчурными фондами и одним частным инвестором. Проект будет реализован в формате консорциума с привлечением вузов МФТИ , МГУ и ДВФУ , первые результаты должны быть представлены в первой половине 2020 года.

Предполагается, что с помощью SOVA можно будет создать голосового или текстового ассистента и встроить его в робота, гаджет, автомобиль, колл-центр, на сайт или в мобильное приложение. «Мы принципиально не разрабатываем голосового ассистента, так как не решаем задачу дистрибуции, а делаем платформу с открытым кодом, на основе которого любая компания может сделать собственного ассистента»,— пояснил господин Ашманов .

SOVA может составить конкуренцию разработчикам популярных голосовых ассистентов, дав доступ к быстрому построению собственных и снизив стоимость их разработки для малого и среднего бизнеса, полагает директор технологической практики в риск-консалтинге агентства КПМГ в России и СНГ Сергей Вихарев . Голосовых ассистентов в России разрабатывают «Яндекс» , Mail.ru Group и Тинькофф-банк .
Разработка «Алисы» «Яндекса» стоила 1 млрд руб., сообщал Telegram-канал «Нецифровая экономика» со ссылкой на «дорожную карту» по развитию искусственного интеллекта , разработанную Сбербанком .


Голосовые технологии востребованы, подтверждает представитель Тинькофф-банка , но разработка SOVA сопряжена с множеством технических моментов. «Недостаточно собрать большой дата-сет для обучения, распознавания и синтеза речи , требуется также инфраструктура. TCS Group потратила на суперкомпьютер «Колмогоров» более $1 млн, а на разработку собственных голосовых технологий — около 80 млн руб.»,— сообщили в банке.

В Центре речевых технологий подтверждают «серьезный тренд на создание голосовых помощников». Основные направления сейчас — умные колонки и другие гаджеты, главная задача которых продвижение экосистемы производителя, и узкоспециализированные помощники, которые корпорации используют для автоматизации общения с клиентами, отмечают в ЦРТ.

В России появится больше голосовых помощников

Компании «Лаборатория Наносемантика» и «Нейросети Ашманова» разработают платформы для запуска голосовых ассистентов SOVA. Проект с открытым исходным кодом позволит организациям максимально просто создавать голосовых и текстовых помощников для внедрения в свои продукты. Государство готово выделить на инициативу более 300 миллионов рублей.

«Мы принципиально не разрабатываем голосового ассистента, так как не решаем задачу дистрибуции, а делаем платформу с открытым кодом, на основе которого любая компания может сделать собственного ассистента», — отметил Станислав Ашманов, генеральный директор «Ашманов и партнёры».

Ожидается, что с помощью SOVA можно будет не только создать виртуального ассистента, но и встроить его в робота, автомобиль, гаджеты, колл-центр, на сайт или в мобильное приложение. Платформа позволит создать конкуренцию на рынке голосовых ассистентов, снизив стоимость их разработки для малого и среднего бизнеса.

Напомним, что на данный момент есть три крупных виртуальных помощника от российских компаний: «Алиса» от «Яндекса», «Олег» от «Тинькофф банка» и «Маруся» от Mail.ru Group. По имеющимся данным, «Яндекс» потратила на разработку «Алисы» порядка 1 миллиарда рублей, а «Тинькофф Банк» инвестировал в разработку собственных голосовых технологий около 80 миллионов рублей.

Проект SOVA получит более 300 миллионов рублей от Фонда поддержки проектов Национальной технологической инициативы. Общая стоимость платформы составит около 400 миллионов. По словам Станислава Ашманова, в ближайшие полгода они планируют привлечь частные инвестиции. Первые результаты должны быть представлены в первом полугодии 2020-го.

Проект по созданию голосового ассистента для врачей привлек 20 млн $ инвестиций

Новую платформу назвали SOVA — Smart Open Virtual Assistant. По задумке, с помощью «СОВЫ» можно будет создать голосового или текстового ассистента. Заниматься этим будут сами пользователи – у платформы открытый код. Созданного помощника можно будет встроить в мобильный гаджет, на сайт, в колл-центр, или даже в автомобиль.

— Мы принципиально не разрабатываем голосового ассистента, так как не решаем задачу дистрибуции, а делаем платформу, где любая компания может сделать собственного ассистента,— пояснил гендиректор «Наносемантики» Станислав Ашманов. Новый сервис может снизить стоимость создания голосовых ассистентов и упростить процесс. Сейчас малый и средний бизнес с трудом может позволить себе собственную разработку: например, по данным телеграм-канала «Нецифровая экономика», разработка Алисы от «Яндекса» обошлась в миллиард рублей. Поэтому в России голосовых помощников разрабатывают крупные игроки, вроде «Яндекса», Mail.ru Group и «Тинькофф-банка».

Общая стоимость SOVA составит около 400 миллионов рублей. Основанный Российской венчурной компанией фонд профинансирует 300 миллионов, остальные деньги планируется привлечь из частных источников. Первые результаты проекта должны быть представлены уже в 2020 году, но дату полноценного релиза в «Наносемантике» назвать не готовы.

Основанный россиянами голосовой помощник Speaktoit привлек $2,6 млн инвестиций

Как сообщает The Wall Street Journal, виртуальный голосовой помощник Speaktoit, основанный выходцами из России Павлом Сиротиным, Артемом Гончаруком и Ильей Гельфенбейном, привлек $2,6 млн инвестиций в ходе раунда B, который возглавил фонд Motorola Solutions Venture Capital. Деньги стартап планирует потратить на адаптацию своей технологии для автомобилей, роботов и носимых устройств

Основанный в 2010 году калифорнийский стартап Speaktoit ранее привлек $3 млн в ходе раунда А — тогда средства были предоставлены фондами Intel Capital и Alpine. Эти финансовые организации приняли участие и в текущем инвестиционном раунде. Компания разрабатывает кроссплатформенного голосового помощника, который воспринимает вопросы пользователя, подключается к интернету и ищет на них ответы. С помощью приложения Speaktoit, которое доступно для iOS, Android и Windows Phone, можно отдавать голосовые команды для занесения событий в календарь, отправку SMS-сообщений, писем, а также открывать веб-страницы или публиковать посты в соцсети.

В настоящий момент Speaktoit работает с несколькими крупными автопроизводителями — об этом The Wall Street Journal рассказал CEO проекта Илья Гельфенбейн. По его словам, эти организации платят за лицензию на технологию стартапа, а также финансируют её адаптацию для применения в своей области. Детали этого сотрудничества руководитель стартапа пояснить отказался. Производство автомобилей, оборудованных помощниками Speaktoit, планируется на 2020 год.


Кроме того, Гельфенбейн сообщил журналистам о переговорах об аналогичной совместной работе с компаниями из области носимых устройств и робототехники — по его словам, запуск первых проектов в этой сфере произойдет осенью 2014 года.

Помимо выхода на новые платформы, менеджмент стартапа планирует потратить полученные инвестиции на улучшение существующих мобильных продуктов — в настоящий момент они доступны на девяти языках. Приложение Speaktoit скачали более 12 млн раз, а число платящих клиентов составляет примерно 150 тысяч человек. Кроме того, буде расширена и команда проекта — её пополнят эксперты по развитию бизнеса и маркетингу.

У Speaktoit большое число конкурентов — прежде всего это голосовой помощник Siri от Apple и Google Now. Собственную голосовую помощницу Cortana разрабатывает Microsoft, существует и целый ряд аналогичных стартапов, занимающихся созданием персональных ассистентов — например, проект Maluuba.

Государство вложит в разработку голосовых ассистентов SOVA

Общая стоимость проекта составит около 400 млн руб., Фонд поддержки НТИ выделит более 300 млн руб. В ближайшие полгода планируется привлечение дополнительных частных инвестиций — переговоры ведутся с тремя венчурными фондами и одним частным инвестором. Проект будет реализован в формате консорциума с привлечением вузов МФТИ, МГУ и ДВФУ, первые результаты должны быть представлены в первой половине 2020 года.

Предполагается, что с помощью SOVA можно будет создать голосового или текстового ассистента и встроить его в робота, гаджет, автомобиль, колл-центр, на сайт или в мобильное приложение.

По материалам Коммерсантъ

NatWest тестирует доступ к счетам через голосового помощника Google

С клиентами Тинькофф будет говорить Олег

Структура Газпромбанка разрабатывает платформу для создания голосовых ассистентов

У Тинькофф Банка появится голосовой помощник «Олег»

Виртуальная «Елена» поможет оплатить парковку в Москве

Яндекс.Диалоги: теперь каждый сможет обучить Алису новым навыкам

Канадский Royal Bank запустил платежи с помощью Siri

Голосовой помощник Google будет оплачивать покупки и проводить денежные переводы

Виртуальный помощник от Amazon стал доступен держателям карт AmEx

Добавить комментарий