Нам пишет Аки Сапир.
Dragon Dictation – это бесплатное голосовое приложение для iPhone и iPad на базе технологии распознавания речи NaturallySpeaking. Оно позволяет надиктовывать на своём мобильном устройстве на базе iOS (iPhone или iPad) смс-сообщения и сообщения электронной почты, обновлять статусы и общаться в социальных сетях. Кроме того, есть возможность копировать этот текст и вставлять в любое другое приложение. Разработчик заявляет, что услугам пользователей обширная виртуальная база голосовых русскоязычных данных (всего более 200,000 часов устной речи), благодаря которой можно легко надиктовывать необходимую информацию. Компания Nuance утверждает, что используя Dragon Dictation, пользователь ускоряет процесс набора текста до пяти (5) раз! Это все нам обещает разработчик… Давайте посмотрим, что нас ждет на самом деле.
Dragon Dictation
Цена: Free [iTunes link]
Для чистоты эксперимента тестировали приложение на русском и английском языках я и моя жена. У нас совершенно разные дикция и интонация. Для использования программы требуется интернет соединение, чего на данный момент не избежать… Подумайте сами, сколько должно “весить” подобное приложение, если оно будет обрабатывать все данные аппаратно, а не удаленно.. Так что, забегая вперед скажу, что мне не понятны комментарии тех , кто из недостатков выделяет только необходимость подключения к интернету… Лучше бы на другие моменты обратили внимание.. Но об этом я скажу ниже… А сейчас, по пунктам разложу алгоритм использования. Можете даже загибать пальцы при подсчете количества манипуляций, чтобы отправить по-быстрому сообщение. Кстати, для подтверждения абсурдности восторженных комментариев о невероятном удобстве при вождении, представим, что мы сидим за рулем:
- Открываем приложение. Тут, в принципе, все понятно и симпатично.
- Нажимаем на кнопку записи.
- Говорим текст. Ах, да! Не только текст, но и названия знаков препинания! Начинает
казаться, что дата выхода приложения 1 сентября выбрана неспроста.. Хочешь – не хочешь а диктующую Марь Иванну вспомнишь! Ну так вот… Говорим.. Причем, если включено распознавание окончания диктовки, нам следует скорее соображать, что и как говорить – программа куда-то торопится и не дает делать паузы, выключая запись через пару секунд. Жаль! Иногда стоит подумать что сказать, а тем более написать. Если же не включать автоматическое завершение, придется каждый раз нажимать на красную кнопку. Я уже не говорю об окружающих шумах, при которых и без того не высокая точность распознавания падает почти в два раза. - Ну, все продиктовали и внимательно смотрим, что нам выдал наш Dragon… Думаю, что чаще всего, только удивление и последующий приступ неудержимого смеха от того, как исковеркана наша речь, уже может привести к аварии, не дай Б-г! То, что Вы видите на screenshot’e является записью этих слов:
Похоже на страшный сон“Мамой кланус”, что диктовал своей обычной речью и даже четче и медленнее, в полной тишине.
-
Когда мы оправимся от шока, который “по-нашему”, нам придется взять телефон в руки.. Сейчас мы предположим, что мы оптимисты и еще хотим пользоваться этим приложением, а не переключится прямиком на стандартный редактор сообщений. Включаем клавиатуру, заботливо предусмотренную разработчиками и начинаем править… Все тут знают, как весело править, даже НЕ за рулем, слова на наших любимых iOS устройствах. А тут, значит, едешь в машине и правишь совершенный бред… Мне иногда попадались слова, которых просто не бывает. Единственное послабление для оптимистов – возможность выделять и удалять слова полностью одним касанием… хотя, это тоже не всегда удобно. А вот еще “продуманный” момент: если вы вдруг передумали отправлять надиктованный текст и решили записать другой текст, то… Ээээ… То придется сначала удалить все, что написано и только потом заново диктовать. Вы еще едете? Я бы остановился.. Как вы поняли, в этом пункте много действий, так что, я не стал их делить.
Допустим, мы все исправили и привели в цивилизованный вид. Далее. Мы должны открыть подменю для выбора сообщения (SMS, e-mail, Facebook, Twitter, copy). При выборе назначения, программа открывает стандартные аппаратные редакторы сообщений и больше не принимает участия в выборе получателя и отправке сообщения. Значит, мы еще должны тыкаться в поисках контактов, что тоже не так уж и просто, особенно за рулем.
Вот такой подарок всем нам преподнес один из лидеров в области речевых технологий Nuance. Подарок, потому что Free, а не потому что помогает и облегчает нам жизнь.
Конечно можно присоединиться к мнению тех, кто считает, что если очень четко и с расстановкой проговаривать слова, то все получится или почти получится, но… Но все равно на деле получается как-то не удобно и хлопотно. По сути, для человека, который активно пользуется текстовыми сообщениями, экономия времени от такого ввода текста минимальна, а иногда отсутствует вовсе. И в голове у пользователей, у нас то есть, всплывает простой вопрос, о который довольно часто разбиваются многие аргументы: “А ЗАЧЕМ?”. Просто поиграться и посмеяться в компании с друзьями? Думаю, что вполне сойдет, да и то надоест. Но как рабочий инструмент, приложение не оправдывает ожиданий и рано или поздно все это поймут.
А мы-то все ожидали от Nuance бóльших успехов на этом поприще… И даже если верить Кристине Хиршман (директор по продажам Nuance в странах Европы, Ближнего Востока и Африки), которая, на мой взгляд, решила грамотно съехать с темы, дав понять в одном из интервью, что эти приложения являются больше рекламными и открывают возможности для остальных разработчиков, то можно сказать, что реклама вышла не самая лучшая.
Что касается комментариев в App Store, кто читал, тот знает. Поначалу, 1 сентября, одни восторги, восхваления, 5 звезд, все дела… Со 2 сентября уже пошли реальные комментарии с жалобами, злостью и обвинениями в адрес восторгающихся в том, что они подсадные утки… С чем я, пожалуй, соглашусь, потому что не может быть такой огромной пропасти между оценками. Да и я сам могу поставить за ЭТО твердую 1.
P. S. Плохое начало учебного года.
Dragon Search
Цена: Free [iTunes link]
Dragon Search – это приложение для голосового поиска онлайн-контента для iPhone и iPad и различной справочной информации. Компания Nuance представляет бесплатный голосовой поисковик Dragon Search на основе технологии распознавания речи NaturallySpeaking: по голосовому поисковому запросу приложение выдаст результаты по основным ресурсам (Yandex, Google, iTunes, Wikipedia, YouTube). Это все, опять же, заявления разработчика.
Я не стану повторяться со вступлением и делить описание на пункты, так как принцип работы тот же самый, что и у Dictation. Отличие лишь в том, что на экране с кнопкой записи отображается два последних поисковых запроса. По большому счету, здесь так же весь сыр-бор лишь для того, чтобы просто ввести запрос не пользуясь клавиатурой. Но это опять же, если все правильно распознано, а если нет, нам так же предоставлена возможность исправить ошибки приложения собственноручно. Признаюсь, точность распознавания речи в этом приложении ощутимо выше, чем в Dictation, что скорее всего, связано с большей конкретностью запросов. Хотя и здесь довольно часто бывают ошибки.
В качестве результата поиска, открывается интернет-страница поисковой системы (Yandex, Google) и toolbar для выбора дополнительных источников информации по данному запросу (Wikipedia, YouTube).
А вообще, я подумал, что как поисковик приложение состоялось. Подумайте – вводите один запрос и получаете результат из нескольких источников. “Isn’t that cool?”, как говорится?
Но, опять же, какой смысл в голосовом наборе, если дальше все делаешь сам? Думаю, что никакого. Это мое мнение, основанное на логике и на том, что нельзя говорить “Это КРУТО!!!”, только если это бесплатно и у этого нет альтернативы.
P. S. Да и вообще, это может быть жизненной позицией. Спасибо всем за внимание! Пока оттачиваем мастерство быстрой печати, а не дикции.
40 комментариев
Форум →Ну не все сразу. Начало положено…. а дальше посмотрим.
@snoopyy, Какое начало? Начало было в прошлом веке на 95 винде и называлось “Dragon Dictate”, а в русской и такой же непригодной, как здесь, версии – “Горыныч”. Тогда, в 1997 (вроде) году мы безуспешно пытались использовать эту программу на русском. Были даже трудности с включением – на наше голосовое “проснись” Горыныч реагировал в 10% попыток, но на “Wake Up” отзывался на 100%! Так что думаю, что русскоязычные распознавалки следует дорабатывать.
Вообщем-то гугловское приложение все равно лучше выходит.
Когда я потестил Dictation, то чуть не упал со стула от тех вариантов, которые мне предлагались. Это приложение только для того, чтобы покрасоваться перед пацанами в сауне, но не более. Да и то, если есть быстрый инет, чего в саунах редко встретишь. Для практического применения польза нулевая: быстрее набрать самому.
@Артур Малосиев, Полностью согласен с вами. Пробовал, но увы качество по сравнению с Гуглом просто на 0. Надеюсь яблоко сделает что то невероятное в плане распознавания. Ждем, ждем, ждем
“у этого нет альтернативы.”
У гугла же есть голосовой поиск?!
у гугла голосовой поиск намного лучше распознает. Про распознание для смсок в драгоне я вообще молчу. Эх, а такая хорошая идея!
Ну не знаю я сегодня отправлял 6 довольно длинных смс, в каждом пришлось подправить 1-2 слова, я могу точно сказать, что набирал бы я их дольше чем вносил правки, так что считаю что для моего случая приложение маст хев. Наверное за рулем оно никуда не годится, а, скажем, чтоб отправить сообщение на радио или длинный текст мне очень понравилось.
Ещё заметил что если близко подносить микрофон к губам и усиленно пытаться произнести почётче то распознается хуже почему то:)
Меня почему-то наоборот эта программа обрадовала.
Пользовался поиском от Google, но распознавал речь хуже, чем Dragon. Возможно на это повлияли многие факторы..шум, качество микрофона и т.д.
Единственная причина, почему она не станет популярной это ее существование отдельным приложением, а не интегрированность в iOS. Действительно, на данный момент легче набрать текст рукой.
Первое, что продиктовал это “Шла Саша по шоссе и сосала сушку”. Попадание 100%. (Возможно данные фразы занесены целиком, и распознаются как единое целое ;)
В дальнейшем использовании ошибки были… но 1-2 слова из всего текста… (посторонних шумов не было). Был приятно удивлен. (видимо навыки полученные на курсах акт. мастерства не прошли даром.)
Если сравнивать с встроенным голосовым поиском у iОs, то это небо и земля:
Был случай.
Легли с женой спать (было уже далеко за полночь), свет выключили, разговариваем, глаза к темноте уже привыкли…
Жена: “сколько время?”.
Я: “Щас” (жму долго home) и говорю “Который час?”,
iPhone: “Набираю ~~~~~ов Александр”
ничего не оставалось как сказать “Алло Лёх? Не подскажешь сколько время?”
@Бобров Евгений, ну у меня встроенное управление на iPhone ошибается только на фамилии одного человека, а на фразу “который час” даже на шумной улице не ошибается. Видимо курсы акт. мастерства все таки были зря;)))
@Бобров Евгений, нормально Лёху под Александра зашифровал, перед женой не спалился_)). Достаточно было нажать один раз на home, и посмотреть на экране время…
@Бобров Евгений, а подскажите где найти весь список голосовых команд для iOS ?
@FiTLeSS, на экране айфона, когда вызываешь голосовое управление.
Ничего личного, но у автора статьи, видимо, явные проблемы с дикцией. Я, так же как и grokinn, с удовольствием пользуюсь Dragon Dictation, для надиктовки как СМСок, так и писем. Ясное дело, что если вы хотить отправить СМС с единственным “ОК”, то тогда его проще набить, но если длина вашего послания составляет хотя бы пару предложений, то Dragon Dictation вам настоящий помощник. Лично у меня процент ошибок составляет 1-3%, что для текста из, скажем, 20 слов – очень хороший результат. При этом говорю я бегло и свободно, а не как робот.
Что касается необходимости “наговаривать” знаки препинания – так за это спасибо надо говорить разработчикам, а не подкалывать их на предмет школярности их приложения. Или автор обзора был бы счастлив, наговорив текст, набивать точки с запятыми вручную?
Одним словом, не надо собственные логопедические проблемы переность на здоровые головые разработчиков, которые, к слову, и денег с вас за свою програму не попросили. А могли бы и попросить доллара 4 – и ее бы покупали, уверяю вас!
@Shulz, почитал новость … пред этим установив обе проги …
прочитал, и разочарованно бросил их в папку fuflo на айфон …
прочитал ваше сообщение, и решил проверить – ошибок практически не было в довольно длинном, начитанном тексте.
супер прога
@Shulz, у меня нормальная дикция, но меня плохо распознает. Что я делаю не так?
Что-то у вас с дикцией. У меня крайне редко ошибается, распознает великолепно.
Мне показалось, что распознает лучше гугла.
Своеобразный словарный запас. Слово “рояль” не известно, зато мат распознается влет!
Не знаю, пользовался все отлично и точно записывало. Ну может с именами беда. Но в целом хорошая четверка.
Правда приложение хорошо тем, что развивает дикторскую речь.
Пока что все это игрушки. Не более. И зря все это вынесли из лабораторных стен. Рано.
@online, какие стены, это давно уже коммерческий продукт. Но вот такой вот.
@Entze, Так я и говорю, что сыро пока)
Установил, посмеялся, стёр. Согласен с автором на 100%.
Дай то Б-г, когда-нибудь уже изобретут софт, распознающий обычную речь. И не прийдётся изображать из себя робота, произносящего слова без эмоций.
@bmove,
обычную, это какую ? :) суржик, который и нормальный человек иногда не понимает ? :) и от которого частенько подташнивает :)
я одного знакомого сегодня попросил что-то начитать, чтобы удостовериться в том, что результат на выходе на прямую связан с тем, как правильно умеет человек говорить … разочарован я не был, ибо специально выбрал его, по причине того, что он не говорит, а бубнит себе под нос, глотая половину слов, и добавляя в конце практически каждого слова “ля” :) :) :)
я сразу надиктовал этот же текст – ни одной ошибки в распознавании не было :)
@megadzilla, Я говорю немного о другом. Вот когда в обычной обстановке общаются два человека. Не пытаясь специально вслушиваться в каждое слова, и не пытаясь специально произносить максимально чётко каждое слово, обычный бытовой разговор. Люди понимают друг друга прекрасно, по-тому что логика их восприятия строится на понимание контекста разговора, и даже слова, которые частично может быть не расслышаны ухом, мозг все равно подгоняет под общий контекст выявляя обравки знакомых слов и подставляя их в услышаное, в связи с чем складывается ощущение что фраза была услышана полностью. Вот я говорю о том, что надеюсь наступит такой момент, когда люди смогут создать софт с подобной системой распознавания речи, а не банальным сравнением сказаных слов с образцами внесёнными в базу.
@bmove,
ну да … это уже из серии рекламы сыра “Хох ….нд” :)
“Сынок – это фантастика” :) (с)
Тут напечатанный текст до сих пор не могу автоматом перевести с одного языка на другой :) а вы хотите, чтобы слету голос понимало :)
просто нужно понять, что программа мысли читать не умеет, и самостоятельно добавлять “поглотанные” звуки тож не умеет :)
а так – да :) оно естественно хочется, чтобы все было так просто :)
@megadzilla, Ну когдато про планшеты, и про то что в телефоне может быть цветной экран, только в кино фантастическом видели. :)
@bmove, давай, по приколу :) надиктуем цитату из этой новости, и результат сюда бросим ? :)
к примеру:
Конечно можно присоединиться к мнению тех, кто считает, что если очень четко и с расстановкой проговаривать слова, то все получится или почти получится, но… Но все равно на деле получается как-то не удобно и хлопотно. По сути, для человека, который активно пользуется текстовыми сообщениями, экономия времени от такого ввода текста минимальна, а иногда отсутствует вовсе. И в голове у пользователей, у нас то есть, всплывает простой вопрос, о который довольно часть разбиваются многие аргументы: “А ЗАЧЕМ?”. Просто поиграться и посмеяться в компании с друзьями? Думаю, что вполне сойдет, да и то надоест. Но как рабочий инструмент, приложение не оправдывает ожиданий и рано или поздно все это поймут.
Единственное, что плохо – пашет только с вай-фаем :(
офф: на последних скринах в статусной строке погода – как сделать?
@zeandre, У вас jailbrake есть?
@akisep, тсс, а то забанят. А по сути вопроса?
По сути, нужно из Cydia скачать WeatherIcon.
@akisep, спасибо
Всем привет!
Спасибо всем, кто отреагировал на мой обзор. Я не стану отвечать тем, кто обвинил меня в проблемах с дикцией. Мне все равно, потому что я знаю, что я такой не один. И вообще, кто сказал, что приложение отличное, даже если оно не распознает речь сотен пользователей? Или что, теперь можно за бесплатно подсовывать все, что угодно? Я думаю, что нет.. Тем более, я повторюсь, от такой компании как Nuance сведующие люди ждут гораздо большего. Одно только сотрудничество с Apple у меня вызыввает уважение. Но сейсас не об этом.
Я изначально не собирался принимать участие в обсуждении моего обзора, потому что я не против самого продукта.. Я просто не понимаю зачем он нужен простому пользователю! И включился я в обсуждение только потому что увидел, что многие не понимают, что я хотел сказать.. Возможно это моя вина.
Так вот, основные вопросы тут – ЗАЧЕМ? и ЧТО ДАЛЬШЕ?.
Ну надиктовали мы текст.. И что? Потом исправили.. А потом все по-старинке.. Ну хорошо..
А что вы скажете в оправдание тех, кто кайфует от этого приложения за рулем? Ну это невозможно..
Обзор не направлен непосредственно на приложение.. Он направлен на то, что нужно реально смотреть на вещи, а не кидаться на недоработанную новинку с воплями восторга..
По итогу, нужно поражаться маркетинговой стратегии Nuance а не самим продуктам.. Они сыграли на том, что многи слаще редьки, как говорится, ничего не пробовали.. Ну Молодцы!
У меня ко всем призыв: Будьте реалистами и цените свое время и положительные эмоции! Dragon в том виде, в котором мы его знаем не стоит нашего внимания. И я настаиваю на этом!
С уважением, Аки Сапир.
@akisep, выводы бредовейшие.
я одним куском начитываю целый абзац письма. за несколько секунд правлю его, и отправляю …
а вы бы добавляли крупными буквами в конце каждого “фу”, что это ваше IMHO !!! и еще бы добавляли, что вы ни в коем случае не пытаетесь навязать его другим … (на всякий случай :) вдруг кто-то не знает что такое IMHO )
а то настаивает он :) призывает :)
это не обзор уже вышел, а откровенное поливание грязью? и навязывание своего мнения, которое, для меня к примеру, ничего значит :) …
да и в комментариях, мнения людей разделились 50 на 50 … у одних нормально, у других лажа …
если у вас не вышло надиктовать так, чтобы машина вас поняла с минимальным кол-вом ошибок, то не стоит всех под вашу гребенку чесать … у меня получается отлично :)
я так и не понял по скриншотам, какой именно “вот этот” текст наговаривался в качестве тестового… :(
Беспонтовое приложение. На самом деле, очень плохое приложение.
Я думал, намного будет… Намного лучше будет это все. И очень плохое приложение, просто очень плохое приложение! Я думал, намного лучше это все будет. Сколько раз в аппстор ходил — было намного лучше, но на этот раз как-то не удалось.
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Как освободить место на iPhone?
Как отключить автоматический запуск музыкального плеера на Apple Watch
Как работает выделение текста в iOS с 3D-Touch
Как на iPhone включить проговаривание текста любой страницы в Safari
Как отвязать iPhone от оператора?
Что делать, если iPhone зависает во время входящих вызовов
Почему при входящем СМС на iPhone есть звук, но нет уведомления
Как сбросить настройки приложения Почта на iPhone