Автор |
Сообщение |
|
Дата: 26 Сен 2013 21:02:59
#
Запускаем программу, подключаем микрофон, нажимаем кнопку Пуск ... говорим, смотрим что получается. Большая просьба не тестировать матерными словами :))
Если есть идеи по применению - пишите здесь или line13@inbox.ru.
скачать |
|
Дата: 26 Сен 2013 22:57:35
#
Круто. Завтра попробую включить диспетчеру автоканала на рабочий комп. Можно лог эфира вести в реалтайм. Программка может текст класть куда угодно???? Правильно понимаю??? Никакого скрипта нет на сайт прикрутить???
|
Реклама Google
|
|
|
Дата: 26 Сен 2013 23:07:38
#
Только русский поддерживается или другие языки тоже?
|
|
Дата: 26 Сен 2013 23:12:38 · Поправил: Zloy (26 Сен 2013 23:13:15)
#
Английский распознает нормально!!!!
Прикольная прога!
|
|
Дата: 26 Сен 2013 23:14:32
#
Большая просьба не тестировать матерными словами :))
так-так)
|
|
Дата: 26 Сен 2013 23:15:41
#
Кстати, неплохо работает! Респект!
|
|
Дата: 26 Сен 2013 23:16:12
#
Да не придумано ещё таких программ!! Как только сделают искуственный интелект вот только тогда может быть. Тем более из эфира с шумами!! Весь перевод только вручную ( как перевести голос в текст) |
|
Дата: 26 Сен 2013 23:36:57
#
|
|
Дата: 27 Сен 2013 00:06:28
#
Работает отлично, только скажите - зачем она в Инет лезет ? :)
|
|
Дата: 27 Сен 2013 00:11:39
#
С радио распознавать не хочет. Рацию подносил к микрофону компа - ни одного слова не узнала.
|
|
Дата: 27 Сен 2013 00:14:00
#
только скажите - зачем она в Инет лезет ? :)
MALE
Автор просил: не тестировать матерными словами :))
Всё сказанное пишется у него и "может быть использовано против Вас в суде".
:)
|
|
Дата: 27 Сен 2013 05:52:05
#
Работает отлично, только скажите - зачем она в Инет лезет ? :)
Программа опасна?
Автор,у вас есть объяснение этому факту?
|
|
Дата: 27 Сен 2013 06:32:00
#
зачем она в Инет лезет
Гуголь Войс?
|
|
Дата: 27 Сен 2013 07:15:41
#
Да не придумано ещё таких программ!! Как только сделают искуственный интелект вот только тогда может быть.
Есть подобные программы и для смартфонов. Так они ещё произнесённую фразу тут же переводят на
любой заданный язык и телефон её проговаривает.Правда требуется подключение
к интернету. Иной раз выручала за бугром.
|
|
Дата: 27 Сен 2013 12:21:39 · Поправил: alt (27 Сен 2013 12:33:00)
#
Отвечаю на вопросы:
Для распознавания речи программа использует сервис Google, поэтому наличие интернета обязательно. На смартфонах используется тот же сервис (Android) и подобный ему (iPhone), поэтому там также требуется интернет.
Программа не опасна, кроме работы с голосом ничего не делает, вредных функций не содержит - уж поверьте многолетнему пользователю Радиосканера. Вирусами не заражена - уж поверьте моему антвирусу.
Я сделал собственно "движок" такой идеи в первой версии. Теперь ломаю голову куда его применить. Было бы неплохо найти заказчика которому я бы довел программу до нужной функциональности под конкретное применение. Планирую добиться повышения скорости (сейчас задержка около 2-х секунд), некоторого повышение качества, уменьшения трафика и т.п. Нужна еще индикация сигнала, разумеется логи и интеграция с сторонним софтом. Возможно распознавать аудиозаписи.
Хорошо распознаётся четкая речь, при шумах, помехах больше ошибок, голос в шумах не распознает. Скажем так, "распознавательная способность" слабее чем у человека, но уже достаточна для ряда применений.
При реализации пришлось попотеть, есть там несколько подводных камней. Тем не менее если кто-то повторит мой "подвиг" буду рад :))
|
|
Дата: 27 Сен 2013 16:26:17
#
alt так движок Ваш собственный или используются какие-то объекты гугля? И можно ли в таком случае отказаться от подключения к инету?
|
|
Дата: 27 Сен 2013 23:47:06
#
Все технологии гугля направлены на изятие ценной информации (например решили напечатать важное совещание или защиту проэкта). Разумно не пользоваться этой функцией гугла, К тому же гугл привяжет идентификатор вашего голоса к ip Мас адресу и т.д.
|
|
Дата: 28 Сен 2013 06:50:24 · Поправил: Programmist (28 Сен 2013 07:02:46)
#
Для распознавания речи программа использует сервис Google.
Понятно. Самой программы нет, находится она где-то там…, на мощных серверах Google.
Программа не опасна, кроме работы с голосом ничего не делает.
Это не известно. Помимо распознавания речи программа может распознать еще очень много чего (чисто по голосу) и наверняка ведет базу.
"распознавательная способность" слабее чем у человека
Пока слабее. Для хорошего распознавания необходима индивидуальная база на каждого. При таком подходе можно распознать очень многое, вплоть до того, что человек ел на ужин неделю назад.
|
|
Дата: 28 Сен 2013 11:40:08
#
mikasa76
Для распознавания речи программа использует сервис Google, поэтому наличие интернета обязательно. Локальные решения разрабатывают многие, но они толком не работают :((
controlunit
Вы правы, еще от мобильной связи следует отказаться, и от интернета. Банковская кредитка и составление официальных бумаг тоже мощные источники утечки информации. В первую очередь следует сжечь паспорт и уйти в горы ... по пути избегайте встречи с людьми, Вас могут опознать. Конечно со спутников все контролируется - не поднимайте лицо в верх, лучше перемещайтесь по ночам :))
Programmist
Какой либо базы не ведется, лог в демке выключен.
Но это все лирика. Есть идеи по применению?
|
|
Дата: 28 Сен 2013 12:00:54
#
Какой либо базы не ведется, лог в демке выключен.
Лог ведется там, где установлена программа, иначе вся затея не имеет смысла.
Создать программу распознавания речи без накопления индивидуальных данных невозможно. Получится игрушка плохого качества.
|
|
Дата: 28 Сен 2013 16:12:52
#
Значит мнения разделились.
Те кто испытывал говорят что работает, и работает хорошо.
Те кто не испытывал говорят что работать не может, потому как этого не может быть, а даже если бы работало то все это опасно очень, а нам такое и не требуется вовсе :))
Ну это нормально, у любой идеи должны быть сторонники и противники.
|
|
Дата: 28 Сен 2013 16:44:21
#
alt
Есть идеи по применению?
Есть! Умный дом.
|
|
Дата: 28 Сен 2013 16:45:42 · Поправил: Programmist (28 Сен 2013 16:54:23)
#
Те кто не испытывал говорят что работать не может, потому как этого не может быть
У этой игрушки борода длинней, чем у Хоттабыча. Какой смысл ее испытывать, когда сам такую делал. Все алгоритмы давно известны, известна так же необходимая вычислительная мощность для процесса и сложность реализации, поэтому локально получается не у всех.
Умный дом.
Умная хозяйка обойдется дешевле. В крайнем случае, поможет обычный пульт. :)
|
|
Дата: 28 Сен 2013 17:36:44 · Поправил: alt (28 Сен 2013 17:46:46)
#
RadioKoteg
То есть голосовой командный интерфейс, чтобы команды настраивались, по команде запускался exe-шник с параметрами, либо по TCP-IP что-то куда-то посылалось. Реализуемо.
Сам-то я голосовые интерфейсы как-то не склонен использовать, ну да это дело вкуса.
Programmist
Локально получается не у всех ... ни у кого точнее.
Умная хозяйка у некоторых подала на развод, вынесла все вещи и отсудила пол-дома :)) Пульт надежнее и привычнее.
|
|
Дата: 28 Сен 2013 18:09:51
#
работает посредственно. База данных мала. Жаргонизмы не понимает. Барабашка распознал как "Паром Божко"
|
|
Дата: 28 Сен 2013 19:11:17
#
Локально получается не у всех ... ни у кого точнее.
Получается, с переменным успехом. Начало доступных программ было положено где-то здесь, потом появилось здесь, на серверах Google к этому делу более серьезный подход. Программа очень сложная и может развиваться практически до бесконечности. Чтобы распознать на том уровне, как это делает человек, на сегодняшний день не хватает вычислительной мощности. |
|
Дата: 28 Сен 2013 20:10:35 · Поправил: alt (28 Сен 2013 20:23:57)
#
Prof61
Попробуйте еще редкие фамилии и абревиатуры, также можно сочинять новые слова :))
Жаргонов и сленгов существует много разных ... правда они не совсем являются русским языком.
Programmist
1й пример - командный интерфейс, то есть будет распознан ограниченный набор речевых команд после "обучения".
2й пример - в Windows в функции речь-в-текст не стали реализовывать русский, он значительно сложнее. Массового использования английского тоже не заметил, если у кого есть позитивный опыт - сообщите.
У человека с распознаванием дела обстоят так - при быстрой речи часть слов мы понимаем из контекста, работает интеллект. При незнакомом слове - переспрашиваем, что оно означает. Бывает и не можем понять собеседника, вроде и слова ясны, а что он этим хотел сказать ...
|
|
Дата: 28 Сен 2013 20:16:35
#
Произношу: "один, два, три" - пишет: 1 2 3
А почему не словами?
|
|
Дата: 28 Сен 2013 20:28:23 · Поправил: alt (28 Сен 2013 20:35:53)
#
Arnold
Потому что это числа, сами то как прочитаете: "1 2 3"?
В целом тогда когда это возможно числа выводятся как числа.
Один недостаток предсказуем - выданный текст всегда будет без знаков препинания, разбивки на предложения. Человек их передает интонацией, паузами, а пишет как учили в школе на диктантах.
|
|
Дата: 28 Сен 2013 20:35:46 · Поправил: Фотограф (28 Сен 2013 20:35:55)
#
Произношу: "один, два, три" - пишет: 1 2 3
А почему не словами?
Arnold
У меня сначала пишет буквами один два три и через мгновение в следующей строке
1 2 3.
|
Реклама Google |
|