|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
весь фокус - в получении сонограммы/спектрограммы из трека далее она превращается в нули и единицы (первые 20 сек) (в стандартный формат для нейросети [input, output]) и скармливается нейросетке в БД обучения после накопления ума, нейросеть уже может отдавать результаты многое зависит от числа хидден-лэйерз другими словами, нейросеть не распознает голос или трек, если его нет в БД сети она выдаст результат, максимально приближённый к запросу, но не более в принципе - всё для получения спектрограмм есть готовые библы, написанные умными кодерами, хотя можно и самому, попроще главный минус всех NN - долгий процесс загрузки шаблона обучений и все это требует ресурсов ЦPU ну и соотв. - трудозатраты на сам процесс обучения ручной тяглый труд касательно музаудиотреков, там можно сильно упростить обучение - тренировать сеть только на файлах, в которых прописаны метаданные - стиль, название и прочее оказывается, в инете уже есть сайты, предоставляющие свои платные API, для распознавания аудио и на гитхабе - тьма врапперов, под такие "апи" ------------------------------ главный вопрос - а, зачем? - хуйзнает ... |
|||
:
Изменено: 01.01.2024, 16:40 - lour
Нравится:
Не нравится:
|
|||
01.01.2024, 16:39 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
01.01.2024, 17:25 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|
---|---|
#18+
а, да, вспомнил про распознавалки разных контор: когда вы хотя бы раз туда звонили и говорили своим голосом (даже - боту), спектрограмма вашего "я" там уже, есть в следующий раз, даже, если вы будете звонить им из зимбабве, распознавалка мгновенно вас вычислит (по спектру вашего голоса) )) - это, еще один из примеров применения подобной хуйни )) ... |
|
:
|
|
02.01.2024, 02:17 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
вот еще интересная инфа: по сути получается, что на основе нейросети, распознающей голос, можно реализовать уникальную идентификацию личности для чего? ну, например, для оплаты ТНП )) у москалей же в метро уже делали распознавалку по ебальнику )) года 3 назад, видос мелькал на ютубах ... |
|||
:
Нравится:
Не нравится:
|
|||
02.01.2024, 02:21 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
далее сразу возникает тема фейков )) тоесть - можно ли реализовать некий генератор шума, спектр которого будет имитировать любого? ))) например - есть же т.н. хеш-коллизии так и это ... |
|||
:
Изменено: 02.01.2024, 02:23 - тоу
Нравится:
Не нравится:
|
|||
02.01.2024, 02:22 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
вот еще тема возникла, одна... интересно, как меняется спектр речи в зависимости от возраста? тоесть, понятно, что - меняется вопрос - в другом: можно ли провести идентификацию одного и того же человека по голосу с разницей в 5-10-30 лет? если, да - то это весьма интересная, тема... например можно сравнить голоса известной политоты )) а то тут разное про них говорят )))) ... |
|||
:
Нравится:
Не нравится:
|
|||
02.01.2024, 02:28 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
и если ебало можно рихтануть (проведением ряда пластоперций) то, можно ли таким же образом рихтануть спектр голоса? ) ... |
|||
:
Изменено: 02.01.2024, 02:29 - тоу
Нравится:
Не нравится:
|
|||
02.01.2024, 02:29 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
в принципе, можно уже сейчас самостоятельно провести ряд исследований в этой области: например, найти несколько известных личностей, которые ни у кого не вызывают сомнения в их подлинности и провести анализ их речевых спектров на протяжении их жизни ... |
|||
:
Изменено: 02.01.2024, 02:32 - тоу
Нравится:
Не нравится:
|
|||
02.01.2024, 02:31 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
что ещё, можно? например мгновенно диагностировать неисправность автомобиля по шуму, который он издаёт )) но для этого потребуется создать специальную БД для обучения нейросети (ну, как и везде) хотя, электрику авто, так вряд ли вычислишь да и есть уже суперские диагностические комплексы, кмк хуйня это всё ... |
|||
:
Изменено: 02.01.2024, 02:36 - тоу
Нравится:
Не нравится:
|
|||
02.01.2024, 02:33 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
что еще? - например, диагностировать спектр заболеваний человека по спектру его дыхания )) наверное, это кажется, бредом, но, мало ли... )) вопрос - в создании шаблонов для обучения нейросети ... |
|||
:
Изменено: 02.01.2024, 02:35 - тоу
Нравится:
Не нравится:
|
|||
02.01.2024, 02:34 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
еще с помощью нейросети можно предсказывать землетрясения хотя, такое давно уже есть и без нейрос ... |
|||
:
Нравится:
Не нравится:
|
|||
02.01.2024, 02:37 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
еще можно попросить юзера форума сказануть что либо в микрофон ) из этого звука получить спектрограмму и в дальнейшем проводить идентификацию при утере пароля, потере кукисов и тд можно даже написать такой простенький класс для теста желающих )) ... |
|||
:
Изменено: 02.01.2024, 02:45 - тоу
Нравится:
Не нравится:
|
|||
02.01.2024, 02:43 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|||
---|---|---|---|
#18+
Пожалуй, самое полезное применение речевых распознавалок : стенограмма популярных телепередач (новости, ток-шоу, ...) с последующим всенародным обсуждением в формате вебфорума. Ох, как власти боятся такой перспективы... ) Помню, пару лет назад телекомпания ОТР ещё публиковала текстовые конспекты своих ток-шоу, но обсуждать это в формате ВКонтактика? - чёрт ногу сломит..., да и конфиденциальности нет :(. А других известных форумов модерируемых но без лишней цензуры -- мне не известно. Помечтаем? В общем, телекомпаниям нужен быстрый текстовый сайт-форум. Возможно, даже договорятся о единой площадке. Представьте, как это будет: В момент выхода телепередачи -- вся страна включает компьютеры. Потому что самое интересное -- именно в текстовых комменетах. ... |
|||
:
Изменено: 02.01.2024, 15:13 - 1_(webForums fanat)
Нравится:
Не нравится:
|
|||
02.01.2024, 15:11 |
|
Вчера гуглил, как люди распознают аудтотреки или голос
|
|
---|---|
#18+
Пожалуй, самое полезное применение речевых распознавалок : стенограмма популярных телепередач (новости, ток-шоу, ...) с последующим всенародным обсуждением в формате вебфорума. Ох, как власти боятся такой перспективы... ) Помню, пару лет назад телекомпания ОТР ещё публиковала текстовые конспекты своих ток-шоу, но обсуждать это в формате ВКонтактика? - чёрт ногу сломит..., да и конфиденциальности нет :(. А других известных форумов модерируемых но без лишней цензуры -- мне не известно. Помечтаем? В общем, телекомпаниям нужен быстрый текстовый сайт-форум. Возможно, даже договорятся о единой площадке. Представьте, как это будет: В момент выхода телепередачи -- вся страна включает компьютеры. Потому что самое интересное -- именно в текстовых комменетах. я писал о нейросети, а ты - о трансформации голоса - в текст в чём разница: нейроесть распознаёт голос для последующей идентификации а просто распознавалки голос-текст такого не умеют и предназначны для другого ещё раз: распознавание голоса нейросетью предназначено для идентификации персоны, а не для трансформации голоса в текст проще говоря, нейросеть распознает "кто именно говорит", а не что - именно :) ------------------ а распознавание аудиотреков - да, там распознаётся, что за песенка, потому что в БД н.с. её спектрограмма уже, есть ... |
|
:
|
|
02.01.2024, 18:28 |
|
|
Start [/forum/topic.php?fid=8&tid=15186&gotonew=1]: |
0ms |
get settings: |
22ms |
get forum list: |
13ms |
check forum access: |
1ms |
check topic access: |
1ms |
track hit: |
20ms |
get topic data: |
15ms |
get first new msg: |
2ms |
get forum data: |
1ms |
get page messages: |
58ms |
update_topic_read_status (15186): 02.01.2024 18:28:22: |
0ms |
get tp. blocked users: |
1ms |
get online users: |
71ms |
check new: |
380ms |
others: | 331ms |
total: | 916ms |
0 / 0 |