MÉTODOS COMPUTACIONAIS APLICADOS EM RECONHECIMENTO SONORO E BIOMETRIA POR VOZ

  • Sabrina Cristina da Silva Universidade do Oeste Paulista - Unoeste
  • Danillo Roberto Pereira Faculdade de Informática de Presidente Prudente (FIPP) – Unoeste
  • Francisco Assis da Silva Universidade do Oeste Paulista - Unoeste
  • Helton Molina Sapia Universidade do Oeste Paulista - Unoeste
Palavras-chave: Biometria por voz; extração de características; processamento digital de sinais; reconhecimento sonoro

Resumo

Este trabalho apresenta o projeto, construção, desenvolvimento e análise da submissão de bases de dados à métodos computacionais utilizados no reconhecimento sonoro. Estão descritos todos os detalhes da metodologia utilizada no desenvolvimento e na coleta de dados, bem como as especificações de cada base de dados utilizada. Ponderações e resultados obtidos nas fases de tratamento dos sinais de voz, resultados das aplicações dos métodos extratores de características utilizados e dos métodos de aprendizado de máquina. Por fim, é avaliado o potencial da autenticação de cada método extrator de características combinados entre os diferentes métodos de aprendizado de máquina utilizado nas determinadas bases de dados.

Downloads

Não há dados estatísticos.

Biografia do Autor

Danillo Roberto Pereira, Faculdade de Informática de Presidente Prudente (FIPP) – Unoeste

Possui graduação em Ciência da Computação pela FCT-UNESP (2006) ; mestrado em Ciência da Computação pela UNICAMP (2009); e doutorado pela UNICAMP. Tem experiência na área de Ciência da Computação, com ênfase em Geometria Computacional, Computação Gráfica e Visão Computacional. lattes.cnpq.br/0122307432250869

Referências

ALBERTO, T.C; ALMEIDA, T.A. Aprendizado de Máquina Aplicado na Detecção Automática de Comentários Indesejados. Departamento de Computação (DComp). Campinas: Unicamp, 2013. Disponivel em: http://www.dt.fee.unicamp.br/~tiago/papers/ENIAC13.pdf.

ARAÚJO, K. M.; SILVA, E. M. Utilização do Algoritmo de Máquina de Vetores de Suporte (SVM) para Predição de Dados Climáticos. In: CONGRESSO DE COMPUTAÇÃO E SISTEMAS. 18., , 2015. p. 149

BLANZ, V. et al.. Comparision of view-based object recognition algorithms using realistic 3d models. 1996. In: C. VON DER MALSBURG, W.; VON SEELEN, J.C.; VORBRUGGEN, and B. Sendhoff, (ed)., Artificial Neural Networks – ICANN, , Berlin, 1996.Sringer Lecture Notes in Computer Science, v. 1112. pages 251 – 256https://doi.org/10.1007/3-540-61510-5_45

BRESOLIN, A.A. Estudo do reconhecimento de Voz para Acionamento de Equipamentos Elétricos via Comandos em Português. 2003. Tese (Doutorado) – Universidade do Estado de Santa Catarina – UDESC, Centro de Ciências Tecnológicas – CCT. Joinville, 2003.

CAMPOS, W.; MACIEL, A.; CARVALHO, E. Investigação de uma Arquitetura para Verificação e Reconhecimento de Locutor. In: SIMPÓSIO BRASILEIRO DE SISTEMAS MULTIMÍDIA E WEB, 2008, Vitória, ES. Anais [...]. Vitória., 2008, p. 17-20.

CARDOSO, S.A.; CASTANHO, J.E.C.; FRANCHIN, M.N.; FONTES, I.R. SESAME: Sistema de Reconhecimento de Comandos de Voz Utilizando PDS e RNA. In: CONGRESSO BRASILEIRO DE AUTOMÁTICA, 18. 2010, Bonito, MS. Anais [...] Bonito – MS, 2010.

CORTES, S.; VAPNIK, V. “Support Vector Machines”. 1995. Machine Learning, 20:273-297. https://doi.org/10.1007/BF00994018

CUADROS, C. D.; CATALDO, E., DA SILVA, D. G., ALCAIM, A., & APOLINÁRIO Jr, J. A. (2007). “Comparação entre as técnicas de MFCC e ZCPA para reconhecimento robusto de locutor em ambientes ruidosos”. Rio de Janeiro, RJ, 2007.

CUSTÓDIO, R.F. Análise Não-Linear no Reconhecimento de Padrões Sonoros: Estudo de Caso para Sons Pulmonares. 1999. Tese (Doutorado) – Universidade Federal do Rio Grande do Sul, Instituto de informática. Porto Alegre, 1999.

COSTA, W. C. A. et al. Classificação de sinais de vozes saudáveis e patológicas por meio da combinação entre medidas da análise dinâmica não linear e codificação preditiva linear. Revista Brasileira de Engenharia Biomédica, v. 29, n. 1, 2013. https://doi.org/10.4322/rbeb.2013.010

DE LA VEGA, A. S. “Apostila de Teoria para Processamento Digital de Sinais”. 2016. 290. Apostila de Teoria – Graduação, Engenharia de Telecomunicações, UFF/TCE/TET 2016.

LIMA, C. A. M. Comitê de Máquinas: uma abordagem unificada empregando máquinas de vetores-suporte. 2004. 342. Tese (Doutorado) - Universidade Estadual de Campinas. Campinas, 2004.

DIAS, M. F. R.; PASCUTTI, P. G.; DA SILVA, M. L. Aprendizado de Máquina e Suas Aplicações em Bioinformática. Semioses, v. 10, n. 1, p. 23-37, 2016. https://doi.org/10.15202/10.15202/1981-996X.2016v10n1p23

DOS SANTOS, C. N. “Aprendizado de máquina na identificação de sintagmas nominais: o caso do português brasileiro”. 2005. Tese (Doutorado) - Instituto Militar de Engenharia. Rio de Janeiro, 2005.

EINSENCRAFT, M. Processamento Digital de Sinais São Paulo: Universidade Presbiteriana Mackenzie, 2007.

FIGUEIREDO, L.H. Raycasting intervalar de superficies implícitas cp, aritmética afim. 1999. Dissertação (Mestrado) – Pontifícia universidade Católica do Rio de Janeiro, Departamento de Informática. Rio de Janeiro, RJ, 1999.

HAYKIN, S.; VAN VEEN, B., “Sinais e Sistemas”. Porto Alegre, RS: Bookman, 2001.

HAYKN, S. Redes Neurais: princípios e prática. Porto Alegre: Bookman, 2001. 900 p.

HÖLBIG, C. A.; PAVAN, W.; VENDRUSCULO, T.; CLAUDIO, D. M. Análise de Ferramentas Intervalares para Computação Gráfica. In: SIMPÓSIO DE INFORMÁTICA DO PLANALTO MÉDIO, 2., 2000, Passo Fundo. Anais [...]. Passo Fundo: UPF, 2000.

KOLOURI, S; PARK, S. R; ROHDE, G. K. The Radon cumulative distribution transform and its application to image classification. IEEE transactions on image processing, v. 25, n. 2, p. 920-934. 2016. https://doi.org/10.1109/TIP.2015.2509419

LATHI, B. P. Sinais e Sistemas Lineares. 2.ed. Porto Alegre, RS: Bookman, 2007.

LORENA, A.C.; DE CARVALHO, A.C.P.L.F. Uma introdução às support vector machines. Revista de Informática Teórica e Aplicada, v. 14, n. 2, p. 43-67, 2007.

LUXBURG, U.; SCHOLKOPF, B. “Statical Learning Theory: Models, Concepts, and Results”. 2008. E-print arXiv preprint arXiv:0810.4752.

MACHADO, A. F. Conversão de Voz Inter-Linguística. 2013. Tese (Doutorado) -. Instituto de Matemática e Estatística - Universidade de São Paulo. São Paulo,

MARANA, A.N; CHIACHIA, G; PAPA, J.P. Análise de Desempenho de Classificadores baseados em Redes Neurais, Máquinas de Vetores de Suporte e Floresta de Caminhos Ótimos Para o Reconhecimento de Dígitos Manuscritos. Bauru: UNESP, Faculdade de Ciências, Departamento de Computação, 2014.

MELO, D.B. Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM. 2011. Monografia (Graduação) -Departamento de Engenharia de Teleinformática, Centro de Tecnologia, Universidade Federal do Ceará. Fortaleza, 2011.

MONTANHER, T.M. “Estimação de Modelos Markov Ocultos usando Aritmética intervalar”. 2015. Tese (Doutorado) – Instituto de Matemática e Estatística, Universidade de São Paulo. São Paulo, 2015.

MOORE, R. E. “Methods and Applications of Inteerval Analysis”. SIAM, Phifadelphia, 1979. https://doi.org/10.1137/1.9781611970906

MUNIZ, D. N., “Estudo Sobre Reconhecimento de Áudio Repetitivo: Desenvolvimento de um Protótipo”, 2009, São José, Instituto Federal de Santa Catarina. 2009.

NUNES, R.A.A; ALBUQUERQUE, M.P.; ALBUQUERQUE, M.P.; SEIXAS, J.M. “Introdução a Processadores de Sinais Digitais - DSP”. CBPF-NT-001/06. Fev., 2006.

PARK, S. R; KOLOURI, S; KUNDU, S; ROHDE, G. K. The cumulative distribution transform and linear pattern classification. Applied and Computational Harmonic Analysis, v. 45, n. 3, p. 616-64, Nov. 2018. . https://doi.org/10.1016/j.acha.2017.02.002

PETRY, A; ZANUZ A.; BARONE, D.A.C. Utilização de Técnicas de Processamento Digital de Sinais para a Identificação Automática pela Voz. In: SIMPÓSIO SOBRE SEGURANÇA EM INFORMÁTICA. 1999. Anais [...]. São José dos Campos, SP, 1999.

PICON, C.T; ROSSI, I; Jr. P.P.M. Análise da classificação de imagens por descritores de cor utilizando várias resoluções. São Carlos, SP.: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP), [2011].

SABANAL, S.; NAKAGAWA, M. The Fractal Properties of Vocal Sounds and Their Application in the Speech Recognition Model. Chaos, Solitons & Fractals, [S.l.], v.7, n.11, p. 1825-1843, 1996. https://doi.org/10.1016/S0960-0779(96)00043-4

SANTANA, F.T.; DÓRIA NETO A.D.; SANTIAGO, R.H.N.. 2012. Sinais de Sistemas Definidos sobre Aritmética Intervalar Complexa. TEMA Tend. Mat. Apl. Comput., v. 13, n. 1, p. 85-86, 2012. https://doi.org/10.5540/tema.2012.013.01.0085

SANTANA, F. T.; DÓRIA NETO, A. D.; SANTIAGO, R. H. N. Uma Proposta de Análise Intervalar para o Mapa Auto-Organizável de Kohonen. Learning and Nonlinear Models, Revista da Sociedade Brasileira de Redes Neurais (SBRN), v. 7, n. 1, p. 03-08, 2009. https://doi.org/10.21528/LNLM-vol7-no1-art1

SANTANA, F. T.; SANTIAGO, R. H. N., DÓRIA NETO, A.D.Fundamentação Intervalar Complexa para Sinais e Sistemas”. In: CONGRESSO NACIONAL DE MATEMÁTICA APLICADA E COMPUTACIONAL, 33., 2010, Águas de Lindóia. Anais [...]. 2009, São Carlos. Anais [...]. . São Carlos: SBMAC, 2009,p. 1-7.

SILVA DE NOVAIS, D. P. Um Modelo Intervalar para Reconhecimento de Fala por Computadores. 2012. . Dissertação (Mestrado) – Universidade Estadual do Sudoeste da Bahia. Vitória da Conquista, BA, 2012.

SOARES, F.A. “Aprendizado de Máquina”. 2008. 18. LES/PUC-Rio.

SOUZA, B. F. S.; TEIXEIRA, A. S.; SILVA, de A.T.F. Classificação de bioma caatinga usando Support Vector Machines (SVM)”. Anais XIV Simpósio Brasileiro de Sensoriamento Remoto, p. 7917-7924. Natal/RN, Abril de 2009.

SUNAGA, T. Theory of na Interval Algebra and its Applications to Numerical Analysis”. RAAG Memoirs v. 2 (1958), 29-46.

TOZADORE, D. C. Aplicação de um robô humanoide autônomo por meio de reconhecimento de imagem e voz em sessões pedagógicas interativas. 2016. Tese (Doutorado) - Universidade de São Paulo. São Carlos, 2016.

TRINDADE, R.M.P. Uma Fundamentação Matemática para Processamento Digital de Sinais Intervalares. 2009. Tese - Universidade Federal do Rio Grande do Norte – Centro de Tecnologia. Natal, RN, 2009. https://doi.org/10.5540/tema.2009.010.01.0087

TRINDADE, R.M.P; BEDREGAL, B.R.C; NETO, A.D.D. Princípios de Processamento Digital de Sinais Intervalares. In: CNMAC, 31., 2008, Belém, PA. Anais [...]. Belém, 2008. . https://doi.org/10.5540/tema.2009.010.01.0087

ZAMPIERI, C.E.A. Recuperação de Imagens Multiescala Intervalar. 2010. Dissertação (Mestrado) – Universidade Estadual de Campinas, Instituto de Computação. Campinas, 2010.

Publicado
2019-07-31
Como Citar
Cristina da Silva, S., Pereira, D. R., Assis da Silva, F., & Molina Sapia, H. (2019). MÉTODOS COMPUTACIONAIS APLICADOS EM RECONHECIMENTO SONORO E BIOMETRIA POR VOZ. Colloquium Exactarum. ISSN: 2178-8332, 11(2), 78-90. Recuperado de http://revistas.unoeste.br/index.php/ce/article/view/3165

Outros artigos do(s) mesmo(s) autor(es)