O objetivo é realizar a automação com reconhecimento de áudio. A solução contempla a construção de um sistema que realize a conversão de voz para texto, o sistema de classificação de intenção dado o texto do usuário, utilizando técnicas de inteligência artificial, contempladas na área de processamento de linguagem natural. Além disto, será projetada a integração deste sistema com dispositivos IoT comerciais, como lâmpadas inteligentes, umidificadores, aquecedores, entre outros atuadores, que possuam interface de comunicação aberta por meio de rede local e Internet. Por fim, os estudantes irão fazer o controle de versões dos documentos usando a ferramenta Git e disponibilizar a solução completa no GitHub.
Para dar suporte a este sistema, os estudantes deverão projetá-lo com os conceitos de escalabilidade, balanceamento de carga, tolerância à falhas, arquitetura orientada à serviços, gerenciamento e metodologias de desenvolvimento, para resolver um problema real, no contexto apresentado pelo parceiro de mercado selecionado.
EXEMPLOS DE APLICAÇÃO:
- Reconhecimento de voz em cenários hands-free (situações em que o usuário possui preferência por interações sem uso das mãos, como controle de acesso após realizar compras em um mercado, durante a direção de veículos, quando está dentro de casa cozinhando);
- Chatbots personalizados (respostas adaptativas de acordo com o sentimento do usuário);
- Reconhecimento de voz e interfaces conversacionais para aplicações de acessibilidade.
RECURSOS DE INFRAESTRUTURA OBRIGATÓRIOS:
- Linguagens de programação e tecnologias para a aplicação de machine learning, frontend, backend e deploy em nuvem: C, C++, Python, JavaScript, HTML, CSS e outras que forem relevantes para a aplicação desenvolvida;
- Acesso à plataforma de nuvem com funcionalidade para pipelines de engenharia de dados e machine learning;
- Sistema de controle de versão: Git com distribuição e colaboração na plataforma GitHub;
- Banco de Dados: DynamoDB, SQLite, MySQL ou PostgreSQL ou Banco de Dados do Parceiro de Mercado;
- Integrated Development Environment- IDE (VSCode);
- Serviços de parceiros de tecnologia de cloud;
- Frameworks, bibliotecas e/ou software para integração com o sistema de IoT disponibilizado pela instituição;
- Acesso a um conjunto de dados com anotações e de tamanho condizente com o treinamento de modelos de machine learning para a aplicação em questão (e.g., exemplos de frases categorizadas com intenções, respostas esperadas e/ou ações esperadas).
FINALIZAÇÃO E ENTREGA DO PROJETO:
Todos os protótipos gerados durante o projeto são entregues ao final da 10° semana.