Vídeo sobre o projeto concorreu com outros 225 finalistas de escolas dos Ensinos Fundamental, Médio e Técnico de todo o país e teve mais de 4,5 mil visualizações no YouTube
Laura Jeronimo é aluna do Ensino Médio Integrado ao Técnico de Informática para Internet da Etec de Ribeirão Pires I Foto: Roberto Sungi
Um projeto que compara técnicas de machine learning para identificar erros em palavras homófonas e parônimas na língua portuguesa conquistou o segundo lugar na votação popular da Mostra de Projetos da 21ª edição da Feira Brasileira de Ciências e Engenharia (Febrace). O trabalho é de autoria de Laura Esther Correia Jeronimo, aluna do Ensino Médio Integrado ao Técnico de Informática para Internet da Escola Técnica Estadual (Etec) Profa. Maria Cristina Medeiros, de Ribeirão Pires, que foi orientada pelos professores Cintia Maria de Araújo Pinho e Anderson Silva Vanin. O resultado foi divulgado na quarta-feira (29), pelo site da Febrace.
A votação popular foi realizada a partir do número de visualizações dos vídeos publicados nos canais dos projetos participantes. Até o encerramento da votação, o trabalho conquistou 4.567 visualizações no YouTube. O projeto da Etec da Região do ABC concorreu com outros 225 finalistas de escolas dos Ensinos Fundamental, Médio e Técnico de todo o país.
Entenda o objetivo do trabalho
As palavras homófonas são aquelas que têm a mesma pronúncia, mas são escritas de formas diferentes. Já as parônimas têm grafias semelhantes, porém significados distintos. “Analisando a dificuldade que temos com essas palavras, comecei a pensar em uma forma de como poderia ajudar as pessoas”, comenta a estudante.
Ao entrar em contato com uma das fundadoras da startup CRIA, uma plataforma de correção de redação e desenvolvimento, Laura iniciou o projeto. “Percebemos que diversas redações tinham erros envolvendo palavras homófonas e parônimas, mostrando que realmente é um problema entre os estudantes.”
O projeto começou a ser desenvolvido utilizando técnicas de processamento de linguagem natural e machine learning, com o intuito de suprir um problema real. “Usamos algoritmos de classificação e fizemos um programa que auxilia na identificação dessas palavras.”
Machine learning é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da Inteligência Artificial (IA) que se concentra no uso de dados e algoritmos para imitar a maneira como os humanos aprendem, melhorando a sua precisão.
Nos testes, o uso de uma base de dados com aproximadamente seis mil frases mostrou que 45 palavras foram classificadas como homófonas e parônimas. Os algoritmos que performaram melhor foram o Gradient Boosting Classifier e SGDClassifier, em média com uma precisão de 93,5%. Como resultado, a startup CRIA, apoiadora do projeto, deve passar a adotar a solução apresentada por Laura.