Diário de TCC #0

Mychelle Araujo
2 min readMar 11, 2023

Série de posts especial para meu TCC da pós-graduação Data Analytics e Inteligência Artificial na FIA

Bom, primeiramente quero contar da minha proposta inicial da pesquisa, estou utilizando uma base de dados da comunidade Mulheres em Dados, em que traz dados sobre formação, realidade atual, cursos, transição de carreira e claro algumas informações sobre a mulher que preencheu. É um formulário do google que é compartilhado no momento que uma nova pessoa entra no servidor do discord e claramente tenho autorização para o uso.

A comunidade Mulheres em Dados é uma comunidade feminina voltada para mulheres que querem ou estão na área de dados, nós incentivamos que cada vez mais que ocupemos mais espaço nessa área, além de claro compartilhar conhecimento, o que é benefíco para quem recebe e para quem compartilha. O principal canal de comunicação é o discord, no qual o servidor já conta com mais de 5 mil mulheres, diversos canais de textos/áudio para cada assunto, além de um grande equipe de colaboradoras (desde administração até assistência) que ajuda na organização de eventos e iniciativas para todas.

Comunidade Mulheres em Dados

Como forma de levantar nosso público, temos um formulário na entrada desse servidor que pergunta algumas coisas sobre a mulher que está ingressando, como somos voltadas para dados, nada melhor que criar uma análise voltada para isso. Além de ser meu objeto de estudo, também pode colaborar com o crescimento da comunidade como um todo.

Para analisar um dado, é ideal que tenha um caminho a seguir, mesmo já tendo uma base escolhida, é interessante ter um “problema” a resolver, por isso de início optei por trabalhar em cima da criação de um modelo de recomendação de curso para as novas entrantes.

Mas como isso funciona?

Eu crio um modelo que analisará cada informação respondida no formulário, em que as mulheres contam cursos, canais, cargos que fizeram ou tem vontade de fazer, e assim vou prever qual deve ser a melhor opção de curso para a pessoa que ingressar no servidor, em que analisando todos os perfis anteriores, ele irá sugerir cursos que estejam mais adequados a realidade da pessoa em questão.

Infelizmente, não é só pegar o formulário e já começar “brincar”, tem o principal passo que é o famoso ETL (Extract, Transforming and Loading), por isso depois de exportar a base para csv, minha próxima atuação foi completamente no tratamento desses dados.

No próximo relato, entrarei em detalhes sobre o que fiz.

Até lá

--

--