Challenge 1: Convert Text Matrix

Challenge 1: Convert Text Matrix


#I2A2

O desafio proposto envolve a análise de dois textos em latim. A abordagem para enfrentar esse desafio inclui a transformação dos textos em matrizes, onde cada elemento representa informações sobre a presença ou frequência de determinados elementos linguísticos. A análise de similaridade entre as duas matrizes permitirá avaliar o grau de semelhança entre os textos em latim.

O desafio de analisar a similaridade entre dois textos em latim foi abordado utilizando o algoritmo CountVectorizer e contagem de n-gramas. Ao aplicar essa metodologia, a matriz resultante permitiu calcular o grau de similaridade entre os textos, revelando que o índice obtido foi de 0.11. Esse valor indica a medida quantitativa da proximidade linguística entre os textos.

GitHub: Challende 1: Convert Text Matrix