Challenge 1: Convert Text Matrix
O desafio proposto envolve a análise de dois textos em latim. A abordagem para enfrentar esse desafio inclui a transformação dos textos em matrizes, onde cada elemento representa informações sobre a presença ou frequência de determinados elementos linguísticos. A análise de similaridade entre as duas matrizes permitirá avaliar o grau de semelhança entre os textos em latim.
O desafio de analisar a similaridade entre dois textos em latim foi abordado utilizando o algoritmo CountVectorizer e contagem de n-gramas. Ao aplicar essa metodologia, a matriz resultante permitiu calcular o grau de similaridade entre os textos, revelando que o índice obtido foi de 0.11. Esse valor indica a medida quantitativa da proximidade linguística entre os textos.
GitHub: Challende 1: Convert Text Matrix