from sklearn.feature_extraction.text import CountVectorizer # Creamos una lista de documentos de texto documentos = [ "El gato está sobre la mesa", "El perro está debajo de la mesa", "El ratón está junto a la mesa" ] # Creamos una instancia de CountVectorizer vectorizador = CountVectorizer() # Ajustamos y transformamos los documentos documentos_codificados = vectorizador.fit_transform(documentos) # Obtener el vocabulario (palabras únicas) vocabulario = vectorizador.get_feature_names_out() # Imprimimos el vocabulario print(vocabulario) # Imprimimos la representación vectorial de los documentos print(documentos_codificados.toarray())