from sklearn.feature_extraction.text import CountVectorizer

# Creamos una lista de documentos de texto
documentos = [
    "El gato está sobre la mesa",
    "El perro está debajo de la mesa",
    "El ratón está junto a la mesa"
]

# Creamos una instancia de CountVectorizer
vectorizador = CountVectorizer()

# Ajustamos y transformamos los documentos
documentos_codificados = vectorizador.fit_transform(documentos)

# Obtener el vocabulario (palabras únicas)
vocabulario = vectorizador.get_feature_names_out()

# Imprimimos el vocabulario
print(vocabulario)

# Imprimimos la representación vectorial de los documentos
print(documentos_codificados.toarray())