Word Frequencies with TfidfVectorizer code

from sklearn.feature_extraction.text import TfidfVectorizer
# list of text documents
text = ["The quick brown fox jumped over the lazy dog.",
		"The dog.",
		"The fox"]
# create the transform
vectorizer = TfidfVectorizer()
# tokenize and build vocab
vectorizer.fit(text)
# summarize
print(vectorizer.vocabulary_)
print(vectorizer.idf_)
# encode document
vector = vectorizer.transform([text[0]])
# summarize encoded vector
print(vector.shape)
print(vector.toarray())

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Word Frequencies with TfidfVectorizer code #35

list of text documents

create the transform

tokenize and build vocab

summarize

encode document

summarize encoded vector

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Word Frequencies with TfidfVectorizer code #35

Description

list of text documents

create the transform

tokenize and build vocab

summarize

encode document

summarize encoded vector

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions