دسته بندی داده های دیتاست
سلام دوستان
می خوام این دیتاست دسته بندی کنم. اما نمی دونم چی کار کنم.
اینجا رو دیدم اما نمی دونم چطور داده ها رو تقسیم بندی کنم(تست و اموزش)
این که ستون ها نام نداره باید چطور بهش دسترسی پیدا کرد.
لطفا راهنمایی کنید.
from sklea.linear_model.logistic import LogisticRegression
path_csv = Path('newsCorpora.csv').absolute()
data = pd.read_csv(path_csv)
X_train_raw, X_test_raw, y_train, y_test = train_test_split(data.iloc[0],data.iloc[1])
vec = TfidfVectorizer()
X_train = vec.fit_transform(X_train_raw)
classifier = LogisticRegression()
classifier.fit(X_train, y_train)
X_test = vectorizer.transform( ['URGENT! Your Mobile No 1234 was awarded a Prize', 'Hey honey, whats up?'] )
predictions = classifier.predict(X_test)
print(predictions)
