Nuked Linly's splitting in mining_hq.py

2023-05-15 20:20:01 +03:00
parent 64fc005bfc
commit 29d1e75817
1 changed files with 0 additions and 23 deletions
--- a/dwarves/mining_hq.py
+++ b/dwarves/mining_hq.py
@@ -127,26 +127,3 @@ print(sample_rows.head())
 scout.dissimilarity(sample_rows)
 scout.similarity(sample_rows)
 # split the data set
 gammas_train, gammas_test = train_test_split(gammas, test_size=0.20, random_state=69)
 gammas_train.to_csv("datasets/videogames/games_train.csv", index=False)
 gammas_test.to_csv("datasets/videogames/games_test.csv", index=False)
 # kmeans pls
 gammas_train_kmeans = KMeans(n_clusters=10, random_state=420, n_init="auto").fit(
    gammas_train[["Critic_Score", "User_Score", "Total_Shipped"]]
 )
 gammas_labels = gammas_train_kmeans.labels_
 silh_score = metrics.silhouette_score(
    gammas_train[["Critic_Score", "User_Score", "Total_Shipped"]],
    gammas_labels,
    metric="euclidean",
 )
 print(silh_score)
 gammas_train["Kmean Labels"] = gammas_labels
 print(gammas_train.head())
 # Naive based
 gnb = GaussianNB()
 prediction = gnb.fit(gammas_train)