亚洲区视频在线观看,97在线视频免费观看费观看,91国视频在线

這里加載數(shù)據(jù)、準(zhǔn)備特征和標(biāo)簽，并將數(shù)據(jù)集劃分為訓(xùn)練集和測試集，這是一個回歸任務(wù)，特征price為目標(biāo)特征其余特征為自變量。

模型訓(xùn)練

from sklearn.ensemble import RandomForestRegressor from sklearn.metrics import mean_squared_error, r2_score from sklearn.model_selection import train_test_split # 設(shè)置參數(shù)范圍 n_estimators_range = np.arange(25, 201, 20) max_depth_range = np.arange(3, 16, 1) # 用于存儲結(jié)果的列表 rmse_results = [] r2_results = [] # 進(jìn)行嵌套循環(huán)，遍歷參數(shù)組合 for n_estimators in n_estimators_range: for max_depth in max_depth_range: # 創(chuàng)建隨機森林回歸模型 model = RandomForestRegressor( n_estimators=n_estimators, max_depth=max_depth, random_state=42 ) # 訓(xùn)練模型 model.fit(train_X, train_y) # 進(jìn)行預(yù)測 predictions = model.predict(test_X) # 計算 RMSE 和 R^2 rmse = np.sqrt(mean_squared_error(test_y, predictions)) r2 = r2_score(test_y, predictions) # 保存 RMSE 結(jié)果 rmse_results.append({ 'n_estimators': n_estimators, 'max_depth': max_depth, 'RMSE': rmse }) # 保存 R^2 結(jié)果 r2_results.append({ 'n_estimators': n_estimators, 'max_depth': max_depth, 'R^2': r2 }) # 將結(jié)果轉(zhuǎn)換為 DataFrame rmse_df = pd.DataFrame(rmse_results) r2_df = pd.DataFrame(r2_results)

通過遍歷不同的 n_estimators 和 max_depth 參數(shù)組合，使用隨機森林回歸模型對數(shù)據(jù)進(jìn)行訓(xùn)練和測試，計算每種參數(shù)組合下的模型預(yù)測誤差（RMSE）和決定系數(shù)（R2），并將結(jié)果分別保存為各自的一個dataframe，方便接下來進(jìn)行繪圖展示模型參數(shù)和模型評價指標(biāo)的相互影響變化。

模型可視化

import matplotlib.pyplot as plt from matplotlib.colors import LinearSegmentedColormap from matplotlib import rcParams # 設(shè)置字體 rcParams['font.family'] = 'Times New Roman' rcParams['font.size'] = 12 # 設(shè)置適合的字體大小 # 創(chuàng)建網(wǎng)格數(shù)據(jù) pivot_table = rmse_df.pivot(index="max_depth", columns="n_estimators", values="RMSE") # 定義自定義顏色映射（從藍(lán)色到紅色的漸變，并使其淡化） cmap = LinearSegmentedColormap.from_list( "custom_cmap", [(180/255, 190/255, 240/255), (250/255, 150/255, 160/255)] ) # 創(chuàng)建圖表 plt.figure(figsize=(10, 8), dpi=1200) # 使用 contourf 進(jìn)行平滑填充等高線圖 contour = plt.contourf( pivot_table.columns.values, # n_estimators 值 pivot_table.index.values, # max_depth 值 pivot_table.values, # RMSE 值 levels=np.linspace(pivot_table.values.min(), pivot_table.values.max(), 10), # 等高線數(shù)量，越多越平滑 cmap=cmap # 自定義顏色映射 ) # 添加顏色條，并設(shè)置三位小數(shù)的格式 cbar = plt.colorbar(contour, format='%.3f') cbar.set_label('RMSE') # 設(shè)置 y 軸刻度從 4 開始，每 2 為一個間隔 plt.yticks(np.arange(4, pivot_table.index.max() + 1, 2)) # 設(shè)置圖表標(biāo)題和軸標(biāo)簽 plt.title("Hyperparameter Tuning - RMSE (Magnetite(Mt)%)") plt.xlabel("n_estimators") plt.ylabel("max_depth") # 顯示圖表 plt.show()

通過創(chuàng)建等高線圖（等高線的數(shù)量和模型的迭代次數(shù)都會影響可視化效果，選擇合理的等高線數(shù)量可以使可視化圖表更加精美和易于解讀），我們可視化了不同 n_estimators 和 max_depth 參數(shù)組合下隨機森林模型的 RMSE 值，以直觀分析超參數(shù)對模型誤差的影響。此處僅選取了隨機森林中最重要的兩個參數(shù)作為 X 軸和 Y 軸進(jìn)行可視化。如果讀者希望對更多參數(shù)進(jìn)行可視化，建議可以引入降維方法，將多維參數(shù)降至 2D 或 3D 進(jìn)行展示，盡管這樣會失去對實際參數(shù)值的直接呈現(xiàn)。

當(dāng)前的可視化展示了不同 n_estimators 和 max_depth 參數(shù)組合下的 RMSE 值，但并未明確標(biāo)出在最優(yōu)平均指標(biāo)下的模型參數(shù)，接下來，我們將通過改進(jìn)可視化，在圖表中添加文本標(biāo)注，明確指出 RMSE 最小值所對應(yīng)的最優(yōu)參數(shù)組合。

# 創(chuàng)建網(wǎng)格數(shù)據(jù) pivot_table = rmse_df.pivot(index="max_depth", columns="n_estimators", values="RMSE") # 定義自定義顏色映射（從藍(lán)色到紅色的漸變，并使其淡化） cmap = LinearSegmentedColormap.from_list( "custom_cmap", [(180/255, 190/255, 240/255), (250/255, 150/255, 160/255)] ) # 創(chuàng)建圖表 plt.figure(figsize=(10, 8),dpi=1200) # 使用 contourf 進(jìn)行平滑填充等高線圖 contour = plt.contourf( pivot_table.columns.values, # n_estimators 值 pivot_table.index.values, # max_depth 值 pivot_table.values, # RMSE 值 levels=np.linspace(pivot_table.values.min(), pivot_table.values.max(), 10), # 等高線數(shù)量，越多越平滑 cmap=cmap # 自定義顏色映射 ) # 找到 RMSE 最小值的位置 min_rmse = pivot_table.values.min() min_position = np.where(pivot_table.values == min_rmse) min_x = pivot_table.columns[min_position[1][0]] min_y = pivot_table.index[min_position[0][0]] # 在最小值位置添加標(biāo)注和箭頭，向左移動標(biāo)注 plt.annotate( f'RMSE Min: {min_rmse:.3f}\n(n_estimators: {min_x}, max_depth: {min_y})', xy=(min_x, min_y), xycoords='data', xytext=(min_x - 30, min_y + 1), textcoords='data', # 向左移動 arrowprops=dict(facecolor='black', shrink=0.05, width=1, headwidth=6), fontsize=12, ha='right' # 文本對齊方式改為靠右 ) # 添加顏色條，并設(shè)置三位小數(shù)的格式 cbar = plt.colorbar(contour, format='%.3f') cbar.set_label('RMSE') # 設(shè)置 y 軸刻度從 4 開始，每 2 為一個間隔 plt.yticks(np.arange(4, pivot_table.index.max() + 1, 2)) # 設(shè)置圖表標(biāo)題和軸標(biāo)簽 plt.title("Hyperparameter Tuning - RMSE (Magnetite(Mt)%)") plt.xlabel("n_estimators") plt.ylabel("max_depth") # 顯示圖表 plt.show()

同理與RMSE的代碼相似，但這里目的是可視化不同參數(shù)組合下的值，而不是 RMSE。

# 創(chuàng)建網(wǎng)格數(shù)據(jù) pivot_table = r2_df.pivot(index="max_depth", columns="n_estimators", values="R^2") # 定義自定義顏色映射（從藍(lán)色到紅色的漸變，并使其淡化） cmap = LinearSegmentedColormap.from_list( "custom_cmap", [(180/255, 190/255, 240/255), (250/255, 150/255, 160/255)] ) # 創(chuàng)建圖表 plt.figure(figsize=(10, 8), dpi=1200) # 使用 contourf 進(jìn)行平滑填充等高線圖 contour = plt.contourf( pivot_table.columns.values, # n_estimators 值 pivot_table.index.values, # max_depth 值 pivot_table.values, # R^2 值 levels=np.linspace(pivot_table.values.min(), pivot_table.values.max(), 10), # 等高線數(shù)量，越多越平滑 cmap=cmap # 自定義顏色映射 ) # 添加顏色條，并設(shè)置三位小數(shù)的格式 cbar = plt.colorbar(contour, format='%.3f') cbar.set_label(r"$R^2$") # 找到 R^2 最大值及對應(yīng)的 max_depth 和 n_estimators max_r2 = pivot_table.values.max() max_r2_location = np.where(pivot_table.values == max_r2) max_depth = pivot_table.index[max_r2_location[0][0]] n_estimators = pivot_table.columns[max_r2_location[1][0]] # 在圖表上添加文本標(biāo)注 plt.text( x=n_estimators, y=max_depth, s=f"$R^2$: {max_r2:.3f}\nmax_depth: {max_depth}\nn_estimators: {n_estimators}", color="black", fontsize=10, ha="right", # 水平對齊方式為右對齊 va="top", # 垂直對齊方式為頂對齊 bbox=dict(facecolor='white', alpha=0.6, edgecolor='none') # 添加背景框以提高可讀性 ) # 設(shè)置 y 軸刻度從 4 開始，每 2 為一個間隔 plt.yticks(np.arange(4, pivot_table.index.max() + 1, 2)) # 設(shè)置圖表標(biāo)題和軸標(biāo)簽 plt.title(r"Hyperparameter Tuning - $R^2$ (Magnetite(Mt)%)") plt.xlabel("n_estimators") plt.ylabel("max_depth") # 顯示圖表 plt.show()

結(jié)束語

通過本次分析，我們對隨機森林模型中的兩個關(guān)鍵參數(shù) n_estimators 和 max_depth 在不同組合下對模型性能的影響進(jìn)行了可視化探討，主要聚焦于和RMSE這兩個評價指標(biāo)，通過直觀的可視化，我們不僅揭示了如何通過調(diào)整超參數(shù)來優(yōu)化模型，還提供了一種有效的方法來識別最優(yōu)的參數(shù)組合。

然而，模型性能的評估并不僅限于和RMSE，讀者們可以進(jìn)一步擴展此方法，針對其它回歸評價指標(biāo)，如 MAE（平均絕對誤差）或 MAPE（平均絕對百分比誤差）等，進(jìn)行類似的分析，同樣，對于分類模型而言，此方法同樣適用，可以針對 F1-score、召回率等指標(biāo)進(jìn)行參數(shù)調(diào)優(yōu)的可視化展示，從而全面提升模型的準(zhǔn)確性與可靠性。

我們有何不同？

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型，提升決策效率

查看全部API→

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道

一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道

一鍵對比試用API 限時免費

模型訓(xùn)練

模型可視化

結(jié)束語

特征選擇：基于隨機森林的Boruta算法應(yīng)用

提升機器學(xué)習(xí)精度：利用SHAP值與蒙特卡洛模擬優(yōu)化特征選擇

我們有何不同？

熱門場景實測，選對API

#AI文本生成大模型API

#AI深度推理大模型API