首页
注册
登录
liangzulin 最近的时间轴更新
liangzulin
V2EX 第 327307 号会员,加入于 2018-07-06 11:29:40 +08:00
liangzulin
提问
技术话题
好玩
工作信息
交易信息
城市相关
liangzulin 最近回复了
2019-04-28 16:26:55 +08:00
回复了
windflurry
创建的主题
›
问与答
›
[scala]xgboost4j 中的 train 方法要求接收 dmatrix 参数,怎么将 dataframe 格式转成 dmatrix 啊
DataFrame ?你确定说的是 DataFrame 吗?这是 xgboost python 里边的 API 吧。
spark 在 JAVA 里边是 Dataset<>
如果是 pandas DataFrame 的话,转成 DMatrix 是这么转的:
df = pd.read_csv('some_data.csv')
X_train_df = df[['col_x1', 'col_x2', 'col_x3', 'col_x4']]
y_train_df = df[['col_y']]
dtrain = xgb.DMatrix(X_train_df, label=y_train_df)
»
liangzulin 创建的更多回复
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
738 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms ·
UTC 21:21
·
PVG 05:21
·
LAX 14:21
·
JFK 17:21
Developed with
CodeLauncher
♥ Do have faith in what you're doing.