Day 27

python 复制代码
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
 
# 1. 加载数据集
train_data = pd.read_csv('/kaggle/input/titanic/train.csv')
test_data = pd.read_csv('/kaggle/input/titanic/test.csv')
 
# 2. 数据预处理
def preprocess(data):
    # 填充缺失值
    data['Age'].fillna(data['Age'].median(), inplace=True)
    data['Embarked'].fillna(data['Embarked'].mode()[0], inplace=True)
    data['Fare'].fillna(data['Fare'].median(), inplace=True)
    # 提取特征
    features = ['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']
    X = pd.get_dummies(data[features])  # 类别特征独热编码
    return X
 
X_train = preprocess(train_data)
y_train = train_data['Survived']
X_test = preprocess(test_data)
 
# 3. 训练模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
 
# 4. 预测并生成提交文件
predictions = model.predict(X_test)
submission = pd.DataFrame({
    'PassengerId': test_data['PassengerId'],
    'Survived': predictions
})
submission.to_csv('submission.csv', index=False)

@浙大疏锦行

相关推荐
夔曦1 分钟前
【无标题】
python·强化学习算法
SAP工博科技4 分钟前
装备制造SAP Cloud ERP实施指南:基于海铑机电的全流程落地方案
大数据·人工智能·制造
视***间4 分钟前
视程空间算力模块Jetson AGX 275TOPS应用到人形机器人上
大数据·人工智能·边缘计算·ai算力开发板
weixin_437497776 分钟前
部分LLM小参数模型特征汇总
人工智能·语言模型
科技云报道7 分钟前
科技云报到:2026,AI开启“共生智能”新纪元
大数据·人工智能·科技
先做个垃圾出来………7 分钟前
Python 中 kwargs.get() 方法详解
开发语言·python
综合热讯8 分钟前
中国企业追光科技亮相CES 2026,聚焦消费电子低碳供能
人工智能·科技
byzh_rc8 分钟前
[深度学习网络从入门到入土] 神经网络发展脉络
人工智能·深度学习·神经网络
聊聊科技10 分钟前
编曲伴奏软件有哪些,音乐人分享AI编曲软件助力原创音乐创作
人工智能
xfddlm11 分钟前
再探模型训练,使用LLaMA-Factory实现LLM微调
人工智能·llama