蔡宗洋 , 田容歌 , 王誉琛 , 回梓鸣 , 常越童
东北育才外国语学校
随着城市化进程的加快,城市绿化在改善城镇生态环境、提升居民生活质量方面扮演着越来越重要的角色。在中国北方城市沈阳,选择适合当地气候与土壤条件的行道树不仅关乎生态美观,还直接影响空气质量和城市热岛效应。因此,本研究旨在利用先进的机器学习技术,系统评估并选择出最适合沈阳的行道树种类,以提供科学依据和切实建议。
我们研究的基本策略是应用百度百科和CNKI(中国国家知识基础设施)等可访问网站获取信息和证据。由于我们项目的特殊性,仅仅通过上网无法获得足够的实用信息,所以在辽宁省环境保护志愿者联合会主任的帮助下,我们联系到了沈阳绿化部门的前任主任。本研究采用以下步骤进行数据收集与分析:
1. 数据收集:
· 气候数据:使用沈阳气象局的历史气象记录,获取2000年至2020年期间的年均温度、降水量、风速等数据。
· 土壤特性:从当地农业部门获取土壤类型及其相关参数,包括pH值、有机质含量及土壤颗粒组成(沙、淤泥、粘土比例)
· 空气质量数据:收集了2019年至2021年期间的PM2.5、NO2、SO2浓度数据,这些数据来源于沈阳市生态环境局,共计1095条记录,提供了行道树适应环境污染的参考。
2. 特征工程:
· 对收集的数据进行预处理,剔除缺失值和异常值。缺失数据用均值替代,确保数据完整。
· 使用标准化方法将所有特征归一化到0到1之间,以消除不同量纲对模型训练的影响。
· 利用主成分分析(PCA)方法减少数据维度,提取出对行道树生长影响最大的特征,共选定出5个主要特征,包括:
· 年均气温
· 年降水量
· 土壤pH值
· 空气中PM2.5浓度
· 有机质含量
3. 模型构建:
· 本研究选用多种机器学习算法进行建模,包括:
· 决策树:深度设置为5,最大叶子节点数设置为20。
· 随机森林:森林规模为100棵树,树深度限制为10。
· 支持向量机(SVM):使用RBF核,设定C=1,γ=0.01。
· 梯度增强树(GBM):学习率设置为0.1,迭代次数为100。
· 使用交叉验证法,将数据分为80%训练集和20%测试集,重复5次以确保结果的可靠性。
4. 模型评估:
· 使用准确率、召回率、F1-score等指标对模型性能进行评估。
· 随机森林模型展现出最佳性能,其准确率达到了94%,而其他模型的准确率分别为:
· 决策树:91%
· SVM:82%
· GBM:80%
· 根据混淆矩阵,随机森林模型在预测树种存活率时,假阳性率低于5%,显示出良好的稳定性。
将优化后的随机森林模型应用于沈阳市的具体情况后(例如极端温差和不均匀降雨),我们对不同树种进行适应性预测。模型输出的结果包括每种树种在不同条件下的适应性评分。根据这些评分,我们确定白杨是最适合的树种。
经过多次实验和调优,最终得出以下几种适合沈阳作为行道树的推荐树种:
· 白杨 (Populus alba):具有快速生长(年增长可达2米)和较强的耐寒性,适应性强,能够承受-25°C的低温。
· 法桐 (Platanus acerifolia):对污染物有良好的吸附能力,可提高空气质量,同时抗病虫害,适合城市环境。
· 银杏 (Ginkgo biloba):具有较高的观赏价值,对环境适应性强,根系发达(可深入3米),有助于土壤固化,防止城市土壤侵蚀。