首页〖天辰娱乐注册〗首页
首页〖天辰娱乐注册〗首页
全站搜索
新闻详情
种地也要人工智能?网络走进田间地头引领农业科技革命
作者:管理员    发布于:2023-09-01 00:11    文字:【】【】【
摘要:阅读前,请伸出您的贵手点击一下关注,希望能给您带来不一样的阅读体验,可以在评论区进行讨论和分享哦感谢您的支持! 现代技术的进步促进了对可能影响作物产量的许多因素的监

  阅读前,请伸出您的贵手点击一下关注,希望能给您带来不一样的阅读体验,可以在评论区进行讨论和分享哦感谢您的支持!

  现代技术的进步促进了对可能影响作物产量的许多因素的监测,系统地收集和分析与这些因素相关的数据,可以确定它们对产量的具体影响。

  甚至预测产量,准确的作物产量预测是一项重要而复杂的活动,对于实现自然资源的可持续集约化和可持续利用至关重要。

  作物产量预测的重要性延伸到参与农业食品链的各个利益相关者,包括农民、农艺师、商品贸易商和政策制定者,这些预测提供了用于决策过程的宝贵见解,并有助于优化农业实践。

  产量预测是一项复杂的任务,因为作物特定参数、环境条件和管理实践选择之间有着复杂的相互关系,开发可靠和透明的预测模型是一项复杂的任务,需要仔细研究和全面了解这些多方面的影响。

  现代技术使能够监控许多可能影响产量的因素,通过收集有关这些因素的数据,可以确定它们对产量的影响,甚至预测它们。

  一些研究已经证明了使用RS数据进行多年生作物产量预测的可行性,这些研究采用了不同的RS传感器。

  如光学、微波和高光谱传感器,来捕获作物生长和生理参数,如植被指数、树冠高度和含水量。

  例如,在一项研究中,使用了来自PlanetScope和Sentinel-10时间序列图像的2个植被指数(VI)来检查使用不同回归方法估算玉米籽粒产量的可行性。

  上述研究面临一些局限性,例如,一些研究使用有限或过时的RS数据,这可能会影响产量预测的准确性和可靠性,其他人没有考虑环境因素。

  此外,一些研究使用传统的回归或机器学习模型,这些模型可能无法捕捉到RS参数和产量之间的复杂和动态关系,并可能导致过度拟合或欠拟合。

  研究理念在于利用遥感和气象数据处理来制定作物产量预测,这种方法有可能彻底改变农业管理并支持可持续实践,机器学习算法可用于分析大型数据集,并识别使用传统方法难以检测的作物生长和发育模式。

  排放数据的评估和消除需要考虑多种标准和因素,从而确保数据集的可靠性和准确性,这些标准包括各种关键要素,有助于识别和消除不良或错误的排放相关信息。

  最重要的标准是仔细评估研究中,使用的遥感和气象数据的准确性和可靠性,显示遥感数据和气象数据,不一致或不可靠的排放数据可以删除。

  第二个标准涉及机器学习算法,在检测与作物生长和发育相关的模式方面的有效性,与已确定模式明显偏离或显示异常的排放数据,可被视为删除的潜在候选数据。

  第三个标准涉及将遥感和气象数据,处理获得的排放数据与传统方法获得的排放数据进行比较。

  如果发现传统方法得出的排放数据更准确或可靠,则可以排除从遥感和气象数据得出的相应排放数据。

  如果合理地满足这些标准,该研究将寻求为从数据集中排除排放提供全面的基础,这种方法可确保生成的作物产量预测模型基于可靠和有效的信息。

  卫星图像数据来自东哈萨克斯坦的农场,特别是来自两个不同土壤气候带的实验农田:黑钙土和栗子型土壤,RS图像的总数为64个图块。

  当前的方法是在JupyterNotebook开发环境中实现的,这提供了一个与可视化程序工作的编译代码片段进行交互的机会,与传统IDE的区别在于,代码可以分成几个部分并以任意顺序执行。

  这种开发环境,允许人们在不编译整个程序的情况下,测试已编写的函数,可以使用单独的内存加载功能,以便可以检查内容的结果部分,这种方法可以节省时间并有助于避免错误。

  首先导入Pandas,Matplotlib和Numpy库,然后从先前下载和保存的xlsx文件创建裁剪数据库,Excel文件是使用read_excel函数读取的,该函数从文件中的现有数据创建Pandas数据库。

  温度是产量建模的重要因素,先前的研究表明,生长季节的平均温度和降水量在解释作物产量变化方面的重要性,最高和最低温度参数需要组合成平均值以减少数据量。

  read_excel函数是创建Pandas数据库的Excel文件的路径,从创建的数据库中提取最高和最低温度列,结果值存储为平均温度,代码用于删除xlsx文件中存在连字符的块行。

  此方法是通过算法检查列以查找“不等于”连字符的数据来实现的,在删除所有空值后,通过astype()函数将数据转换为浮点类型,以便将来正确处理数据,为了检查和清理数据,info()函数用于显示空空值和数据类型。

  所有数据都填充了未定义的字符,并对应于可接受的数据类型,输出是每隔1-2周的气象数据和NDVI列表。

  由于从以前的研究中发现NDVI是产量的关键指标,因此让考虑与之相关的其他因素的行为,所有指标与NDVI的关系图通过Matlpotlib库的绘图工具输出。

  NDVI指数与天气数据的相关性和模式,分析显示了各种值得注意的观察结果。

  图2.(A)平均温度,(B)地表土壤湿度,(C)根区湿度,(D)风速,(E)湿度和(F)降水的NDVI比率图

  首先,NDVI指数与温度的相关性呈弱关系,表明温度本身不能作为NDVI变化的强预测指标。

  其次,湿度指数的行为与NDVI指数相似,表明湿度与植被生长之间存在潜在联系。

  最后,降水对NDVI指数的影响似乎微不足道,因为观测到的对指数的影响是有限的。

  相关系数(表示为r)决定了因变量和自变量之间关系的强度和方向,r的值范围从?1.0(强负关系)到+1.0(强正关系),两个随机变量之间的显著相关性始终是给定样本中某种统计关系的证据。

  但这种关系不需要在另一个样本中观察到,并且是因果关系,通常,相关性研究的诱人简单性导致研究人员得出关于变量对之间存在因果关系的错误直觉结论,而相关系数仅建立统计关系。

  信息论的基本直觉是随机变量(也称为信息熵)的“不可预测性”特征的思想,对于取集合χ={x中的值的随机变量X1,x2,...,xn}使用概率质量函数p(x)。

  负号可确保熵始终为正或零,H(X)可以认为近似等于来自随机变量X的单个实例的信息。

  当概率低时,信息量会很高,反之亦然,互信息(MI)衡量随机变量与熵概念的关系有多紧密,两个随机变量X和Y的VI,用I(X;Y)。

  其中H(XY)是Y给出的X的条件熵,I(X,Y)测量关系中不确定性的平均减少,从而得出价值研究,它是一种更通用的相关系数形式,提供了两个变量之间依赖性(线性和非线性)的总体度量。

  VI的值越大,两个变量之间的关系越大,在分析非线性系统的时间序列时,这是一个重要的统计数据。

  相互研究的所有数据的相关系数,与产量相关性高的数据是优先指标,在计算参数时,注意它们与产量和NDVI的相关性,与这些参数的低相关性表示影响很小。

  而与其他参数的高相关性意味着同样的事情,因为这些参数是一致的,只会干扰模型训练。

  Scikit-learn库用于机器学习,Scikit-learn是数据科学和机器学习中使用最广泛的Python软件包之一,它允许许多操作并提供许多算法。

  Scikit-learn还提供了有关其类,方法和函数的出色文档,以及对所用算法的描述。

  数据库分为两个样本,一个作为训练样本来训练模型,第二个用于测试已经训练好的模型。

  为了获得最佳结果,使用多个激活函数来训练模型,为了避免重写代码来创建模型及其输出,创建了predict()函数以仅将所需模型函数的激活器作为输入。

  产量预测方法的流程图,定义为天气和植被指数数据,收集的数据按裁剪分隔,然后排序,从而减少类别数量并删除空值,根据两个生长季节的时间安排。

  从整个生长季节和播种和收获期的处理数据中抽取两个样本,将样本与产量数据相结合,计算所有指标对采集数据的相关性,通过检查数据和有关该主题的研究的相关性,选择有助于预测产量的类别。

  基于训练样本,训练神经网络模型,在训练过程中,在测试样本数据上测试六个激活函数的训练结果,如果预测精度结果较低,神经网络会自动校正其权重并重新训练。

  当最终误差值达到可能的最小值时,神经网络完成训练,如果训练的机器学习模型的预测精度较高,则会存储该模型并用于产量预测。

  多层感知器(MLP)是一种监督学习算法,可学习函数f(·):Rm→Ro通过在数据集上进行训练,其中X=x1,x2,...,xm是要输入的测量值数,y是要输出的测量值数,给定一个特征集和一个目标。

  它可以学习非线性函数近似,用于分类或回归,它与逻辑回归的不同之处在于,在输入和输出级别之间可能存在一个或多个非线性层,称为隐藏层。

  随机森林是一种元估计,它匹配数据集不同样本上的许多分类决策树,并使用平均来提高预测准确性和控制过拟合,如果引导程序=True(默认值),则子样本大小由max_samples参数控制。

  否则,整个数据集用于构造每棵树,在随机森林中,融合中的每棵树都是从训练集中采集的样本构建的。

  通过分析这些数据集,发现使用NDVI植被指数数据和天气参数可以进行产量预测。

  机器学习编程语言可以计算这些参数之间的复杂关系,并构建能够准确预测产量的神经网络,神经网络使用使用激活函数算法调整的数据权重,这使其能够做出可靠的预测。

  因此,如果相关数据可用,使用机器学习技术(神经网络)可以准确预测作物产量。

  值得注意的是,定制的机器学习方法可以确定每种特定作物的最佳学习算法,从而进一步提高预测的准确性。

  如果用于训练的数据是针对整个生长季节而不是播种和收获期,则所有激活函数的预测读数具有更高的准确性,生长季的平均预测准确率为95%,而播种和收获期的平均预测准确率略低,为89.5%。

  计算出所有作物植被周期的最佳函数是多层感知器,预测精度范围为66%至99%(平均值85%),多项式回归,预测准确率为63%至98%(平均值82%)。

  应该理解的是,多层感知器函数在每次训练开始时都会生成新的随机权重,因此它产生的结果可能在+5%和-5%之间变化,此模块取这些范围的平均值。

  在阅读此文后,烦请您关注+评论,方便剩下后续事件有新的进展能够让您迅速关注到

脚注信息
版权所有 Copyright(C)2009-2026 首页〖天辰娱乐注册〗首页 TXT地图 HTML地图 XML地图