由于今年各种各样的原因,导致美赛头一次,据说也将是最后一次,临时调整,加设春季赛。这对于急需建模奖项的大家来说是一个很好的机会。无论怎样的原因,今年美赛我们可能有所遗憾。但,春季赛也许就是弥补遗憾的一次机会。首先给大家带来春季赛Y题的简要解析,以方便大家更好的选题。以及提前预知不同的赛题将会遇到的难点,提前避雷。
2023 MCM 问题Y:了解二手帆船的价格
问题Y,是一个以二手帆船为背景的二手价格评估问题。对于这一问题,我们可以回归本质,就是二手车的价格评估。单独查找二手帆船的价格显而易见是很冷门的,因此我们可以进行借鉴。稍后也将为大家收集相关的价格评估资料,其中尤其需要注意的就是大家可以参考这两年刚刚出过的一次二手车辆价格评估数模题,即2021年华数杯第二届的赛题,可以看一下,找一下思路。
数据处理,题干中明确的提是我们可能存在缺失数据或者其他问题。其他问题无非就是异常值问题。因此需要我们首先进行数据清理,即数据预处理阶段.对于缺失数据的处理,因队伍而异,剔除缺失数据的样本还是进行修改等操作需要各个队伍自行决断。对于异常值而言,我们第一步一定是异常值的判定,去判断什么是异常值,3sigema原则,箱型图等等,进行异常值的定义。
其次,数据处理阶段除去对于给出数据的处理,我们也要对自己收集的数据进行处理。通读全题,以及给出的数据我们很容易发现。给出的数据其实并不多,问题一也有很明显的暗示,我们可以根据其他来源给定帆船的其他特性,这也就暗示我们可以进行其他数据的收集以完善我们的问题解答。
除此之外,还有就是地区特征数据化,我们可以通读全题,发现问题二中的题设与地区有关,给出的数据也与地区有关的。因此,我们需要选择一种地区数据化的方式,这种方式很多种,大家可以有目的的进行选择。这里为了避免大家都选择同一方法,就不再这里进行举例了。
问题一,开发一个数学模型,解释提供的电子表格中每艘帆船的挂牌价格。包括任何你认为有用的预测因素。您可以利用其他来源来了解给定帆船的其他特征(如横 梁 、吃 水 、排 水 量 、索 具 、帆 面积、船 体材料、发 动机小时数、睡眠容量、净 空 、电子设备等)以及按年份和地区划分的经济数据。识别和描述所使用的所有数据来源。包括对每个帆船变种价格估计精度的讨论。
问题一,需要我们开发一个数学模型,用以解释提供的电子表格中每艘帆船的挂牌价格,以及对每个帆船变种价格估计精度。这里题目中暗示我们可以利用其他来源进行了解,因此这也提醒我们可以手机其他地区的经济数据以及其他数据进行分析描述,稍后也将为大家分享我收集到的一些数据。
基于给出的数据对价格进行估计。这一方法,我依旧沿用问题浅析中提到的方案,对于这一问题,最为简单的思路就是回归分析,根据题目提出的各种附加特性,以及给出数据的各种指标。进行指标的选择,建立多元回归分析,直接进行价格的预测。这个最简单的一种,可能大家感觉有些简单,其实很多国赛的主模型也是一个简单的多元回归分析,所以正如在美赛开赛之前一位评委教授说没有模型的对错,只有适合与否。大家也可以选择一些高级的价格预测,对应的一些其他预测模型,或者二手车价格评估的专用模型,这就属于进阶模型了,尽力而为即可。
问题二,用你的模型解释地区对上市价格的影响(如果有的话)。讨论是否所有帆船变体的区域效 应是一致的。说明所注意到的任何区域影响的实际和统计意义。
问题二,根据我们建立的模型来解释地区对上市价格的影响。问题二的题设要求我们在问题一的指标选取时,还需要尽可能地考虑地区数据,因此,就需要我们通读题目再去进行问题一指标的选取工作。这里当我们问题一地回归预测模型的话,问题二就可以看作对应的回归分析模型,对单个某一自变量与因变量地关系可以进行讨论。对于进阶模型,即专门的二手价格评估模型,我认为关系的分析讨论自变量因变量的关系也是模型必备的,大家可以参考一下相关的二手车辆价格评估模型,稍后也将为大家收集一些这方面的相关资料。
问题三、讨论你对给定地理区域的建模如何在香港(SAR)市场上发挥作用。从提供的电子表格中选 择一个信息丰富的帆船子集,分为单船体和双体船。从香港(SAR)市场找到该子集的可 比上市价格数据。建模香港(特区)对子集中帆船的每艘帆船价格的区域影响(如果有的话)。 双体帆船和单体帆船的影响是一样的吗?
问题三,问题三的设问不同于问题一二,问题三要求我们单独的对香港这一地理区域进行价格评估,还需要我们判断对于双体帆船和单体帆船的影响是否相同。因此,我们依旧可以沿用问题一二的模型,比如当我们使用回归分析模型时,我们就需要提出地区指标的影响,选中香港的相关其他数据特征进行分析即可。
还有就是数据的注意点,我们可以发现对于整个Y题,他的结果都是相当开放的。我们通常对于这种结果开放式的题目是很喜欢的,原因就是对于这种题目,他的答案一定不是固定值,因此,只要合理就可以。如果保证合理呢,就需要我们大致的读一下文献,对现在这一现状有所了解,只要结果 不是离谱到家评委不能直接将我们的论文判定错误的 。所以,当我们真的真的找不到数据,或者找到的数据不好,代码编程运行出来的结果不理想时,对于这种开放式结果的题目,编造一个数据集,或者编造一个合理的结果是无可厚非的。
问题四、识别并讨论你的团队从数据中得出的任何其他有趣和有信息的推论或结论。
这种比较新颖的题目,细节类的。就需要大家在做题时,随时注意,有趣的结论,信息这种东西对于最后的评审也是很关键的。美赛的评审毕竟是7分制,一旦你的结论足够吸引人,很有可能提升一个档次是有可能的。因此,关于问题四,我的建议是从一开始的数据处理就时刻注意着,多找一些有趣的点,说不准哪一条就打动评委的心。比如,给出的数据最高的成交价格总是出现在某地,最低的价格总是怎样怎样。这个就真的是各显神通。
问题五、为香港(SAR)帆船经纪人准备一到两页的报告。包括一些精心挑选的图表,以帮助经纪 人理解你的结论。
问题五,数模题的常见类型,我们通常叫做非技术性文章,这就需要大家各显神通。题设中,明确的提示大家,可以包括一些图表。因此,大家可以仿照一些项目计划书等东西进行非技术性文章的写作即可。
总结:Y题的整体难度相对于Z题而言,应该是本次美赛春季赛中最难的一道题目。但是这个题目的整体难度,我认为在整个数模领域也仅仅是中等难度,因此大家不要有太大压力,尽力去做就可以。
最后,预祝大家比赛顺利!!!!!!!!!!!!!!
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net