2006高教社杯全国大学生数学建模竞赛题评阅要点
[本要点仅供参考,各赛区应根据对题目的理解及学生的解答,自主地进行评阅]
本题考察的重点是:从决策问题的海量的、不完全的、甚至错漏(带有噪音、错误、异型)的数据中分析出决策的逻辑结构和提取有用的数据(附录中许多数据是没有用的!)以及依赖数据信息,进而构建数学模型的能力。
本题的资源优化配置模型是规划问题,其中也包括一些预测模型。因此,理解并且实现优化问题的基础结构是取得基本分值的必要条件。
1、 目标函数的构成成分
主要包括销售额表达式(注意如果作者利用了附录数据说明中的假设,则赢利与销售额等价),可以以课程为单位,也可以以学科为单位;包括由市场信息产生的对于不同课程的调控因子(竞争力系数);由于数据说明中的提示,也应该包括每个课程的申报需求量的“计划准确性因子”(学生用词会不同)。当然,前两点更重要些。
2、 约束条件构成
对于出版社来说,所谓产能主要是人力资源,即策划、编辑和版面设计人员的分布形成主要约束;此外,书号总量(500)也应该作为约束条件;同时,在数据说明中指出的“满足申请书号量的一半”也应该以约束方式表达。
3、 规划变量
可以以每个课程的书号数量,也可以以学科的书号数作为变量,但是得到的结果会有所不同。
实现以上三点,对于问题的理解是比较全面的,应该得到基本分值。进一步提高的分值来源于实现上述三点的具体模型的考虑和建模水平。
1) 如果注意到数据说明中提示的,同一课程的教材在价格和销售量的同一性,销售额表达式是比较容易表示的:构造每个课程的、用书号数表达的销售额,然后将所有书号的销售额的表达式累加,形成总社的销售额的基本表达式,这是目标函数的主体部分。
2)市场信息产生的对于不同课程的调控因子(也称竞争力系数)的表示,是一个信息不足情况下的决策模型。主要是满意度和市场占有率的恰当表示和计算(由附件2),以及两个指标的联合形成竞争力系数问题,这里既可以使用拟合模型,也可以使用各种多因素分
析模型等等,方法不同。对这个问题解决的优劣,可以导致明显的评分差别。
其中应该特别注意需求信息是否重复使用的问题,也就是说,如果在构造销售额表达式时已经使用了课程的销售数据,则不同课程的支持强度的不同,主要由市场竞争力参数表达。
3)在优化问题中,应该恰当地表示“计划准确性因子”,数据给出的计划销量和实际销量之比应该是比较合适的表示。
4) 加上前述约束条件构成适当的规划问题。 比较好的实现以上四点,应该得到80%的分值。
最后剩余分值是:计算出结果,创造性,论文表述和格式。 [注1] 以下给出建模所需信息和附录数据表的关系:
在问卷调查表的调查目的中提示了满意度和市场占有率是竞争力的主要组成,也提示了数据依据(附录1);课程级销售额以及销售额与利润的等价性关系(附录3),满意度和市场占有份额由问卷调查数据表检索计算产生(附录2),各个课程的需求的书号数(附录4)和“计划准确性因子”(附录3),人力资源(附录5)。其中附录1只是让学生了解市场调查的方法。
[注2] 学生会提出附录5和4之间在书号数与人力资源上的差别,事实上人力资源和分配到的书号数没有直接的单一因果联系(如临时雇用人员、临时增加书号等)。附录4 的书号总和的计算错误是实际数据的错误,但是与解题无关(学生采用哪组数据应该都是可以的)。
附件:对问题更详细的分析过程(供参考)
本题背景是:某出版社总社汇总各个分社提交的出版需求计划,然后根据市场信息、在总社产能允许的条件下,将给定数量的书号进行分配,以期在此分配方案下,出版的图书产生最好的经济效益。由于企业的生产是市场导向的,因此市场信息是对分社计划进行调整的主要依据,同时要考虑产能的限制。这是一个资源配置的决策问题,因此需要分析决策的信息依据以及决策的逻辑过程。
1、 决策的总体结构
市场信息 决策部门 分社计划信息 决策结果
各个分社提出的出版需求计划是决策的基础,而市场信息是调整分社计划达到效益最大化的主要调节依据。在以上总体结构下,需要将各个分社的计划信息和市场信息的信息产生结构分析清楚。
2、 分社计划信息
在附录4中给出了各个分社06年申请的书号计划数,即分社所属课程的计划数的列表。该出版社中,分社是按学科划分的,学科之下又有若干课程,问题的决策对象可以分两级:课程级以及学科级。也就是说,可以以课程作为基本分配对象,学科数据可以通过汇总得到;也可以先将数据汇总到学科,然后以学科作为配置单位。两种方法计算结果会有所不同。
3、 市场信息
相关的市场信息主要包括两个方面:需求信息和竞争力信息,包括它们的变化趋势。 3.1 需求信息。 课程级的销售额是决策的目标函数的基础组分(附录4中提示了销售额与盈利的等价性)。在根据课程级的需求计划计算销售额时,需要用过去五年该课程的实际销售量去预测当年的销售量。这样就已经考虑了市场的需求信息,因此在总社的进一步分析中不必要重复使用这类市场信息。另一方面,由于分社有夸大需求的倾向(附录4提示),将课程级的计划销售量与实际销售量之比作为“计划准确性系数”,在课程级的销售额中作为权重是恰当的考虑。
3.2 竞争力信息。企业在战略决策中的主要原则是:重点支持竞争力强、竞争力发展趋势强的产品(题目中已经提示)。虽然企业也要关注现实竞争力不强、但有潜力的产品,但这不是主要的决策原则,这是一个恰当的简化。竞争力因素很多,但是对于本题,由于只给出了两方面的数据(A. 对教材的课程级的满意度,B. 该出版社的课程级的市场占有率),因此也只有用这两个数据产生对于各个课程的不同的竞争力系数,这是总社的主要调控手段,应体现在规划问题的目标函数中。
4、建模过程
如何从给定数据中提取需要的每项市场信息,是本题建模的关键之一。
4.1 市场需求信息。这里主要是课程级的需求量预测。从历年的销售数据,即已经出版过的同课程的历年销售数据,可得到目标函数的主要表达式:
[(课程级销量*平均书价)/当年的该课程的获得书号数]=该课程的书号的平均销售额 4.2 产品满意度。在问卷调查中的本出版社的满意度(课程级)的均值除以所有出版
社的满意值的均值,可以作为该课程的满意度,这里“度”是率的含意。
4.3 市场份额占有率。 在问卷调查的统计中已经给出了关于课程与出版社市场份额分布表,而通过五年的市场份额分布表可以回归出预测的市场份额占有率。
4.4 竞争力系数。以上两点可以产生单一的竞争力系数(通过模型方法)加入到目标函数中,例如,可以从五年的历史数据拟合得到加权系数,再进行加权求和等,方法各异。
由以上4点以及考虑到3.1中的“计划准确性系数”,可以构成规划的目标函数。 4.5 约束条件:该社的产能即人力资源的约束,书号总量的限制以及至少满足申请数一半的要求(附录4),即可得到规划问题的完整表示。
5、 决策的逻辑结构
2006高教社杯全国大学生数学建模竞赛B题评阅要点
[本要点仅供参考,各赛区应根据对题目的理解及学生的解答,自主地进行评阅] 问题(1) 利用附件1的数据预测继续治疗的效果,或者确定最佳治疗终止时间。 1.分析数据 随机取若干个病人,画出他们CD4和HIV浓度随时间变化的图形(折线),可以看出CD4大致有先增后减的趋势,HIV有先减后增的趋势,启示应建立时间的二次函数模型(若先用一次函数模型,应与二次函数模型做统计分析比较)。附件1中个别病人缺CD4或HIV数据(数据表中为空),计算时应注意。 2.建立模型 可能有以下形式的回归模型:
1) 总体回归模型 用全部数据拟合一个模型,如yij=b0+b1tij+b2tij2,tij为第i病人第j次测量时间,yij为第i病人第j次测量值(CD4,HIV)或测量值与初始值之比。一次与二次函数模型比较,二次较优。用数据估计b0,b1,b2, 对CD4,b2<0, b1>0, t=-b1/2b2 达到最大;对HIV,b2>0,b1<0, t=-b1/2b2 达到最小。一般在25~30(周)CD4达到最大、HIV达到最小。可以合理地确定最佳治疗终止时间。
2) 个人回归模型 用每个病人的数据拟合一个模型,如上式(bk改为bik, k=0,1,2), 计算bik的均值和均方差,用均值同1)可得CD4的最大点和HIV的最小点,一般为20~30(周)。可对CD4统计b2i<0, b1i>0(存在正最大点)及b2i>0(不存在最大点)的频率,对HIV统
计b2i>0, b1i<0(存在正最小点)及b2i<0(不存在最小点)的频率,在一定条件下可以作为终止治疗与继续治疗的概率(一般为0.6~0.8与0.3~0.2);也可用bik的均值和均方差在一定分布的假定下直接计算这些概率。
注1 建立几种模型相互比较、验证者较优。
注2 不能只有模型,不做统计分析;对模型结果进行统计分析,考虑与数据拟合程度、注意去除异常数据者较优
注3 注意到有一些数据是当出现CD4下降、HIV上升就及时结束的,并做出适当考虑者较优。
注4 注意到题目中“艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度”,并对结果做出适当考虑者较优
问题(2) 利用附件2的数据,评价4种疗法的优劣,并对较好疗法预测继续治疗的效果,
或者确定最佳治疗终止时间。 回归模型方法
1.分析数据 对于每种疗法随机取若干个病人,画出他们CD4随时间变化的图形(折线),
可以看出疗法1~3的CD4基本上水平,略有下降,而疗法4有先增后减的趋势。启示应建立时间的一次与二次函数模型,经统计分析比较,确定哪种较优。 2.建立模型
1)回归模型 可以引入4(或3)个0-1变量表示4种疗法建立统一模型,或者对每种疗法各建立一个模型(一般来说前者较优);仍可利用问题(1)中的各种模型。以总体回归模型为例,分别用一次与二次时间函数模型进行比较,可知疗法1~3用一次模型较优,且一次项系数为负,即CD4在减少,从数值看疗法3优于疗法2和1;疗法4用二次模型较优,即CD4先增后减,在t=20左右达到最大。可以通过4条回归曲线进行比较,显示疗法4在30周之前明显优于其它。
年龄的处理:简单地增加年龄变量;按年龄分组,考虑不同年龄的影响。 2)用假设检验做疗法有无显著性差异的两两比较 用1个0-1变量构造两种疗法的统一模型,可以用t检验作回归系数是否为零的假设检验(与回归系数置信区间是否含零点等价)。结果是疗法1与2无显著性差异,而疗法1与3,2与3,3与4均有显著性差异。
注 注意问题(1)的几个注。
线性规划模型方法
1. 数据分析 考虑到治疗的效果与患者的年龄有关,将患者按年龄分组,如14~25岁,25~35岁,35~45岁及45岁以上4组。每组中按照4种疗法和4个治疗阶段(如0~10周,10~20周,20~30周,30~40周),构造16个决策单元。取4种药品量为输入,治疗各个阶段末患者的CD4值与开始治疗时CD4值的比值为输出
2. 建立模型 利用相对有效性评价方法,建立分式规划模型并经过变换,转化为线性规划模型求解,对各年龄组患者在各阶段的治疗效率进行评价。计算结果:对第1年龄组疗法2和4在整个治疗中效率较高,在第4阶段仍然有效;对第2年龄组疗法1在第1,2阶段有效;对第3年龄组疗法1,2,3在第1阶段有效;对第4年龄组疗法1,2在第1,2阶段有效。表明只有14~25岁的年4种轻患者,才能在治疗的最后阶段仍然有有效的疗法。
由线性规划模型的对偶形式建立预测模型,对各年龄组各种疗法下一阶段的疗效进行预测。若由某决策单元得到的实际输出大于预测输出,则该决策单元相对有效;反之,说明该种疗法对该组患者在治疗的未来阶段不再有效,应该转换疗法。