2013全国大学生数学建模比赛B题 - 答案(4)

2019-08-29 00:31

图8

图9

对于第二问中文碎纸片的复原问题，通过上面的结果发现匹配结果较好，对于中文可以发现该组中文字的位置符合我们的想象，及同一行中的文字拥有同一上界和同一下界，在这一组中matlab软件很好的将碎纸片拼接出来，思考为什么会出现上面图9图10两者不能匹配在一起的原因。可以发现拼接复原后的图8、图9左右两侧均存在白边，仅从计算机的角度出发，无法认出两者的先后，所以这里我们要加以人工干预，通过对文章的内容、文章的结构、文章的形式的观察人工拼接，得出结果。改进后的图片排序见表7，复原图片见图10。

序号 2 168-100-076-062-142-030-041-023-147-191-050-179-120-086-195-026-001-087-018 表7. 人工干预分组的碎纸片的拼接复原即使过程中未加入人工干预也可以得到较优的结果。

图10

通过结果可以发现拼接程度较好，所以也验证了本问题中碎纸片拼接复原模型的可行性。

其他组做相同处理，这样可得到拼接好的11横行的碎纸条，对11横行的碎纸条的长边进行边缘匹配，建立新的边缘匹配矩阵，方法同上，做出结果如下，见表9。

表9 一 014 128 003 159 082 199 135 012 073 160 203 169 134 039 031 051 107 115 176 14

094 034 084 183 090 047 121 042 124 144 077 112 149 097 136 164 127 058 043 二 125 013 182 109 197 016 184 110 187 066 106 150 021 173 157 181 204 139 145 029 064 111 201 005 092 180 048 037 075 055 044 206 010 104 098 172 171 059 007 208 138 158 126 068 175 045 174 000 137 053 056 093 153 070 166 032 196 三 049 054 065 143 186 002 057 192 178 118 190 095 011 022 129 028 091 188 141 061 019 078 067 069 099 162 096 131 079 063 116 163 072 006 177 020 052 036 四 168 100 076 062 142 030 041 023 147 191 050 179 120 086 195 026 001 087 018 038 148 046 161 024 035 081 189 122 103 130 193 088 167 025 008 009 105 074 五 089 146 102 154 114 040 151 207 155 140 185 108 117 004 101 113 194 119 123 六 071 156 083 132 200 017 080 033 202 198 015 133 170 205 085 152 165 027 060 以上做出的表格把一些横行碎纸片拼接在一起，未能拼接的原因是由于拼接后的横

行碎纸片两端都存在白边，计算机无法做出顺序的判断，所以我们要根据文字内容、规格、形式等因素人工将它们结合起来，人机结合后的原文件以下面的表格10。

表10.附件3的复原 049 054 065 143 186 002 057 192 178 118 190 095 011 022 129 028 091 188 141 061 019 078 067 069 099 162 096 131 079 063 116 163 072 006 177 020 052 036 168 100 076 062 142 030 041 023 147 191 050 179 120 086 195 026 001 087 018 038 148 046 161 024 035 081 189 122 103 130 193 088 167 025 008 009 105 074 071 156 083 132 200 017 080 033 202 198 015 133 170 205 085 152 165 027 060 014 128 003 159 082 199 135 012 073 160 203 169 134 039 031 051 107 115 176 094 034 084 183 090 047 121 042 124 144 077 112 149 097 136 164 127 058 043 125 013 182 109 197 016 184 110 187 066 106 150 021 173 157 181 204 139 145 029 064 111 201 005 092 180 048 037 075 055 044 206 010 104 098 172 171 059 007 208 138 158 126 068 175 045 174 000 137 053 056 093 153 070 166 032 196 089 146 102 154 114 040 151 207 155 140 185 108 117 004 101 113 194 119 123 观察发现拼接复原后结果较好。

5.2．2英文碎纸片复原的模型建立与求解

搜索每一张碎纸片转化后二值化矩阵Ci的每一行，若存在黑色像素数量大于等于13即矩阵该行中数值1的数量大于等于13，则将该行全部赋值为1，若这一行黑色像素数

量小于13，则将该行全部赋值为0，这样将209张碎纸片做出新的二值化矩阵Ei，之后同5.1的求解过程做边缘匹配，做出矩阵大小为209?209边缘匹配度矩阵D（由于矩阵太大，在论文中不作出），元素Dij为处理后的碎纸片边缘二值化矩阵i的第二列与处理后的碎纸片边缘二值化矩阵j第一列的边缘匹配度，匹配度高则说明碎纸片的文字信息处于同一水平位置。同样在矩阵D中每一行选取匹配度大于0.9的元素，进行统计分组。

在这里需要强调的是，若分完组后的组内元素进行5.2.1中的边缘匹配进行残片复原，小组成员发现结果十分的不理想，任举一例，见下图11。

图11

根据图12可以发现对于本文中的英文残纸片的文字信息主要内容处于相同水平

位置，文字信息处于同一水平位置，结合5.2.1可以认为首先判断文字信息未知的方法是正确的。但是组内英文碎纸片的拼接复原程度结果差，图中部分碎纸片得到了复原，而大部分却进行了错误的拼接。对比5.2.1的中文复原结果，可以认为英文相对中文会有一定的特殊性。

分析产生问题的原因，由于碎纸片的连接是按照组内图片两两边缘匹配的的大

小来决定的，发生如图的情况说明：实际的对应的碎纸片的边缘匹配度一般在0.9以上，英文碎纸片实际对应的碎纸片的边缘匹配度会出现比其他碎纸片的边缘匹配对小的情况。面对这种问题，我们需要对检测边缘匹配度的程序的过程进行人工干预，方法为：其他图片对当前图片的边缘匹配度若出现两个及两个以上大于0.9的匹配度，则进行人工干预，根据文章的内容、格式等进行人工拼接复原，其他步骤同5.2.1。对于本文中对于英文碎纸片的拼接复原问题可用下面图12的流程图表示。

开始对灰度矩阵进行5.2.2中的二值化处理对二值化矩阵Ei做边缘匹配选取每一个元素对应匹配度大于0.9的元素存于一组中，即将对应的图片归为一组对于每一组内图片做5.1中的边缘匹配当前碎纸片对应其他碎纸片的匹配度为0.9以上的碎纸片张数大于等于2张否是人工干预选择碎纸片并判断计算机给出最大的结果后人工判断重复判断过程多次直到结束人工干预处理结果图12.流程图

通过上述步骤可一把相同行的纸片先拼接好，得到新的11张横行碎纸片，这里拼接11张碎纸片的方法同5.2.1，不再重述，得到的结果见下表11。

表11.附件4的复原

191 201 86 19 159 75 148 51 194 139 11 170 107 93 1 154 196 29 141 129 190 198 40 88 63 184 94 158 121 138 2 113 186 126 153 104 164 98 105 53 180 78 24 155 38 64 103 117 114 123 106 91 150 176 120 4 80 5 182 175 149 101 59 151 85 32 26 58 22 50 204 100 92 57 160 65 6 30 202 187 39 17 37 71 97 67 28 46 165 203 147 146 127 82 31 20 41 108 116 136 73 7 60 49 14 36 207 135 15 76 43 199 45 173 79 161 179 143 208 21 70 84 61 119 33 142 168 62 169 54 192 133 118 189 162 197 112 68 174 137 195 8 47 172 156 96 3 18 48 23 99 122 90 185 109 13 110 25 16 9 27 178 132 181 95 171 42 81 69 167 163 166 188 111 144 206 130 34 56 72 35 66 205 10 157 74 145 83 134 55 89 183 152 44 0 102 115 77 128 200 131 52 125 140 193 87 12 177 124 5.3问题三模型的建立与求解

本问我们可以先将所有的图片用matlab的图像处理得到灰度矩阵后二值化处理得到每一个图像的二值化矩阵，通过对图片的观察与对矩阵的判断，编号为i的碎纸片a面右端（或左端）与b面左端（或右端）边缘全是白色的图片一共有22张，考虑到所有的碎纸片应被拼接为11行，而左右个两端，乘以2就是22，所以136、005、143、083、090、013、035、172、105、009、054、078、089、186、199、088、114、146、165、003、023、099这22张碎纸片应是原文件纸张的两端。为了方便可以将可以选择这22张碎纸片作为开端匹配对应的纸片。

以纸片000与001为例，匹配方式可能为：

000a???001a?①： ?000b???001b?②：

000a???00b1?③： ?000b???00a1?④：为了找出碎纸片如何对应，则将①②的边缘匹配度相加得到边缘匹配度之和，将③

④的边缘匹配度相加得边缘缘匹配度之和，两者的和做出比较。若仅有一个大于等于1.9，则计算机输出该匹配度，人工判断是否碎纸片是否匹配；若两者均大于等于1.9，计算机把两个匹配度之和输出，人工选择判断碎纸片应是否匹配与如何匹配；若两者均小于1.9，则计算输出最大者，人工判断碎纸片是否匹配。综上先建立边缘匹配度之和矩阵F，然后按照上面的匹配原则开始匹配。

若出现计算机给出的结果人工判断后发现匹配错误，则记录当前匹配成功的碎纸片该过程可以用下面的流程图图13来表示。

信息并在剩下的碎纸片中重新开始计算机匹配与人工判断。

共8页:

2013全国大学生数学建模比赛B题 - 答案(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档