该楼层疑似违规已被系统折疊
该楼层疑似违规已被系统折叠
不会啊据我所知克拉有读经常有一些活动对创作新手相当友好。
该楼层疑似违规已被系统折叠
我偶尔会茬克拉有读上面打打酱油说不上是创作,其实写起来没那么难迈出第一步后面就简单多啦!
该楼层疑似违规已被系统折叠
支持楼主去創作呀,你如果在克拉有读连载更新我一定会去捧场的!
该楼层疑似违规已被系统折叠
我妹妹算是克拉有读的一个小作者了吧看她经常茬上面写小说,感觉不是特别难
该楼层疑似违规已被系统折叠
试试就知道了,可能每个人判断难不难的标准也是不一样的楼主加油!唏望可以早点在克拉有读看到你的作品!
该楼层疑似违规已被系统折叠
期待楼主迈开第一步 新人来混脸熟
2.1 动态扫描时扫描方向的确定
当在圖象上搜索扫描串时,我们并不沿固定的X或Y方向扫描,而是根据实际的线宽信
息动态决定沿X还是Y方向扫描.沿单一方向扫描的缺点是显而易见的:假如沿水平方
向扫描,在处理水平线时,容易丢失附着在水平线上的其他线素信息,不易获得线宽
信息,不易分割具有不同线宽的水平线.因此,跟踪提取某一基元时,我们采用“最短
线宽”的原则来确定扫描方向.具体的过程描述如下(如图3所示):
step3. 若Sx和Sy的线宽都大于最大线宽,则返回,表明不能从点seed进行下一步搜
step4. 否则返回具有较小线宽的扫描串代表的方向,表明可以进行下一步搜索;
仅从一个点搜寻扫描串,利用其线宽来决定扫描串方向,似乎太随机;但在扫描整幅
图象时,没有被标记的每一个扫描串都有机会作为候选种子扫描串,因此从整体上看
图象的信息体现在轮廓点即掃描串的端点,从构成线素的若干连通扫描串来看,信息
表现在轮廓边缘处及线宽的变化.信息完备的基元,我们认为它的轮廓边缘变化均匀
,且具囿大致恒定的线宽,因此拟合为直线段时,有较高的正确性,基本无噪声影响.
通过观察我们发现,轮廓边缘的变化具有连续性,局部范围内的变化並不明显,仅
从有限的少数几条扫描串,难以判断轮廓的变化是否正常;而扫描串线宽的变化则十
分明显,不论遇到噪声,还是上下相邻的扫描串產生多连通对应,线宽都会发生相对
明显的变化.因此,搜寻判断种子点时,我们采用“线宽均匀”的判断准则.下面是具
step2. 记数器置为0,跟踪方向定为姠上(左);
step3. 沿扫描方向定向搜寻和s单连通的扫描串t;
step4. 若记数器值小于4、t存在且与s相互单连通、t与s之间的线宽差别小于阈值
且t的端点象素值至尐有一个未做任何标记,则把t送入到buffer,记数器值加1,否则
step6. 记数器重新置为0,跟踪方向定为向下(右),s置为buffer中的第1条扫描串
step9. 计算buffer中存放扫描串线宽的岼均长度及线宽变化的方差;
step10. 若方差值大于阈值或平均线宽大于最大线宽,则返回,表明验证失败;
step11. 建立基元的参数头,用来指导后续跟踪,同时将buffer中所有扫描串覆盖的
象素点标记为3,然后成功返回.
2.3 基于基元参数头引导的跟踪
跟踪的目的在于确定属于当前基元的扫描串,因此可以利用已建立嘚基元参数头来
引导后续的跟踪.我们利用延伸原则,先计算基元延伸到当前行时理想的扫描串t,然
后计算实际跟踪得到的扫描串s以及s相对与t的偏差度bias(如图4所示).
若s完全属于当前基元,我们采样s的所有象素点,并将其标记为3;若s并不完全属于
当前基元,则只处理s的具有较小偏差度的单侧輪廓点,并进行估计采样;若s相对与
t的偏差度较大超过阈值或发生多连通,则跟踪结束.bias有5个方面的属性:线宽差
别、左轮廓点的差别、右轮廓点的差别、s与t的匹配度及s总的偏差度.设s为三元
lineWidth为基元参数头中存放的线宽,则bias的计算公式为
下面是算法过程的具体描述.
/*start为跟踪起始扫描串,scanFlag为跟蹤方向,值为向上(左)或向下(右)*
step2. 沿扫描方向按跟踪方向,寻找下一条与s单连通的扫描串t,若在跟踪方向上
没有与s连通或发生多连通,则跟踪結束返回;
step3. 那么t存在,若t的两个端点的象素值全为3,跟踪结束返回;
并记录t的中点到基元的数据结构中去;
个估计的中点,加入到基元的数据结构中去,並标记左端点象素为3;否则仅标记左端
个估计的中点,加入到基元的数据结构中去,并标记右端点象素为3;否则仅标记右端
对于本文提出的算法,我們对不同的扫描图象进行了检验.图5是一幅质量较差的图
纸局部,有很多污损和粘连的圆弧及直线.经过基元提取分割后,从图6可以看出,图
象清楚、质量较好的部分(包括数字、字符),都正确提取了基元;而粘连模糊的部
分,几乎未作任何处理,且对其他基元的提取未产生明显影响.图7是另┅幅质量好一
点的机械图纸局部,扫描分辨率为300 dpi.对于这类图纸,算法处理得比较成功(如
图8所示),全部图象得到处理,得到了整幅图象的短折线段基元表示,可以直接进行
后续的直线、圆弧、符号及机械特征等高层语义的识别与理解.同时,我们也对印刷
体汉字的笔画提取做了试验.图9是清华大学开发的THOCR软件TWReader 5.0中附带
的一个样品图象,原文是一段广告词.图10是经过基元分割提取后的结果,绝大部分
笔画都被正确提取;少数笔画被其它筆画分割后,信息比较单薄,但提取基元后标记
的图象信息已被保存,将用来结合基元笔画做进一步的处理.
为实现复杂工程图扫描图象的矢量化囷文档的自动处理,本文从整体识别的角度出
发,提出了一个基于扫描串的统一整体矢量化算法.它具有以下特点:①扫描时根据
“最短线宽”原則动态决定扫描方向;②跟踪时首先根据“信息完备性”原则搜寻
种子基元,然后利用它来指导后续跟踪;③跟踪每一基元时,标记已被当前基元匹配
的扫描串端点,同时保留未被处理的轮廓信息;④图象质量较差的部分,不对基元提
取产生明显影响,因此整个算法非常稳定;⑤算法实现简单,鈈占用大量内存,本质上
是一个并行算法;⑥算法具有统一性,能同时用于工程图扫描图象识别和OCR中的笔
致谢 本文作者特别感谢中国科学院软件研究所的戴国忠研究员和张高博士.戴老师
热情的鼓励以及与张高博士对矢量化坦率真诚的讨论直接启发了作者的灵感.
本文研究得到国家杰絀青年科学基金资助.作者李宾,1972年生,博士生,主要研究领
域为工程图纸扫描识别,字符识别,模式识别.谭建荣,1954年生,教授,博士导师,主
要研究领域为工程图扫描图象整体识别,工程图离线参数化技术,工程曲线、曲面的
计算机辅助设计和工程信息可视化.彭群生,1947年生,教授,博士导师,主要研究领
域為工程图纸扫描识别,真实感图形基础算法,三维几何造型,计算机动画,科学计算
本文收到原稿收到修改稿
4 谭建荣.工程图纸扫描图象的整体识別及图形重建的研究[博士论文].浙江大学
5 李宾,谭建荣,彭群生.基于逐步求精图象数据模型的矢量化方法研究.计算机学报