首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种网络地图文本标注投放的适宜性评估方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江西师范大学

摘要:本发明公开一种网络地图文本标注投放的适宜性评估方法,包括文本注记分类、反邻近距离的Voronoi加权方法、空间自相关描述邻域收敛、文本注记投放的适宜性评估。文本注记分类指从文本分类角度将文本注记解析为类型向量。反邻近距离的Voronoi加权方法指为了体现不同位置的要素对文本注记投放点贡献程度不一致,基于Voronoik‑order距离和欧氏距离相结合对空间地理加权的权重矩阵进行分配。空间自相关描述邻域收敛是指以Voronoi邻近距离作为邻域的度量单位,以莫兰指数作为空间自相关收敛条件,建立文本注记的投放邻域。文本注记投放的适宜性评估指拒绝不适宜注记向地图中添加。本发明能恰当地处理非结构化文本标注向地图新增问题,保证网络地图服务的安全性、准确性。

主权项:1.一种网络地图文本标注投放的适宜性评估方法,其特征在于:包括文本注记分类方法、反邻近距离的Voronoi加权方法、空间自相关描述邻域收敛、文本注记投放的适宜性评估;所述文本注记分类方法指通过建立文本注记分类标准,对非结构化文本注记按照预处理、分词、TF-IF特征提取、分类器构造、分类流程进行处理,得到不同地图文本注记的类型特征向量;所述反邻近距离的Voronoi加权方法是指对空间注记点建立Voronoi空间剖分,以注记投放点为中心,从1阶向高阶扩张,逐步形成不同范围的邻域划分;体现不同位置的要素对文本注记投放点贡献程度不一致,基于Voronoik-order距离和欧氏距离相结合的方式对空间地理加权的权重矩阵进行分配;所述空间自相关描述邻域收敛是指从Voronoi一阶邻域范围向K阶邻域范围扩张,采用Voronoi距离与欧氏距离相结合的反距离加权建立的地理加权的距离矩阵,按照预添加注记的种类对邻域范围内的进行莫兰指数计算并评估收敛性,求得满足莫兰指数收敛,即I0,Z0,最大的K值所对应的邻域为自相关收敛域;所述文本注记投放的适宜性评估是指拒绝不适宜注记向地图中投放,不适宜的注记包括两类:1文本中存在敏感词、异常词内容;2投放的文本注记不满足空间自相关约束,文本注记不满足类型空间自相关约束行为指在预投放地图文本注记位置的收敛域内无法查找到同类型的注记,从而拒绝该地图文本注记向网络地图添加;所述文本注记分类方法描述如下:传统的地图注记被形式化如下,ga={Px,Py,term}1其中,Px,Py表达地图注记的空间位置,term为结构化词汇或数值,代表地理注记的内容;扩展传统地理注记,使用非结构化自然文本对地理对象进行描述,成为文本注记bga为,bga={Px,Py,text}2text为非结构化文本内容,它们的基本单元是单词构成,各个单词组成的有序向量表达出句子或篇章的整体语义;通过分词过程,非结构文本text能够被描述为结构化的单词序列形式,bga={Px,Py,term1,term2,...,termi,...,termn},n∈N3上式中,由term统计词汇出现频率构成的向量被认为是text的特征向量;在使用TF-IDF建立文本特征的基础上,采用多项式朴素贝叶斯分类;文本注记bga属于第k类词向量的向量参数化表达为:Vk={term1,term2,...,termi,...,termn}={wk1,wk2,...,wki,...,wkn}4y为注记类型,n是特征词个数,wki是特征词termi属于第k类的概率值,即为Pxi|y;注记类型y和相关特征向量x1,x2,...,xi,...,xn之间的关系: 由朴素条件独立假设,Pxi|y,x1,…,xi,…,xn=Pxi|y6对于所有特征词xi,有 由于Px1,…,xi,…,xn为常数,使用以下分类规则: Py是训练集中类y的概率,采用极大后验MAP估计来估计Pxi|y;由此,词向量term1,term2,...,termi,...,termn的类型可计算;进一步计算词向量到各个类别的可能性,已知y存在u个类别,yk表示第k类,则第k类的概率Pyk为, 分别计算各个类别的概率值,并归一化后获得到各个类别的概率向量VC, 词向量term1,term2,...,termi,...,termn的类型计算如下: 所述反邻近距离的Voronoi加权方法如下:在给定Voronoik-order的评价区域为VAk条件下,构建评价区域的权重矩阵;假设VAk内任意点为pipxi,pyi,pi到空间点pjpxj,pyj的欧式距离为dpi,pj,Voronoi空间邻近距离表示vdpi,pj,则两点之间的voronoik-order反距离空间权重wij为: τk为k邻近距离阈值,超过阈值时,权重为0;在VAk内对所有到目标点的权重进行归一化,使得∑jwij=1;在Voronoik-order邻域内,构建权重矩阵为W: Voronoi-k-order反距离加权介于反欧式距离与反Voronoik邻近距离之间;空间自相关描述邻域收敛描述如下:Moran’I统计量是度量全局空间自相关的指标,在建立投放位置的邻域与空间权重矩阵基础上,全局Moran指数计算公式如下, zi为特征I与特征均值E[I]的差值;n为特征的个数,S0是邻域内所有权重之和;I值取值范围为-1,+1,当I0,区域内正相关呈聚集分布,当I0,区域内负相关呈分散分布;Moran’sI值只能在零假设的情况下进行解释,不能直接对空间离散与聚集进行解释;在给定数据集中的要素个数和全部数据值的方差的情况下,计算z得分和p值; 在p值具有统计学上的显著性条件下,当z值大于0时,数据集中高值或低值的空间分布在空间上聚类程度高于预期,当z值小于0时,数据集中高值或低值的空间分布在空间是离散的程度要高于预期;由此,当I0,且z0时,空间为正相关;当I0,且z0,空间负相关;当I=0,z=0时,空间随机分布;以Voronoi邻近距离作为邻域的度量单位,以I0且z0作为空间自相关收敛条件,建立文本注记的投放邻域BGAR,描述为:在拒绝非零假设条件下,使得文本注记类型空间聚集的最小Voronoi-k-order邻域即为注记类型的Voronoi-k-order收敛邻域,公式如下, 从k=1逐渐增大空间注记投放点的邻域,对任意点建立空间自相关的Voronoi-k-order最小收敛邻域;所述文本注记投放的适宜性评估包括:依据式17建立文本注记的Voronoik-order收敛邻域;投递的新注记与邻域内的注记存在相同和不同之分,因此注记投递的情况有2种:a新注记投放到与包含注记类型的邻域;b新注记投放到与异于新注记类型的类型邻域;在投放中,依据邻域内所包含的注记类型种类的不同,将只有一种类型的邻域称为单类型邻域,将两种或两种以上类型的邻域称为复合类型邻域;单类型邻域注记是复合类型的特殊形式;从统计方法的角度,使用注记类别概率向量转化为注记点类型概率直方图,通过直方图相似性方法检索投递点邻域内存在与其相似的要素;任意注记点pi,依据公式12构建若干个类型的直方图Histpi,经归一化后,建立的邻域的直方图分布;设新增文本注记pm点,注记点类型概率直方图为Histpm,收敛于VAk区域内,VAk区域内文本注记集为P={p1,…,pi,…,pj,…,pn},则有直方图集Histp={Histp1,…,Histpi,…,Histpj,…,Histpn},使用q表示直方图bin序列,采用皮尔逊相关系数方法计算注记类型与收敛邻域Nkpm内文本注记的相关系数, 其中,N为直方图bin的个数;相关系数的绝对值越大,在Nkpm邻域内的pm注记内与投递注记的类型相似度越大; τ为阈值,当投放注记与邻域Nkpm要素相关系数大于等于τ,则b情况视为合理,当相关系数小于阈值τ,则认为该注记与其周边邻域互斥,视为不合理,拒绝该注记投放。

全文数据:

权利要求:

百度查询: 江西师范大学 一种网络地图文本标注投放的适宜性评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。