2、概念分类 概念集中到map文档后,利用该文档的树形结构进行分类,形成上下级关系,为概念内涵的演绎提供了依据。在具体设计中,通过每个节点的名称,可以直接通向顶级的抽象领域。 概念的树形分类,不仅明确了上下层关系,同时也形成了同一层概念的远近关系。向上索引到同一父节点的路径较短的概念 ,自然位置较近。 3、概念名称注册 一个词汇(字符)进入map文档成为一个值(或节点名)后,即在语义分类网络这个层面上形成注册登记,它将有资格代表一个概念,得到语义分类的支持,也可以共享上级概念的基本内涵。也即得到了概念分类的基本理解。 同一个概念只有一个词汇(名称)通过注册,起到了筛选的作用。
4、格式规范。在XML结构的支持下,生成一套String格式,通过在Map结构中的位置,描述字符所代表的概念语义。已知概念形成的结构,为未知概念提供语义坐标。
2.1.2概念MAP的XML结构: 每一个值(value)都对应一个语义概念的存在,虽然你(个体、AI主题)可能完全不理解这个概念,并不拥有概念的任何内涵和经验;但是这个XML上的节点,就建好了一个概念的空壳子,还贴上名称、类型的标签,放置在适当的位置;当这个值进入一个标签,标签的值就是它的子概念。 子概念可以多重继承。不排除一个概念内容分布在两个领域内,比如<认知.我_我的感觉> <物理.生物运动.感觉.我的感觉>,必须有高度相同,可以整合在一起的内容。不同的概念分类串正好准确说明,自然语言中 的多重含义,也就是我们对事物的认识可以通过多种思维方式,理论方式来实现,那么也就必然地体现在概念分类的结构之中。 map的开放结构:即使是常识性的知识,也很难定义一个标准的结构,不如保留一个半开放系统,可以复制一个备份区,按照某种规则添加新的节点,得到多次确认后内容,再写入正式的库文件中。 xz
2.2概念map的内容
语义区域:概念map是概念map的顶层,目前已通过向下分类或解析,描述上千个具体或抽象的,包含了名词或动词等,每个词汇都代表一个已理解的概念(值)。语法和经验库等,通过接口接入概念map结构。@@file=“路径-文件名”,也可以进一步指向xml文档的某一节点(集合)。理论上,所有掌握的概念都应该在概念map中拥有一个位置。 所有概念通过物理(含生物)、社会、认知3大领域,建立一个常识性的语义数据树形结构。四大领域整体上相对独立,也会少数概念产生相互联系。时空与存在,可以顺序贯穿,也可以同时渗透这几大领域。领域之下还分若干子领
域,区分方式包括“具体-抽象”“简单-综合”“基本-复合”等。以下是概念map中的一些实例:
<肢体动作>走、跑、跳、爬肢体动作>
<手动作>握、摸、抓、指、挥、举、背手、抱、推手动作>
<复合过程> 洗、去、玩、写、画、安装、修理、种植、饲养、喂养 复合过程> <综合抽象活动>工作、发展、创造、建立、改善、提升、优化;变化、生产、经营、
维护、推广、交流、表示; 完成、中断、停滞、实现、等待;维护、解决、推动综合抽象活动
概念在map中也相对明确滴分为事物、运动和属性,隐含对应着名词-动词-形容词或副词(定语或状语)。在每一个节点下的概念值,这个类别是一致的。在原始概念的意义上看,物理域、生物(子)域、认知域、社会域等领域,都有独特的动词和名词概念的,同一域内这三种类别的概念会频繁搭配,更详细表达领域内存在的对象,领域之下的又细分为子领域,关联性也很高; 从词汇上看,跨领域的搭配虽然频繁,但通常都已经超越概念的原始意义,形成引申意义,从逻辑上我们应该将这些引申含义的词汇转回其原始概念后,也大致能在概念map中的领域达成一致。 在编程中概念map作为一个XELEMENT常量,初始化导入,用于频繁的语义搜索。 密切协助概念map工作的数据: 虚词专用表:常用词汇,包括助词、介词等虚词(甚至包括标点)的分层等级虽然比较低,正因为没有实在的概念语义,所以专门用于在语言中对词汇进行标识-组织,类似特殊字符的作用。但是在语法领域它们拥有特殊的含义,特别是非常频繁地和其它词汇序列一起,在对句式、语义的匹配中十分必要,所以有必要专门进行了描述。这些词语意义作用单一,理论上在概念map中,位于语言.词汇的节点之下,但概念map并不准备在value中登记这些词汇,因为这样把它们混在一起,明显降低虚词和实词两方面搜索的效率。因此,有必要从词汇概念中取出这些 最常见的助词、介词、连词等虚词,加上代词等作为常量,也符合在语法常识中,它们是虚词,没有“实际意义”的思维习惯。 概念近(同)义词表: 概念map中登记的概念词汇,当然代表概念的唯一名称,否则在逻辑上将带来混乱。而语言文字中大量使用概念的同义词、俗称、别称等众多词汇,因此围绕概念建立近义词表,在每一组近义词的组合中,把作为概念名登记的词汇放在首位,通过1:N的近义词表,扩大了从词汇到概念的识别。同时也可以把有多种含义的俗称、场合叫法等,列在概念名的后边备用。 参考《理论.词汇》中<常用词汇表>标签下各词汇表(常用名词除外)
2.3概念map的格式:
2.2.1语义节点,在XML文档中用
2.2.3描述概念的语义串:语义串即表示语义的字符串,必须在概念map中能搜索到的串,才是有效值。一个词语有多重含义,但在语义结构中重复出现的同一个值(词汇)的可能性已经大大减少。对于多义词汇,在语义结构中,只要进一步搜索预计这个值的上级或同一节点,就可以确定其意义。 一系列同义词中,挑选书面最规范的一个用于概念注册。一个词汇的多个意义中,当然选择其原始意义的概念来注册。 比如“鸡”这个词,常用三种含义,在语义结构中只能找到一个,即家禽或鸟类节点下的一个值。在另外两个含义在概念map上找不到,而只能从其它预备概念或词汇表类型的“俗称”中匹配到概念的正名,才能进入。严格地解释,鸡作为词有三个用法,用语义串表达为<...家禽.鸡><....器官.男性生殖器官.俗称><社会...职业类型.失足妇女.俗称> 有效的语义串能完整表达词语在概念分类中的位置。具有多重意义的词语(真正在两个概念位置上无法取代的词汇不多,多半是跨领域的概念拥有 多个语义串),可以在概念map中搜出多个语义串,在通过本句或上下文中其他词汇的语义串所在域,不仅能排计算出该词汇的语义,排除歧义,甚至能帮助计算出整个句子,甚至段落的语义。
表示概念的语义串,基本格式为@@gai= (概念的汉语拼音)
从外界出口(@@file=“路径-文件名”)引向其它xml文档的内容,可以接着概念map的语义串,接着用.节点的方式,延续语义串的描述。
2.4概念map作用
围绕概念map进行演绎和归纳 结论:通过语义库的xml结构和文本型的语义串,我们要努力实现更全面的,各种语义的描述和搜索,包括并不限于以下内容: 概念分类;
分析概念之间的关系
用概念语义串描述概念域---概念map中一系列节点下概念的集合;多个集合的交集和并集;
概念-子概念和对象,个体、集合、任意、存在某一个,抽象概念或具体时空; 概念/对象-运动-属性的结合; 语法中的词汇和句式; 增加新的逻辑方式
以上推理过程,在代码层面上无一例外需要更详细具体的语义串格式支持。这些语义串格式上也自然以“@@sem=”为基础进行扩展。使用频繁的有...
第3章 语义维度和语义向量
3.0语义向量和语义维度
在对自然语言中语义现象的本质进行思索后,创建了语义向量和语义维度的通用结构,用于形式化描述普遍而广泛的语义构造。
语义向量: 由一个较简单的结构形成的语义分量,如同空间中的一个向量,(不限于直线)最典型的就是一个属性,比如物体的颜色。
语义维度: 一个蕴含很多结构的语义组合,如同空间中一个面(不一定是平的) ,语义维度之中有多个内容可视为向量。较典型的比如物体的视觉形象,包括了形状、颜色、尺寸等一组属性。
每一个语义向量,通常可以1个属性(或2,3个吧)来描述,建议使用1个枚举类型数据对应一个很短的整数来描述,以模糊程度为主。这些属性可能赋予不同层次的语言活动,如概念、经验、情景、事件、过程....,对应着语言上的词语、句子、段落甚至篇章。比方说,客观性这一种语义向量,能映射赋予的对象是句子描述的事件,通常常用的词汇、概念,在生成对象用于句子之前,就没有客观性这种语义,但描述事件或理论的专有名词或词组例外(如燃素说日心说相对论,92共识);而褒贬的语义向量,则可能会映射到词汇和概念上。
如果一个向量对语言活动可以赋上有效值,那么我们说这个语言活动在这个向量上有意义。例如: 对话态度,可以包含有敬重、礼貌、认真,及其相反的值。“无”(明显态度),可以作为有效值,也可以做一个无效值。当我们认为所有语言都可以有态度时,“无”态度也是一种态度。 下午6点来吃饭。(口头的,态度随意,也可以理解为无态度) 下午6点恭候,敬请光临。(正式、尊重,带上帖子)
每一个语义维度/向量,在理解和思维过程中,都可能指向特定的思维区域,如搜索或修改特定的记忆和搜索区域,使用不同的思维逻辑线路,调出特定的搜
索读写参数。在AI系统中使用不同的过程和文本。
语义维度和向量,在概念map中,认知.语言.语义的概念下进行简单注册,以便顶层分类统一管理,并进行抽象的归纳演绎等逻辑。但每一个语义向量下,用于匹配判断的具体词汇、句式,目前的设计将一个最常用而简要的结构置于与map并列的“语义向量”大标签下,以便于过程代码语义分析时的快速导入,作为静态常量频繁使用。由于大量语义甚至需要多个符合句式表达,如重复、排比、设问、反语、三段论、经典归纳法、各种论证,所以更详细的经验句式甚至段落,只能引入专门的语义概念进行描述。
面对一段文字(话语),常规阅读(聆听)时,我会会以N维常识性的语义维度进行分析。在AI语义引擎中,每个向量的分析对应一个进程,每个语义维度的分析对应于一个客户端,拥有专有领域的语义串格式及其支持下的数据库
3.1维度一:语言法则
语言法则(语形)的分析,主要在文字阅读中进行,而对话表述中很难保持对语法规范的使用,所以及时对话的形式一般只用于几个句子规模的信息交流,而非用于组织篇章规模的信息。
理解面对的第一步是纯粹的文字组合,因此有必要把纯粹的语言系统与思维观念在形式上分离,单独讨论文字、词汇、句子的意义和组成规律。
语言法则包含抽象的语义结构
词汇和句式属于语言中语法范畴,本质上是语法(语形)这种特殊领域的语义,人类语言;在使用它们的时候,它们是独立于观念世界的描述和隐射;但在实践中我们也要频繁地学习理解它们本身,当语言规则自身也要被描述的时候,就成为概念在语言领域的特殊结构。
我们通过语义串的出发节点,可以象描述其它领域一样,描述语言自身,指向特定概念库、经验库、库内的结构。这种自指能力,也是自然语言中建立语法结构,完善语言系统的关键之一。因此,定义了逻辑句式的数据结构。
语言法则并非完全与客观世界完全独立脱离,它的结构也能反应认知思维方式对认知目标的简单分类,同时也间接地体现了客观世界的某种抽象。这在以下所有环节中都有体现。
1、词语。词语是对概念的标识,分为各种词性。
最基本的词语类型应该是名词。名词是独立而稳定的信息集合,可以表达从具体到抽象的事物类型或对象。在句子中,名词的概念或对象作为主语和宾语,表示发起活动的主体或者对象。在本系统中,名词概念的内涵包括了这一类事物的组成部分。
其它词性的概念或对象,如果被置于主题或对象时,就会被固化为名词。 例如:游泳(或任意动词)是一种运动;我喜欢漂亮..... 反之,只有部分名词会延伸为其它词性使用。
动词通常视为事物或对象的关系。在动词概念中,内涵的主要内容包括这个动作或活动的前提、过程和结果。动词的过程与名词的结构内涵相似,结构和过