5、通过概念文档库和经验文档库的支持,更准确聚合词组和短句含义。
举例:A和B,作为概念和对象的组合,貌似十分随意,但由于这个词组整体通常要使用共同的谓词,那么A和B的概念(对象),必须位于概念map的同一等级上的并列关系,不应出现“中国和南京”的概念并列,非要并列,只能有“中国”和“南京”这两个词语符号的并列,因为它们仅在词汇表中才能得以并列。例句:今天学了中国和南京这两个词。从概念map的角度,这里的中国和南京,都处于@@sem=语言.词语.名词之后。而不是@@sem=空间.国家(_城市)的概念意义。
在此仅讨论单个句子(含复句)的理解。
自然语言的理解,至少包括词汇、概念、句型三个基础层次。每一层次分别由词汇库(盘古分词库)、概念库(库.预备概念.xml和其它单独的概念)、句型库(表达.xml)相应的XML结构和值构成。
概念结构(包括概念内部结构和表示外部关系的概念map)是语义的普遍模式。概念组织人们认知所形成知识及其关系的结构,也通过模板产生实例指代具体事物。
但是,在自然语言中,对话和书本等出现的句子中,并不会直接指出那个词汇是概念、是实例、还是指向另一个概念的标识。比如:苹果是一种水果;我吃掉一个苹果;新一代苹果下月发行;
所以我们不能直接确认并理解概念,即使单个句子的语义也并需通过三个层次:第一步识别字符,通过分词软件识别词汇;第二步进一步通过语法中的句式匹配,当多个词汇的性质全部匹配,确认符合一个描述句式之后,就转换为一个逻辑句式,确认几个重要元素的性质,进入概念或其它类型数据结构的相关部分。 在以上例子中,苹果通过与“是一种”、“吃掉”、“新一代-发行”的语义连接,通过经验库中各种实例的可行性,可以消除歧义;如果遇到“我不喜欢苹果”这样的句子,则三种情况都可以成立,则需要在上下文中寻找更多关联来确定。
完成句型匹配之后,可以映射到一个<逻辑句式>,逻辑句式的每一组成部分都有明确含义,指向个体所拥有的库(经验库、知识库、概念库)的具体位置,也就得到一个综合性的语义描述。常见格式如下: @@概念=
指向概念map的所有值
语义串的使用需要贯穿到匹配的每一个层次。因此,概念map数据结构有必要用字符串精准无歧义滴描述以上的每一个层次:
基础地位的是词汇层次,盘古分词之后获得了整个句子的词汇、词性、位置 处于核心地位,承上启下的是概念结构层次。
词汇和句式属于语言中语法范畴,本质上是语法这种特殊领域的语义;在使用它们的时候,它们是独立于观念世界的描述和隐射;但在实践中我们也要频繁地学习理解它们本身,当它们自身也要被描述的时候,就成为概念在语言领域的特殊结构。我们通过语义串的出发节点,可以象描述其它领域一样,描述语言自身,指向特定概念库、经验库、库内的节点和节点集合。这种自指能力,也是自然语言中建立语法结构,完善语言系统的关键之一。因此,定义了逻辑句式的数据结构。
大多数的句子,会在概念map和语法分析两个领域具备相关意义,比如说:..... 语法领域将词语归纳抽象为各种词汇类型,将词汇的连接抽象为词组、短语、句型句式,更进一步到并列、因果、递进;陈述、疑问等表达方式......并产生一些脱离概念领域的虚词,成为连接信息连接的专用零件......在大多数情况下,一个句子不仅需要合乎语法,亦需要语义适配,如抚摸数据、努力地下雨、刺鼻的原理、高兴得打起呼噜、绵羊一般凶猛...虽然符合词汇搭配规则,但都是常规经验中搜索不到,以正常逻辑方式无法理解的信息。
逻辑句式在表达.库的<句式>标签下定义,一个逻辑句式可以对应多个<描述句式>或<表达句式>。使用语义结构的变量,通过描述概念库、经验库、语义库的特定节点,加上表示逻辑的关键词,一句话的语义,能同时通过这些节点,就形成了确定的逻辑线路。比如,“【gn】,的,【cons】,是,【value】”就表示:一个句子中,如果由“的”,“是”分隔的三个词汇(字符串),搜索概念模板的所有节点,如果能同时满足以上三个条件,即:某个【概念】、该概念的某个【结构标签】、该概念该标签存在特定的【值】,那么这个判断是我的知识库中可以理解的。(严谨的写法是“【gn】,的,【gn】.【cons】,是,【gn】.【cons】.【value】”,可是,这样的视觉效果你是否还能忍受?) 句式中的变量列表: 【gn=】某个概念,可以在单独的概念类型文档xml,概念map中注册的value,或在预备概念文档中的一个节点。gn值数据类型的最基本要求是有上级概念,通过不断上行一直达到概念map的顶层,可以拥有一些最基本的概念模板和内涵信息。同时在概念map节点上的位置,也体现了它在概念类别上的语义。 【cons=】表示一个节点。当前面有【gn】.的时候,表示指定概念值下的节点。这个概念有一个概念模板,在预备概念中,知识会写成“某概念”的“属性”是“属性值”的简化形式。 【value=】确定gn和cons下的多个被逗号或句号分割的value值之一,
@@\表示某领域,即节点下所有值,等效于which【cons】.contains(\ @@词性=(动词、名词....)表示词性=xx(词)的任意一个词汇 @@语义= 在语义map.xml文档 中支持的语义串,代表某一概念及其子概念。后面的字符串如果带点,可以准确描述概念含义; @@句式= “在....之下”
@@逻辑句式= @@描述句式=
句式类型参数之中,可以插入词性和语义参数
句式格式分为准确和模糊两种类型,准确类型中的变量之间不能夹杂有虚词(助词、)之外的词汇;模糊类型的变量按顺序排列即可。
可增加一些算符,如不等于<>,
@@example= 用于语义不明时,举一反三,可以尝试搜索概念map下同一个节点下的其他值
特殊值 every(one)表示任意一个值或一组值都成立;any(one)表示未知的某一个或一组,但其它值未必成立;unkown表示完全未知,哪个领域都不知道
3.3语义串的高层次规范和运用 :
1、语义串的高层次标签规范 :识别主要语义维度和向量。语义串 2、语义串组合表达句子陈述 3、语义串组合表达语义向量
4、举例:运用高层语义串标签规范,描述对一段阅读材料的理解。 包括由一系列关键元素组成的内容提要,形成最最基本的理解。用于进入经验库长期记忆 ;
语言、客观普遍性、与我相关三个维度中,多个语义向量元素,分别对材料部分语句段落,包括概括后的内容提要元素进行映射,形成自己的看法、感受、影响,形成短句,并加入语义标签内。
语义标签片段的多少,从某种角度反映了AI语义理解的深浅程度;标签的类型,反映了AI思维的特点性格
建立并语义向量的基本过程:
1、形成较完备的概念内涵和经验,加到概念map 中语义的领域。
2、 把这个概念内的内容,通过添加属性、激活等方式,映射到其它内容。 3、将这种语义结合演绎到一定范围,可以用概念map中一系列节点集合来表达。
4、确定这个过程,形成语义向量的思维模式
3.4 尝试与AI对话,学习建立一个新的语义向量 识别对话者身份,确认教学关系:
识别谈话中的抽象语义、新建原理 ,指向概念map的语义领域。 识别对话中新建原理的各元素:适用域、谓词、等
原理确认固化:刚才说原理,你要好好记住;
3.5建立并运用语义向量的基本过程: 举例:视觉思维
1、展开视觉概念基本内涵: 包括形状颜色大小;位置移动;等 句子中有相关词汇都可能与视觉领域有关。我们可以说,这句话中包含了视觉形象,是说
看得见的事情。如此一来,可以大量搜集关于对象概念的视觉属性和经验描述:如对于“太阳升起”,自然看到金光闪闪、缓缓升起,高挂空中的视觉经验。 2、运用归纳法,确定映射对象,所有物体、环境、图解;即形成所有物体都有形象,所有情景都有景象,在抽象些,只要脑子里思考的东西,与别人交流讨论的概念,都 可以形象化,设法画图说明表达(ppt)
3、在抽象认识方法的模板中确认“形象思维是本能、普遍的思维模式”,关联到相关的 思维方法和过程 。即任何事物和过程,可以用形象类比描述。参考UML分析模式,概念树形模板,整体-结构,流程图的分析,都可以作为形象化表示。 4、不断积累识别视觉语义维度的匹配经验,主要包含以上每个步骤的词汇、句式。如颜色形状的属性,空间运动-视觉的动词等。 描述原理中各元素,整体中各部分,活动中各过程、操作条件的句式。
3.6举例讨论:我对词语的疑问
x、我、语言、思维过程的映射汇集 1、疑问的概念 :
疑问本身就是一个概念,在此讨论疑问概念模板的初步建立。 首先,在概念体系,具体地也就是在概念map里面,“疑问”位于什么位置呢?从顶级四大领域看,疑问是在人类认知过程中产生的,它显然应该位于认知领域;然后,和它并列的概念是“确认”(已知、明白的确定的内容)、或“空白、未知”。疑问的位置显然处于接近未知和空白这一边,又不仅仅是位置和空白。它与未知和空白的区别,更多出一层意义 ,即主体对这一项内容的关注,对寻求答案的驱动。因此,在概念map上,我们可以在<认知状态>这个节点中将疑问置于已知(确认)和(空白未知)之间,即现状是未知,但未知状态已上报主体,因此产生一个寻求知识,向确认状态活动的趋势。从认知这个更大的结构上看,疑问处于有目的的,自觉求知的这个过程的起始阶段。
疑问这个概念,抽象程度较高,与具体物体之类的不同。它这个词汇本身较少亲自出现。尽管我们有时候也说“我对XXX(某个名词、词组或短句,代表事情问题)表示(产生/有等)疑问”,但是这个词出现的时候,却基本上是一个陈述句,并没有直接等待或请求回答的意思。真正用于提问的疑问句式如下: 现在是什么情况/时候/地方/东西,是/干什么,
还有怎么,还有啥、谁、哪、几;以及吧、吗、么、呢等疑问词。
还有一个符号的搭配。当疑问词加上“? ”的标识,疑问句的语义确定性即接近100%了。
因此,“疑问”本身是把思维活动作为一个固定认知对象的名词,真正的思维过程要添加动词才能描述:提出/产生/解决/有+疑问。 “什么”就起到了 有+疑问的作用。
2、疑问的内涵:
参考基本动作的模板,动词概念的内涵最重要的是动作的步骤(对比具体名
词的结构)。那么疑问思维基本步骤就是,确定一个对象,使用一个模板进行对照,如果发现空白未知的内容,则疑问形成,之后反复出现。 以词语的疑问为例,AI发现一个词汇表中无法匹配的字符组,就可以形成一个最原始的疑问对象:这是一个什么词汇呢?把这个对象记录下来,并且确保之后有机会拿出来,使用人工设计的求知过程,推动填满这个词汇模板的思维活动。这就是思维主动性的雏形了。
所谓人工设计的求知过程,第一阶段就是某些句式的匹配和key提取,比如字典中解释的常用句式。如果有对话,就是有关词语提问、回答的句式。
疑问句式和作用域
在过程代码中,我们首先提供一系列疑问句式的脚本,通过匹配确定疑问的内容、作用域。疑问的表示,在语法上(语言中)是用疑问词+问号来实现的。 一个陈述句,句子的各部分在语法上是确定的词汇,代表某个的概念或对象 而疑问句中,“什么”则占据了正常的某个句子成分。表示这个部分内容不明确且等待寻求答案。最基本的句式有: 什么取代名词概念(对象),直接取代主语或宾语: 主语+谓语+什么;什么+谓语+宾语(可以没有)。
这时候,什么的作用域,也就是可能出现答案的领域,就是与谓语动词前后相关,形成词组的概念领域,可以在概念map中可以搜索谓语动词获得这个动作/运动的标签,然后搜索上一级领域所辖的相关内容。也可以经验库中,获取动词关联几个值,然后这几个值再概念map中搜得响应语义域。两种方法一起使用,可以让疑问可能的答案域更为集中。
什么还可以作为定语成分,修饰后面的名词。如什么东西、什么方法、什么时候,这时候疑问作用域更为明确,就是修饰名词下辖的子概念或对象。
其它疑问动词:怎么,用于取代状语,描述未知的活动过程
谁,通常代表什么人;多少、几,代表什么数量;哪个,指向一个有限枚举型的数据。
哪里,代表什么地点;
吗,吧,是否。疑问内容不在某个部分,而是整个句子的真值,或者说整个句子各元素的关系,只要一个元素不符合,则句子或陈述不成立。最常见的实在在正常陈述句式后加吗,吧;在句子前或动词前加是不是,是否;
怎么+动词,疑问对象是活动的组合构成,参考活动的组成过程模板探索或回答;如果动词相对基本简单,也可用动词的控制参数探索回答,即快慢轻重,什么时候等。
疑问词汇-句式对应作用域,本质就是疑问这个思维领域的语义向量与语言维度的语义产生叠加。相应的疑问向量也可以和其它语义维度和或向量产生叠加,让后续的思考继续指向这些领域。
疑问对象生成和解决 3、疑问过程的描述
4、疑问不断产生后,导致一系列的求知-验证-最后解决疑问 。从可靠来源直