WebKit引擎介绍(2)

2019-04-02 11:41

给JS的接口定义等内容;

dom:主要包括dom方面相关的内容,如不同dom元素的定义与实现、dom Binding给JS的接口定义等内容;

html:关于html 方面相关的内容,如不同html 元素的定义与实现、HTMLTokenizer 及HTMLParser等内容。

loader:主要包括装载资源,如html页面、css、js 及image等方面内容;

page:主要包括描述一个Web 页面所涉及的内容如page、frame、frameview、frametree、setting、history、chrome、chromeclient等内容;

rendering:主要包括如何使用样式,组织布局、显示html 元素等方面内容; plugins:主要包括浏览端如何实现NPPlugin 方面的内容; svg:主要包括与svg 方面相关的内容;

xml:主要包括与xml 方面相关的内容,如xml parser、XPath、XSLT等;

platform:主要包括与不同平台或外部库相关的内容如graphics(图形输出方面)、network(网络处理方面)、image-decoders(解析不同图片格式方面)等。

2.2 Http请求在WebCore中的主要流程

2.2.1 工作流程

如下图所示:

Http请求1IO组件32Shell控制器4ParseHTML/XHTML5Build Dom树6Build Render树7Layout 流程解析:

1. 用户向Shell发出页面请求后,页面的URL 或本地文件名被发送到Shell; 2. Shell 调用IO组件,把URL 传达到IO组件;

3. IO组件使用HTTP 协议或再调用本地IO获取HTML/XHTML源数据,返回Shell; 4. Shell 把IO 返回的HTML/XHTML source 提交HTML/XHTML分析器;

5. HTML/XHTML分析器分析HTML/XHTML代码,构建一棵DOM 树,树根为HTMLDocument; 6. 通过DOM 树,生成Render 树。 Render树,简单的说来,它是对DOM 树更进一步的描述,其描述的内容主要与布局渲染等CSS相关属性如left、 top、width、height、color、font等有关,因为不同的DOM 树结点可能会有不同的布局渲染属性,甚至布局时会按照标准动态生成一些 匿名节点,所以为了更加方便的描述布局及渲染,WebKit内核又生成一颗Render 树来描述DOM 树的布局渲染等特性,当然DOM 树与Render 树 不是一一对应,但

可以相互关联;

7. 布局管理器layout对应控件。当布局管理器对可视化元素指派好位置和大小后,可视化元素必须要严格遵守布局管理器给它分配的位置和大小,不能擅自更改,相应控件根据自己的属性进行表现自己了,如背景,外形等。

2.2.2 处理流程

流程描述:

通过向服务器发送请求服务器通过请求,发给客户端html的内容浏览器通过W3C 规范,把接受到的内容解析成DOM 树,在解析DOM 树的同时会生成对应的Render 树。布局管理器通过Render 树,开始布局。这个是一个动态的过程,DOM在这个时候会继续向服务器申

请自己需要的东西, 比如CSS,JavaScript,图片等,然后布局器动态的加载或布局,这样可以改善用户的体验,最后把整个网页render出来。

3 WebKit的DOM分析

3.1 DOM原理

3.1.1 DocView 模型

DocView 模型包括:网页标识、网页类型、内容类别、标题、关键词、摘要、正文、相关链接等要素。其中正文和相关链接要素属于网页的内容数据,而其他 6 项则属于网页的元数据。

网页标识:对 Web 上网页的唯一性标识,在 DocView 模型中使用网页的URL 作为网页标识。

网页类型:主题网页(topic)、Hub 网页(hub)、图片网页(pic)。其中,有主题网页是指网页中通过文字描述了一件或多件事物,是有一定主题的。如一张具体的新闻网页就是典型的有主题网页。Hub 网页是指专门用来提供网页导向的网页,因 而是超链聚集的网页。如门户网站的首页就是典型的 Hub 网页。图片网页是指网页的内容是通过图片的形式体现的,其中文字很少,仅是对图片的一个说明。如某个机构包含图片的人员介绍网页就是典型的图片网页。

内容类别是从语义上对网页的内容进行分类,它是计算机获取网页语义信息的一个直接手段,在 Web 上的研究领域中有着广泛的使用。它是通过特定的分类器对网页内容分类得到的,依赖于一定的分类体系。

标题、关键词和摘要是概括描述 Web 文档内容的重要的元数据,对于 Web 信息检索等领域的工作有非常重要的作用。

正文:原始网页中真正描述主题的部分,因此,在某些具体应用中用正文代替原始网页更为合理。相关链接是指在本网页中指向与正文内容相关的网页的链接,而非广告等噪音链接。将正文和相关超链重新组合就得到了净化后的网页。

超链相关的标签是 HTML 网页区别于传统文本的明显的特点之一,表示着网页间的关系,因此整理出超链标签并作合理的分析可以挖掘出网页间的 内容相关性信息。目前,有


WebKit引擎介绍(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:少有人走的路读书笔记

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: