想快速发展的话,更没有理由不使用它了。
xx 局目前数据库内的数据量为39万条,目前所购小型机已过了三年保修期,按xx局运行三年算,平均每天的新闻发稿量不到340条(当然发稿量一定是个渐近的数字,但就算平均到一年,每天也不过1050条左右),这一数字与千龙网、东方网每天的3000-5000条和新浪、搜狐每天的5000-10000条相比,根本算不了什么,因此绝不可能是因为数据库本身的性能影响了系统的速度。
如果iflow系统可以从oracle移植到mysql上的话,那只能说明这套系统根本就没有就oracle数据库做过优化,没有利用任何大型数据库提供的高级功能,因此其访问效率必然十分低下。 2.4 网站结构
事实上财经频道根本就不存在江苏频道里的内容。这说明了iflow生成的目录结构存在非常致命的问题,就是在同一天所有频道的内容都被混放在同一个目录中,然后通过不同的虚拟主机让用户产生不同频道的错觉,事实上根本没有办法把这些文件拆分开。 这样的话,就没有办法轻易实现象新浪、搜狐、千龙那样的分布式结构,即每个频道都可以单独地采用一台或几台服务器,从而承载每天千万级甚至是亿级的访问量。这将会给未来的系统改造带来极大的麻烦。
虽然使用完全对等的多台web服务器也可以实现负载均衡,但过度的冗余最终还是会影响到整个网站的性能。而且根据经验,
这一拆分工作是十分艰巨的,估计至少会花费一个程序员三、四个月的时间。
这个问题也是必须解决的问题,是大型网站发展的重大瓶颈问题。 2.5 内容海量
根据刚才的分析,xx局目前的新闻更新量并不是很大,按照大多数新闻网站的发稿标准,每人每天的额定工作量应该是50篇新闻,如果要达到千龙、东方每天 3000-5000篇的发稿量,应该至少保证60-100人的编辑队伍,而要达到新浪、搜狐每天5000-10000篇的发稿量,应该至少保证100- 200人的编辑队伍。 事实上这些网站根本就没有使用这么多的编辑。大多数网站,包括新浪、搜狐、千龙等均使用同一个自动信息采集软件(目前国内唯一能做到实用的,也是这几家大网站都统一使用的软件叫作newshoo,尽管同类的采集产品很多,但都无法达到预期的采集效果)与内容管理系统对接,直接将合作媒体的网站信息采集和自动发布,每天可以完成近50%的工作量,从而大大提高了发稿数量,降低了人力成本。 2.6 内容深度
仅从梅艳芳逝世专题而言,xx局的专题丰富程度比起新浪、搜狐和千龙而言都有极大差距。一方面可能与发布系统的表现管理和专题组织速度有关,另一方面也与历史数据有关。由于几大门户网站一直在使用newshoo软件采集来自互联网上的信息并输入
到自身的发布素材库中,因此编辑可以轻易找到很多可用素材,并且不必象在google上搜索一样要经过拷贝、粘贴、整理就可以直接使用。 2.7 服务深度
xx局提供了很多服务内容,从提出的改造需求看,改造后的服务广度将会进一步加强。但就目前的几项服务看,做的深度都不够好。
千龙网的论坛系统每天就可以形成200多万的pageview,在整个网站的访问量中占有很重要的作用,仅专职的论坛社区的相关维护人员就有十几个。
xx局较有特色的软件下载等功能的实用性还远不如一些个人网站,如华军(www.newhua.com)、中国站长站(www.chinaz.com)等,因此访问量不是很理想。
从alexa的流量分布看,xx局的最大一部分流量是来自于其“时尚”频道,即life.gdq.com,但在首页上竟然对时尚这一频道的体现非常不明显,看来对网站的日志及其它相关的客户访问分析工作还需要加强,并且需要加以充分利用。 2.8 发布系统
万博目前已经放弃了发布系统市场,而业内比较有名的发布系统包括trs的wcm、千龙网的龙讯还有天极、搜狐自己的发布系统等都各有千秋。
但是扩大到内容管理的范畴,即包括对整个网站的数据管理,目
前国内的产品还都相对不太成熟,而国外的产品本地化做得又不好,所以目前十分理想的方案很难找到。最好的办法就是根据xx局目前的实际情况进行量体裁衣,出具具体的方案,有针对性的进行改造建设, 2.9 网络安全
对于新闻网站而言,安全是非常重要的。建立一个安全体系需要比较大的投资,目前安全系统相对比较成熟,以防火墙、漏洞扫描、入侵检测、网页防篡改等一系列产品构成的防护体系应该是必不可少的。此类产品国外的相对成熟一些,但是很多地方有国产化要求,具体选型需要根据情况酌定。
尽管xx局一再声称网络安全做得不好,但经过使用一些国内、外流行的黑客软件扫描后发现,除提供社区、婚介服务的机架式服务器上的serv-u版本过老存在一定的安全风险外,其它的系统状况还基本良好,至少不会在非应用程序层轻易被人攻破。 2.10 信息安全
关于信息安全,或者说是内容过滤,由于存在理论研究上的瓶颈,因此一直没有特别令人满意的产品出现,就研究水平而言,中科院软件所在这方面一直居于世界领先地位,但其成果距离实用产品还有差距,因此目前市面上能看到的过滤方案都不能代替人工审核。
千龙网的论坛系统中已经做了比较复杂的内容过滤,但仍然需要大量的人力投入,足见信息安全方面目前还没有什么好办法。
三、方案整体策划 3.1设计目标
通过对xx局现状的分析,我们觉得目前改造后的xx局应达到以下目标:
1网络结构合理实用:在进行网络方案设计时,考虑到技术变化、网速提高、用户发展和需求都处于不断变化中,首先应该满足应用的实际需求,做到适度超前,将实用性放在首位。
2 服务规划稳定可靠:对现有主机服务器的设计规划应注重保护用户投资,在保证系统服务稳定可靠的前提下,充分利用现有的硬件设备和环境。
3系统架构统一开放:异构系统带来的不仅仅是应用的复杂与信息的不通,更主要的是给用户和使用者带来的不便和繁琐,大大增加了系统的不稳定性和维护成本,我们将采取全局规划、分块迁移的方式,逐渐使系统架构在统一的平台和技术体系上,保证系统的平稳过渡和逐步扩展。
4 业务流程实用有效:良好的业务流程将有效提高系统的性能和人员的协调,通过对核心业务的分解和整合,建立完善包括技术、人员、操作流程等方面的业务管理体系。
5 数据存储安全一致:数据是系统的基础和命脉,对数据存储的设计将在保证数据安全性的前提下,重新规划数据存储的格式和方式,通过数据备份、容灾、恢复以及数据挖掘技术的应用,提高数据的性能和利用率。