Conotate功能介绍:
Connotate利用机器学习自动生成的高效代码和辅助配置,其数据抽取的工具称为Agent。
在Agents的指引下,用户能精准地获得需要的信息—Connotate在过滤了广告和无关信息的同时,将非结构化数据转化成为支持业务流程的可读性数据。
Connotate的解决方案相比于网页脚本工具要优越得多,由于网站格式不断变化,修整是一项很重要的工程,Connotate的解决方案具有较强的适用性。
各网站都在不断地更新。优化解决方案,不但是为了精准地检测网页内容的变化,而且是为了更有效率地提高推送信息。过滤垃圾信息和删除重复数据可使工作流取得更大成效。
6
部署选项
Connotate能够满足用户的业务之需,并且适应今后的发展和变化。而且,Connotate能够提供灵活实用的解决方案以满足用户具体的业务需求。
详情请访问:http://www.bigdataunion.org/detail2.php?id=1
7
来自Datameer的解决方案
大型零售银行
为了量化资产风险和遵守监管报告的要求,如多德 - 弗兰克法案,这家一流的零售银行正在使用Datameer来验证数据的准确度和质量。
?
银行贷款和分支数据以及财富管理数据集成,数据质量的举措是负责确保每一条记录是准确的。这个过程包括对数据超过50个数据的理智和质量检查。这些检查的结果,随着时间的推移的趋势,以确保数据损坏和数据域的公差不改变不利和被报告给投资者和监管机构的风险状况,审慎和符合监管要求。
Datameer之前,该银行采用Teradata和Netezza公司和建设数据集市,以分析数据的质量,使用他们的SAS应用。这个过程是耗时和复杂,数据集市的做法没有提供数据的完整性需要确定整体数据质量。
金融机构
为了提高客户保留和参与,这家领先的金融研究机构使用Datameer加快客户的使用情况分析和产品改进。
? 基于Web的平台结合了全球性的公司具有强大的财务基本面分析,构思一代,为用
户的工作流管理工具的信息和市场研究。
该公司的产品管理团队需要了解用户访问模式和产品互动的细节,以便更好地吸引和留住客户。该公司此前使用OLAP多维数据集,存储和报告用户访问日志,客户数据和许可证信息。他们拼命用一个4-6周的周转时间,提供新的或更新的数据。因此,产品管理一直非常被动,他们的大部分时间花在管理报告的过程,而不是理解最终用户如何响应特性和内容。
该公司选择了Datameer加快洞察顾客使用,并加快新产品型号。有了Datameer,产品经理现在可以快速地关联在用户的流量模式的变化(点击流)和事件的背景下,如新版本,A / B测试和故障,以确定哪些工作或不执行队列分析。产品策略,现在可以迅速调整和改进
8
Datameer释放产品经理的部署,把重点放在分析用户的使用模式,并创造新的产品模型,而不是建设报告。
Datameer简介
数据快速集成
将您的IT资源从数据管道中释放出来, 为IT和商业用户快速整合任何数据源。
数据自由化 无ETL
数据是观察事物的基础。你掌握的数据越多,对事物的了解就会越深入。因此,你不仅要掌握传统意义上的交易数据,而且还要掌握所有其它类型的数据,这样才可以完全了解客户,充分理解业务流程,提高业务绩效。
Datameer为了把所有数据整合到Hadoop,而不关注ETL和静态模式的局限性。预建的数据连接向导关联所有常见的结构化和非结构化数据源,这就意味着,数据集成是一种简单的,分成三个步骤的过程:集成存储于哪里的数据、集成哪些数据、什么时候集成这些数据。
结构化数据包括:
? Oracle, DB2, MS SQL, MySQL等 ? Teradata, Greenplum等 ? XML, JSON, CSV等 ? HBase, Cassandra
非结构化数据包括:
? Twitter, Facebook, LinkedIn, Jive等 ? Email
9
? LogFiles
? SaaS - CRM, GitHub, Jira, Zendesk等
数据导入类型 导入作业
Datameer将所有数据以其原始格式直接导入到Hadoop。强大的采样、解析、调度和数据保留等工具使得整个导入过程到了优化和支持,从而用户可以便捷高效地获得他们所需要的数据。
任何数据的无限相关性 数据链接
在某些使用场景下,如分析瞬息万变的用户数据时,系统需要在分析在进行的过程中即将数据导入Hadoop平台中。这确保了用户数据始终处于最新状态。为此,Datameer为所有数据源都提供数据链接.
10