1、 实现查询的分组统计和排序:
在进行数据处理时,为了方便操作,往往希望先将一字段内具有相同值的数据归为一组,然后再针对每组做出统一的处理。
SQL语言中提供了GROUP BY子句和分组函数来执行分组操作。GROUP BY子句使用格式:
select 字段,分组函数 from table
[where 查询条件] //指定过滤条件 [group by 分组字段] //指定分组字段
[having 分组函数] //按分组函数的结果排序 [order by 排序字段]; //按普通的字段排序 Example:
select deptno as no,avg(sal) as a,sum(sal) as a,from emp group by deptno having avg(sal)
如果需要按照分组函数的结果排序,必须使用Having子句,不能使用order by 在使用分组查询的SQL语句时,需要注意一个重要的原则:select关键字后出现的字段,除分组函数使用的参数外,其他的都要在group by子句中出现。 2、 实现多表联合查询:
1、 等值连接:作用是查询结果是由两个表的记录共同决定的,只有两个
表的连接字段值相等的记录,才会作为结果返回。格式:
select t1.column,t1.column from table1 t1, table2 t2 where t1.column=t2.column; 或:
select t1.column,t1.column from table1 t1
join table2 t2 on(t1.column=t2.column);
2、 外连接:作用是查询结果是由某一主表的记录决定的,即使另一方没
有对应记录,主表记录也要作为结果返回,另一方记录的字段值为NULL,外连接分为外连接右连接。
左连接格式:
select t1.column,t2.column from table1 t1
left outer join table2 t2(t1.column=t2.column); 右连接格式:
select t1.column,t2.column from table1 t1
right outer join table2 t2(t1.column=t2.column);
3、 自然连接:作用与等值连接类拟,只不过连接双方都是同一个表,一
般是同一个表的两个不同字段做等值。格式:
select t1.column,t2.colum from table1 t1
join table1 t2(t1.column1=t2.column2);
3、
JDBC的排处理操作:Statement或PrepareStatement都可以执行批处理功能,可以使用addBatch(“”)方法处理中追加SQL语句,然后使用executeBatch()执行批处理中的SQL语句。批处理不能用于查询语句 4、 字段值递增:
Mysql和SQLServe,Sybase都支持字段值自动递增功能,但在 Oracle、DB2、PostgreSQl中却不支持,在Oracle中可以使用Sequence序列,实现字段值的自动递增。格式:
create sequence 序列名
[increment by 递增量]:设置递增量 [start with 起始值]:设置起始值 [maxvalue|nomaxvalue]:设置最大值 [nocycle]:设置累加,不循环
[cache 数量]:设置一次生成多少个序列值存入缓存 删除序列:
drop sequence 序列名 序列的使用:
可以使用nextval和currentval两个属性。currentval表示序列当前值;而nextvat表示在当前值基础之上递增之后的值。
Sequence是数据库系统按照一定规则自动增加的数字序列,这个序列一般作为主键代理,因为其不会重复。
5、 to_date(‘2010-10-10’,yyyy-mm-dd)Oracle数据库的转换函数,MySQL
数据库中,‘2010-10-10’格式的字符串会自动转换为Date类型, 6、 向表中插入含有特殊字符的信息,使用PrepareStatement操作数据。使
用BLOB类型的字段,使用PrepareStatement操作数据。通过setBinaryStream()方法可实现将BLOB类型数据写入数据库。使用CLOB类型的字段,使用PrepareStatement操作数据。通过setAsciiStream()方法可实现将CLOB类型数据写入数据库。 7、 获取数据表的结构信息:
1、 DatabaseMetaData
通过Connection的getMetaData()方法可以获取包含数据库元的DatabaseMetaData类的对象。DatabaseMetaData提供了非常丰富的方法,用于获取数据库的整体信息。如:版本号、产品名称、驱动名称和列名称允许的最大字符等。
2、 ResultSetMetaData
3、 通过ResultSet的getMetaData()方法可以获取包含数据的
ResultSetMetaData对象。ResultSetMetaData提供了获取表名称、字段名称、字段类型和字段个数等信息的方法,
8、 获取数据库中的所有表名:
通过Connection的getMetaData()方法可以获取包含数据库元的DatabaseMetaData类的对象。DatabaseMetaData提供了非常丰富的方法,用于获取数据库的整体信息。利用DatabaseMetaData的getTable()方法可以获取数据库中所的表名。
9、 程序备份和恢复数据库:
实现用Java程序备份和恢复数据库,最通用的方法是利用Runtime类的
exec()方法执行备份和恢复的命令语句。MySQL数据库备份和恢复的命令分别为(CMD 转到C:\\Program Files\\MySQL\\MySQL Server 5.0\\bin目录下执行下面的命令):
mysqldump –u用户名 –p密码 –opt 库名 >备份文件路径 mysql –u用户名 –p密码 库名 <恢复文件路径
10、 使用事务可以将一组SQL操作当作一个整体进行控制,保障逻辑和数据的
完整性,在数据库中使用commit和rollback命令也可以实现事务的提交和回滚操作。
11、 JTA事务与JDBC事务区别:
JTA(Java Transaction API)是一种高层的、与实现无关的、与协议无关的API,应用程序和应用服务器可以使用JTA实现事务管理。
JTA主要用于分布式的多个数据源的事务控制,而JDBC的Connection提供的是单个数据源的事务。JDBC事务因为只涉及一个数据源,所以其事务可以由数据库自己单独实现,而JTA事务因为其分布式和多数据源的特性,不能由任何一个数据源实现事务管理,因此JTA中的事务由事务管理器实现,它会在多个数据源之间管理事务。一般JTA事务都用于EJB中,因此一般的应用服务器都有自己的事务管理器用来管理JTA事务。注意:如果使用Tomcat应用服务器,是不能使用JTA事务的。JTA在使用时,一般会选用Weblogic、JBoss、Websphere等服务器。JTA也是用于管理事务的一套API,与JDBC相比,JTA主要用于管理分布式多个数据源的事务操作,而JDBC主要用于管理单个数据源的事务操作。 12、 JTA实现分布式事务控制:在分布系统中,一个逻辑单元可能会涉及若干
数据源的数据,JTA能够实现在网络环境中多个数据库在一个事务中进行操作,而JDBC事务只能在一个数据库中进行,因为JDBC中的事务是与连接相关的。
与JTA相关的API都在javax.transaction包中, 13、 数据库连接池:连接池用于创建和管理数据库连接的缓冲池技术,缓冲池
中的连接可以被任何需要它们的线程使用。当一个线程需要用JDBC对一个数据库操作时,将从池中请求一个连接。当这个连接使用完毕后,将返回到连接池中,等待为其他的线程服务,优点
减少连接创建时间 简化的编程模式 控制资源的使用
连接池原理:
连接池技术的核心思想是连接复用,通过建立一个数据库连接池以及一套连接使用、分配和管理策略,使得该连接池中的连接可以得到高效、安全的复用,避免了数据库连接频繁建立、关闭的开销。
连接池的工作原理主要由三部组成,分别为连接池的建立、连接池中连接的使用管理、连接池的关闭。
a、 连接池的建立
一般在系统初始化时,连接池会根据系统配置建立,并在池中创建了几个连接对象,以便使用时能从连接池中获取。连接池中的连接不能随意创建和关闭,这样避免了连接随意建立和关闭造成的系统开销。Java中提供了很多容器类可以方便的构建连接池,如:Vector、Stack
b、 连接池的管理
连接池管理策略是连接池机制的核心,连接池内连接的分配和释放对系统的性能有很大的影响。其管理策略如下:
当客户请求数据库连接时,首先查看连接池中是否有空闭连接,如果存在空闲连接,则将连接分配给客户使用;如果没有空闲连接,则查看当前所开的连接数是否已经达到最连接数,如果没有达到就重新创建一个连接给请求的客户;如果达到就按设定的最大等待时间进行等待,如果超出最大等待时间,则抛出异常给客户。 当客户释放数据库连接时,先判断该连接的引用次数是否超过了规定值,如果超过就从连接池中删除该连接,否则保留为其他客户服务。
c、 连接池的关闭 当应用程序退出时,关闭连接池中所有的连接,释放连接池相关的资源,该过程正好与创建相反。
14、 提升SQL语句的查询性能: 数据库设计与规划:
Primary Key字段的长度尽量小,能用small integer就不要用integer
字符字段如果长度固定,就不要用varchar、nvarchar类型
设计字段时,如果其值可有可无,最好给一个默认值,并设成“不允许NULL”
适当地创建索引:
a、 Primary Key字段可以自动创建索引,而Foreign Key字段不可
以。
b、 为经常被查询或排序的字段创建索引
c、 创建索引字段的长度不宜过长,不要用超过20个字符。 d、 不要为内容重复性高的字段创建索引 e、 不要为使用率低的字段建立索引
f、 不宜为过多字段建立索引,否则影响到insert update delete
语句的性能
g、 如果说数据表存放的数据很少,就不必刻意使用权索引。
使用索引功能:
在查询数据表时,使用索引查询可以极大提升查询速度,但是如果where子句书写不当。即使某些列存在索引,也不能使用该索引查询,而同样会使用全表扫描,这就造成了查询速度的降低。在where语句中避免使用以下关键词:NOT、!=、<>、!>、!<、Exists、In、Like、||。使用LIKE关键字做模糊查询时,即使已经为某个字段建立索引,但需要以常量字符开头才会使用到索引,如果以“%”开头则不会使用索引。例如“name Like ‘%To’”不启用name字段上的索引;而“name LIKE ‘TO %’”会启用name字段上的索引。 避免在where子句中对字段使用函数:
对字段使用函数,也等于对字段做运算或连接的动作,调用函数的次数与数据表的记录成正比。如果数据表内记录很多时,会严重影响查询性能。 在AND与OR的使用:
在AND运算中,只要有一个条件使用到索引,即可大幅提升查询速度。
但在OR运算中,则要所有的条件都有使用到索引才能提升查询速度,因此使用OR运算符时需要特别小心 JOIN与子查询:
相对于子查询,如果能使用JOIN完成的查询,一般建议使用后者。原因除了JOIN的语法较容易理解外,在多数的情况下,JOIN的性能也会比子查询高。 其他查询技巧:
DISTINCT、ORDER BY 语法,会让数据库做额外的计算。如果没有要过滤重复记录的需求,使用Union All会比Union更好,因为后者会加入类似DIStinct的算法。
尽可能使用存储过程(Store Procedure):
Store Procedure除了经过事先编译、性能较好以外,也可减少SQL语句在网络中的传递,方便商业逻辑的重复使用。 尽可能在数据源过滤数据
使用Select语法时,尽量先用SQL条件或Store Procedure过滤所要的信息,避免将大量冗余数据返回给程序,然后由程序处理。 15、 解决MySQL数据库插入乱码:
设置连接字符串编码:
在数据库连接字符串后面追加参数,指明MySQL服务器发送SQL语句的编码格式,格式如下:
jdbc:mysql://localhost:3306/test?useUnicode==true&characterEncoding=utf-8
设置数据表及其字段的编码:
将数据表的存储类型、表中字符字段的存储型都设置成与连接字符串一致的编码。依据上述连接字符串示例,数据表的存储编码应该设置成UTF-8
设置其他编码:
如果是从JSP页面取值,然后使用SQL写入数据库,那么还要保障从JSP页面取值正常。具体步骤: a、 在JSP页面中设置以下代码:
<%@page language=”java” pageEncoding =”utf-8” %>
<%@page contentType=”text/html;charset =utf-8” %>
b、 在使用request.getParameter()方法获取JSP页面值之前,设置
request.seCharacterEncoding(“UTF-8”);
Java常用功能
16、 过滤字符串前后以及中音出现的空格: 分为两种情况:
只需要过滤字符串前后的空格,而中间的空格不需要过滤 用String类中提供的trim()方法即可实现。
字符串的前后和中间可能出现的空格,都需要过滤
17、 String、StringBuffer、StringBuilder区别:
String类代表定长字符串,其内容在创建之后是不可更改的
StringBuffer类与String类相似,代表的是可变长的字符串缓冲区,通过