from sashelp.shoes
where sales>100000;
quit;
2.6.2 in:只要满足in里的任意一个值,表达式即为真,例如,我们要选择Region在Africa和Eastern Europe的所有数据:
proc sql;
select *
from sashelp.shoes
where Region in ('Africa','Eastern Europe');
quit;
2.6.3 逻辑运算符
OR | 或
AND & 是
NOT ^ 非
例如,选择Region在Africa和Eastern Europe,且销售额大于100000的所有数据:
proc sql;
select *
from sashelp.shoes
where Region in ('Africa','Eastern Europe') and sales>100000;
quit;
2.6.4 CONTAINS或?:判断某列是否包含指定字符串
例如,选择列Region包含’Afr’的数据:
proc sql;
select *
from sashelp.shoes
where Region ? 'Afr';
quit;
2.6.5 IS NULL或IS MISSING:判断某列数据是否为空
例如,如果找出Region为空的数据:
proc sql;
select *
from sashelp.shoes
where Region is missing;
quit;
注意,这里我们还可以用以下表达式对where语句进行替换。如果region为数值型变量,则可以用region=.,如果region为字符型变量,则可以用region= ‘’进行替换。
2.6.6 Between and:选择某一区间的数据
例如选择sales大于100000,但小于200000的所有数据:
proc sql;
select *
from sashelp.shoes
where sales between 100000 and 200000;
quit;
2.6.7 like:判断是否能匹配某些字符
例如,选择以region以A开头的所有地区
proc sql;
select *
from sashelp.shoes
where Region like 'A%';
quit;
这里注意有两类通配符,‘%’可以通配任意个任意字符,‘_’只能通配一个任意字符
2.6.8 =*:类似匹配
这里由于sashelp.shoes里没有符合要求的数据,所有就用书上的例子说明一下吧:
Where lastname=* ‘smith’,出来的结果可能是:smith,smythe等
2.7 表达式
我们可以通过已有的列进行计算来得到新的列,这时用关键词as来给新的列赋列名,例如:
proc sql;
select Region, Product,Sales,Stores,Sales/Stores as salesperstores
from sashelp.shoes
quit;
这时结果就会多一列salesperstores,用来得到该地区该产品每个商店的平均销售量。这里要注意的是,在创建表达式时,我们还可以在SQL里用到SAS中的除LAG和DIFF之外的所有函数。
这里我们还可以用表达式计算出来的结果来进行子集查询,但一定要记住用calculated关键词。例如我们要找出商店平均销售量大于5000的数据:
方法一:
proc sql;
select Region, Product,Sales,Stores,Sales/Stores as salesperstores
from sashelp.shoes
where Sales/Stores>5000;
quit;
方法二:
proc sql;
select Region, Product,Sales,Stores,Sales/Stores as salesperstores
from sashelp.shoes
where calculated salesperstores>5000;
quit;
2.8 查询结果展示
2.8.1 order by数据排序
默认的排序方式是升序,我们可以用DESC关键词来进行降序排列。例如以sales降序排列数据:
proc sql;
select *
from sashelp.shoes
order by Sales DESC;
quit;
这里提示一下,我们可以用任意多列进行排序,包括表达式结果(不用calculated),但最好是选择的列。
2.8.2 LABEL与FORMAT
LABEL:改变输出变量名的内容
FORMAT:改变列的值的输出方式
例如,改变salesperstores的label和format
proc sql;
select Region, Product,Sales,Stores,
Sales/Stores as salesperstores
label='sales per stores'
format=dollar12.2
from sashelp.shoes;
quit;
2.9 处理SQL常用函数
MEAN或AVG:均值
COUNT或N或FREQ:非缺失值个数