2.6 用好SAS Help的秘诀

很多SAS初学者抱怨SAS的帮助文档太复杂,难以读懂。其实,真正说起来,SAS Help文档才是这世界上学习SAS最好的教材,对比R软件包的Help文档,SAS的文档可以让我们感动到流泪。

→2.6.1 SAS Help知多少

SAS的帮助文档(SAS Help),窃以为,是市面上所有统计软件里做得最有诚意的作品。SAS Help是SAS公司投入大量的精力打造的体系最为完整,措辞最为规范,获得最为方便,知识最为权威的SAS教材。打开SAS Help的官方网站(http://support.sas.com/documentation/),如图2-16所示,我们可以感受下那份满满的诚意。

图2-16 SAS Help官网

我们以最新的9.4版本为例,官网上的Help文档都可以轻易获得,HTML或者PDF任挑(见图2-17),而且PDF文档的品质完全可以媲美精美的书籍(见图2-18),更重要的是,我们都可以免费下载。

图2-17 SAS 9.4官网帮助文档

图2-18 SAS ODS Graphics帮助文档PDF版

如果嫌弃HTML打开太麻烦,PDF也懒得去下载,那也没有关系。只要我们在本地安装了SAS,我们就可以随时在本地查看我们所购买的模块的帮助文档(见图2-19)。不过需要留意的是,只有购买、安装了某一模块,Help里才可以查到其相应的文档。

图2-19 SAS本地帮助文档

→2.6.2 看懂SAS Help的基本套路

SAS Help这么好的资源,通常被很多SAS教材给忽略了,他们绝口不提这档子事。当然也有一些SAS教材强调了多看帮助文档(SAS Help)在学SAS时的重要性,但往往另一问题又被忽略了:如何迈出第一步?怎样看懂SAS Help ?

SAS Help里会涉及一些元素和符号,还有一些特定的风格。了解其风格传统后我们再去阅读SAS Help,就会轻松很多。

比如我们看看以后我们将要用到的ODS画图过程PROC SGPLOT的Help,就会发现有大小写、有粗细、有斜体,还有<>,|,…等符号。所有这些,如何理解?

SAS Help的惯例体系,由四部分组成。

(1)语法成分:包括关键词和参数。关键词通常是语句的第一个单词或者头两个单词(如PROC语句、CALL列程语句),如SAS的过程名,语句名。参数是紧跟关键词后面或者等号后面的常量、变量或者表达式。

(2)风格惯例:SAS Help里有三种风格,大写粗体、大写以及小写斜体。具体可见图2-20。其中大写粗体用来标示过程、语句以及函数名称;大写用来标示参数为字符常量;小写斜体用来标示需要用户提供的参数或值。编程时,大写粗体、大写的文字必需原样照抄。

图2-20 PROC SGPLOT Help语法风格注释

(3)特殊字符:特殊字符包括<>、=、|、…、“ ”、;等。

● <>,可选用的参数或者选项。

● =,赋值语句。

● |,互斥参数或参数值,只能选择其一,不能同时选择。

● …,重复。

●“”,值必需放在引号中。

●;,语句结束。

(4)SAS库及外部文件的引用,libref以及fileref标示库和文件关联名,用SAS-libraryfi le-specifi cation标示外部文件。

→2.6.3 检索SAS Help的小技巧

如果希望通读SAS Help,最合适的方式应该是下载PDF文件来阅读和做标记。不过更多的使用场景是,对于某个过程或是某个语句,我们记不太清它的语法规则了,这时,我们希望快速查找到其语法参考手册。在EG和Studio中,有自动语法补全的提示,在DMS下,我们可以通过Help菜单下的SAS Help and Documentation启动SAS Help然后进行检索。

比如说,我们在导入数据时,对PROC IMPORT的语法比较模糊,在检索框里输入PROC IMPORT,就可以看到如图2-21所示的界面。

图2-21 检索SAS Help

有时候,很多模块里都包含了检索的内容,需要我们留意下每条检索结果蓝色大写字的下面一行字,这行字给出的是这个链接是属于哪个模块里的语法参考说明。一般对于PROC步,我个人喜好选择带「Overview:」的那个链接,里面从语法、概览到示例都有,且比较详细(见图2-22)。此外,在检索时,选择合适的检索词有一定的讲究:检索过程步可以用“PROC ×××”“××× Procedure”;检索语句时可以用“××× Statement”,当然也可以直接用“×××”检索(×××表示关键词)。

图2-22 S AS Help检索结果——语法、概览、示例

→2.6.4 熟悉SASHelp下的数据集

为了配合SAS Help文档,SASHelp逻辑库下自带了很多数据集,熟悉这些数据集,有助于我们利用它们做一些简单测试。例如,本书就用了其中的三个常用的数据集,关于其他更多数据库的信息,可以参考帮助文档SAS Help Datasets。

(1)class数据集,学生数据集,里面包括了姓名、性别、年龄、身高、体重等信息。

(2)cars数据集,2004年各大品牌汽车基本情况及其售价,包括了品牌、型号、车型、产地、驱动类型、售价、车身情况、速度等信息。

(3)heart数据集,弗莱明翰心脏研究队列数据,包括生存状态、性别、年龄、身高、体重、吸烟、饮酒以及血压血脂等信息。